個人情報復元実験レポート
データ消去ソフトの必要性を実感していただくため、 Windows Vistaを搭載した新品のパソコンに約1600万人分の架空の名簿データを書きこみ、「ごみ箱に入れる」、「ごみ箱を空にする」、ハードディスクの「フォーマット」の操作を順に行った後、市販のデータ復元ソフトでどの程度のデータを復元できるかを実験してみました。以下に、この実験の具体的な手順や詳細をレポートします。
- 実験に使用したパソコン
- Panasonic Let's note CF-R7
2008年6月購入
Windows Vista Business SP1
Intel Core 2 Duo U7600(1.2GHz)
メモリ2GB(増設済み)
HDD120GB(SATA)
実験用に4.88GBのNTFSパーティションを作ってフォーマットし、E:ボリューム(E:ドライブ)とした。 - 実験に使用したデータ復元ソフト
- 株式会社ジャングル「完全データ復元PRO2008」
1. 架空の名簿データを準備する。
データ復元の実験に使う個人情報として、以下の表のような架空名簿データを準備しました。名簿データのファイル形式としては、テキストファイル(*.txt)、 Wordファイル(*.doc)、 Excelファイル(*.xls) の3種類がありますが、 WordファイルとExcelファイルは、テキストファイルの一部を変換して生成したものであり、記載されている名簿の内容はテキストファイルと同じです。名簿データには、個人番号、氏名(漢字)、氏名(よみ)、性別、生年月日、郵便番号、住所が含まれており、名簿1名あたりのデータ量は、テキストファイルの場合で約100バイトです ( 500名分の名簿データのサンプル x3007.txt ) 。
テキストファイル | Excel ファイル | Word ファイル | |
---|---|---|---|
5名分の 名簿データ |
x1001.txt ~ x1010.txt y1001.txt ~ y1010.txt z1001.txt ~ z1010.txt |
x1001.xls ~ x1010.xls y1001.xls ~ y1010.xls z1001.xls ~ z1010.xls |
x1001.doc ~ x1010.doc |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
50名分の 名簿データ |
x2001.txt ~ x2010.txt y2001.txt ~ y2010.txt z2001.txt ~ z2010.txt |
x2001.xls ~ x2010.xls y2001.xls ~ y2010.xls z2001.xls ~ z2010.xls |
x2001.doc ~ x2010.doc |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
500名分の 名簿データ |
x3001.txt ~ x3010.txt y3001.txt ~ y3010.txt z3001.txt ~ z3010.txt |
x3001.xls ~ x3010.xls y3001.xls ~ y3010.xls z3001.xls ~ z3010.xls |
x3001.doc ~ x3010.doc |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
5,000名分の 名簿データ |
x4001.txt ~ x4010.txt y4001.txt ~ y4010.txt z4001.txt ~ z4010.txt |
x4001.xls ~ x4010.xls y4001.xls ~ y4010.xls z4001.xls ~ z4010.xls |
x4001.doc ~ x4010.doc |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
50,000名分の 名簿データ |
x5001.txt ~ x5010.txt y5001.txt ~ y5010.txt z5001.txt ~ z5010.txt |
x5001.xls ~ x5010.xls y5001.xls ~ y5010.xls z5001.xls ~ z5010.xls |
x5001.doc ~ x5010.doc |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
500,000名分の 名簿データ |
x6001.txt ~ x6010.txt y6001.txt ~ y6010.txt z6001.txt ~ z6010.txt |
なし | なし |
計 30 ファイル | 計 30 ファイル | 計 10 ファイル | |
名簿データの合計 | 16,666,650名分 | 1,666,650名分 | 555,550名分 |
図7:名簿データの内容 ( テキストファイルの例 )
2. 名簿データをハードディスクにコピーする。
約1600万人分の個人情報を含む名簿データのファイル380個を、 E:ドライブ内の「会員名簿」のフォルダにコピーします。
3. 名簿データをごみ箱に入れる。
名簿データを含むフォルダに対して「ごみ箱に入れる」の操作を行い、見かけ上の削除を行います。削除されたデータは、一般には「ごみ箱」の中に残っていますが、今回の名簿データのうち全部で約1600万人分の個人情報を含むテキストファイル(*.txt)のデータについては、サイズが大きすぎるため、ごみ箱に入らないという警告が出ます。
図8:txt フォルダは大きすぎるので警告が出る
4. ごみ箱を空にする
「ごみ箱を空にする」の操作を行い、ごみ箱に残っていたWordファイル(*.doc)、Excelファイル(*.xls)の名簿データを本当に削除します。この中には、合わせて約220万人分の個人情報が含まれていましたが、この操作により、ファイルとしては見えなくなります。
5. ディスクをフォーマットする。
さらに、Windows Vistaの機能によりE:ボリュームをフォーマットします。通常フォーマットは時間がかかるので、クイックフォーマットを選択します。これにて、先ほどの約1600万人分の個人情報は完全に削除されたはずです。
図9:E:ドライブをクイックフォーマットする
6. データ復元ソフトを起動する。
あらかじめインストールしておいたデータ復元ソフトを起動します。なお、今回の実験では復元対象となるファイルが別ドライブ上ですので、システムディスク内にインストールされているOSや復元ソフトの動作が、データ復元に悪影響を与えることはありません。もし、OSを含むシステムディスクがデータ復元対象となっていた場合には、 CDから起動した復元ソフトを使用する必要があります。
図10:データ復元ソフトの起動
7. 復元対象のディスクをスキャンする
復元ソフトがディスク上に残されたデータの本体を探して、名簿データの復元を試みます。
図11:Office Fileの検索進行中
8. 復元ソフトにより名簿データが復元される
ファイル名、名簿データ本体とも完全に復元できたもの、名簿データ本体は完全に復元できたがファイル名が不明のままのもの、名簿データの一部が欠落したものなど、復元の程度はいろいろありますが、多くの個人情報が復元されました。
図12:Excelファイル x4003.xls が復元された
図13:ファイル名は不明だが、Excel形式の多くの名簿ファイルが復元された
図14:Word形式の多くの名簿ファイルが復元され、x4001.doc の名簿がそっくり残っていた
9. 名簿データを含むフォルダ全体も復元される。
同様に復元作業を進めて、他のフォルダも調べてみたところ、削除したはずのtxtフォルダと、その下の多くのファイルが丸ごと残っているのが見つかりました。
図15:多くのtxtファイルを含むフォルダが復元された
図16:多くのtxtファイルを含むフォルダが復元された
10. 復元された個人情報を集計
今回の実験における環境や状況では、テキストファイル(*.txt)のうち、5万人までの名簿データを含むファイルはほぼ完全に復元できました。この範囲の名簿データの復元状況を以下の表に示します。約160万人分の名簿データのうち、復元できなかったのは55人分のみでした。
100%復元できたもの | 100%復元できなかったもの (カッコ内は復元できなかった人数) | |
---|---|---|
5名分の 名簿データ (全30ファイル) |
x1009, x1010 y1001.txt ~ y1010.txt z1001.txt ~ z1010.txt |
x1001.txt (5名), x1002.txt (5名) x1003.txt (5名), x1004.txt (5名) x1005.txt (5名), x1006.txt (5名) x1007.txt (5名), x1008.txt (5名) |
22ファイル | 8 ファイル (40名) | |
50名分の 名簿データ (全30ファイル) |
x2001.txt ~ x2010.txt y2001.txt ~ y2010.txt z2001.txt ~ z2010.txt | なし (0名) |
30ファイル | 0 ファイル (0名) | |
500名分の 名簿データ (全30ファイル中) |
x3001.txt ~ x3004.txt x3006.txt ~ x3010.txt y3001.txt ~ y3010.txt z3001.txt ~ z3010.txt |
x3005.txt (1名) |
29ファイル | 1 ファイル (1名) | |
5,000名分の 名簿データ (全30ファイル) |
x4001.txt ~ x4010.txt y4002.txt ~ y4010.txt z4001.txt ~ z4005.txt z4007.txt ~ z4010.txt |
y4001.txt (1名), x4006.txt (1名) |
28ファイル | 2 ファイル (2名) | |
50,000名分の 名簿データ (全30ファイル) |
x5001.txt ~ x5007.txt x5009.txt, x5010.txt y5001.txt ~ 5005.txt y5008.txt, y5009.txt z5001.txt, z5002.txt z5004.txt ~ z5010.txt |
x5001.txt (1名), x5003.txt (1名) x5004.txt (2名), x5005.txt (1名) x5006.txt (2名), x5008.txt (1名) y5006.txt (1名), y5007.txt (1名) y5010.txt (1名), z5003.txt (1名) |
20ファイル | 10 ファイル (12名) | |
名簿データの合計 | 1,666,595名 | 55名 |
注意 : この数字は、状況により大きく変化するはずです。あくまでも一つの参考例であり、普遍性のあるデータではありませんので、ご承知おきください。
一方、50万人の名簿データを含む47MB程度のファイルについては、いずれも最初の約15万人分の名簿データ (ファイルサイズとして約15MB程度)のみが復元され、それ以降は復元されませんでした。これは、データ復元ソフトの使い方や性質によるものと思われます。データ復元ソフトの操作やオプション設定によっては、このくらい大きなファイルでも、うまく復元できる方法があるのかもしれません。
この実験では、5万人(ファイルサイズとして5MB程度)までの名簿データに対して、 99.99%以上という極めて高い復元率を確認できましたが、これは、名簿データの削除とフォーマットを行った直後にデータの復元を試みたためです。削除やフォーマットの後に、このドライブ(E:ボリューム)内でファイルの書き込み等を行うと、データの復元率は少しずつ下がってくるはずです。とはいえ、この実験と同じ条件で、わずか10%のデータが復元されただけでも、 16万人分の個人情報が漏洩、流失する結果となります。やはりデータ消去は必須です。
- Home
- ディスクシュレッダー再入門