http://digital.asahi.com/articles/DA3S11856852.html
(2015年7月14日05時00分)
日本年金機構がまたへまをやらかしたという記事です。
以下に一部を引用します。
個人情報は約101万人分が流出した。【中略】
ところが、情報が流出した該当者の基礎年金番号を準備する段階で、リスト漏れが約5万4千件、違う番号を入れたケースが約4万6千件あったという。
オーツは、この記事を読んで、おかしいと思いました。101万人分のデータ流出があったという場合、そのリストを手入力するなんてバカなことがあるわけありません。
当然、適宜プログラムを組んで流出件数を数えたのでしょう。(あるいは、ファイル中のデータ件数をそのまま使っているのかもしれませんが。)
101万人ものデータであれば、リストづくりもプログラムで行ったに違いありません。であれば、リスト漏れが5万4千件あったということが信じがたい事態です。最終的にリストの件数を数えれば、101万件でないことがわかり、その時点でプログラムが間違っていることがわかったはずです。だいたい、そういうプログラムでは、処理件数を数えて、実行の最終段階で「○件処理しました」とかいうメッセージを出すようにするのが常識というものです。
次に、違う番号を入れたケースというのも理解できません。こちらも、まさか、手入力で番号を入れたわけはないと思います。ということはこちらもプログラムのミスでしょう。この場合も、プログラムを実行した後、手作業で一部のデータを付き合わせて抜け落ちがないかどうかを確認すれば、エラーがわかるはずです。
違う番号を入れたケースが4万6千件あったことをどうやって確認したのでしょうか。プログラムを組んで走らせたのなら、それと同様の処理を最初の段階で行っておけば、エラーはたやすく発見できたはずです。
だいたい、プログラムで処理するような場合、全部正しく処理するか、全部間違った処理をするかが普通であって、だいたいのデータがうまく処理できて、5%ほどのデータで全然違う番号をコピーしてしまったなどということ自体が信じがたいのです。どうやったら、そんなプログラムが作れるのでしょうか。
仮に、手入力していたとしたら(そんなことはしないと思いますが)、5%の間違いというのは、とんでもなく高いエラー率です。普通は、1%か、それよりさらに低いと思います。二人が同じデータを入力して、その後に突き合わせて確認することにすれば、エラー率は、きわめて小さい値になるものです。
朝日新聞の記者も、技術的なことをまったく知らずに取材していたのかもしれませんが、このような日本年金機構の説明で納得してしまうようなことではダメです。もっと突っ込んで取材をし、その上で(記者自身も納得して)記事を書くべきです。こういう記事が出てしまったことで、朝日新聞の記者(さらにはデスクや校閲部など)の質の問題が浮かび上がってしまったように思います。
今回のトラブルの本当の原因を追及することで、今後、そのようなトラブルを起こさないためのノウハウが蓄積されるものです。
オーツは、日本年金機構のいい加減さに腹が立つと同時に、朝日新聞にも腹が立ちました。

