ITmedia NEWS > ネットの話題 >

「個人情報」の意味、知ってますか? Tカード、Suica、マイナンバーで考える「個人情報の危うさ」ITりてらしぃのすゝめ(1/2 ページ)

» 2018年01月31日 12時55分 公開
[宮田健ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

 先日、とあるニュースを見て驚きました。そのニュースは「個人情報」に関するもので、あまり詳しくない私が見ても危うさを感じるものでした。この危うさはすぐにピンと来る人もいれば、なぜそこまで恐れるのか分からないと公言する人もいます。そこで今回は、基礎知識として知っておくべき「個人情報の危うさ」に触れたいと思います。

連載:ITりてらしぃのすゝめ

「身近な話題を例にITリテラシーを高めていこう」がコンセプト。さらっと読めて人に話せる、すぐに身につく。分かりやすさ重視で解説。小ネタも扱います。


最初のはなし:“マイナンバー”って個人情報なの?

 まず入り口は、皆さんもそれぞれに割り当てられている12桁の数字「マイナンバー」です。この数字、正確には個人番号と呼びますが、これは「個人情報」として取り扱われることが決められています。

 こう聞くと、単なる文字の羅列に、私たちの本名や住所などが入っているか疑問に思う方も多いでしょう。もちろん、個人番号も数字自体にそのような情報は含まれていません。よく出てくる言葉である「個人情報」とは氏名、住所、生年月日などだけを指すわけではありません。

マイナンバー 左から通知カードとマイナンバーカード(マイナンバーカード総合サイト

 あくまで「個人を識別できる属性情報」全てが、個人情報とされています。特にマイナンバーでは、個人番号を含む個人情報を「特定個人情報」と定義しており、番号法において厳重な管理が求められています。

 では、この個人番号はなぜそこまで重要なのでしょうか。そこには本名も住所もないので、この番号自体が情報漏えいの被害に遭ったとしても、さほど問題はないように思えます。しかし、これは国が定めた番号で、税、社会保障、災害対策に使われます。さらに金融、保険業界でもこの番号を利用しています。ポイントはそれらの情報が、この個人番号によって「完璧な名寄せができる」ことです。

 個人番号12桁そのものには情報がなかったとしても、その番号を利用することにより、複数の業界の複数のデータがひも付け可能になります。名寄せ力が非常に高い情報ですので、取り扱いは慎重に行うべく、番号法で管理が行われているのです。

2つ目のはなし:Suicaの情報、第三者利用はなぜ問題?

 2つ目の話に行きましょう。恐らく皆さんも、通勤時に交通系ICカードを利用しているのではないかと思います。その最大手はJR東日本の「Suica」。私自身もiPhoneのSuicaを利用していて、履歴も確認できる大変便利なソリューションだと思っています。もはや関東圏では必需品ともいえるでしょう。

スイカ 交通系ICカード「Suica」

 そのSuicaに関して、ちょっとした事件があったことを覚えていますでしょうか。2013年6月、日立がJR東日本のSuicaの乗降データ提供を受け、ビッグデータで分析するというサービスを発表しました。

JR東日本から個人情報を含まない形でSuica履歴情報の提供を受けて分析。JR東日本と私鉄各線の首都圏1800駅を対象に、駅の利用者の性別・年代別構成や利用目的、乗降時間帯などを平日・休日別に可視化したリポートを毎月定期的に提供する

 ところがこのサービスは、一部の利用者から大きな反発を受けることになります。日立が提供を受けるデータには「年代」「性別」を含む「乗降データ」が含まれていました。「氏名」「連絡先電話番号」などは含まれていないために、当初JR東日本は「個人情報に当たらない」と判断していましたが、結果としてこの履歴販売は中止となりました。

JR東日本 JR東日本から日立へのデータの流れを見ると、氏名や電話番号を削除し、Suica IDを変換するなどの処理を行っていたのだが……(JR東日本「Suica に関するデータの社外への提供について 中間とりまとめ」より)

 JR東日本はデータ提供を中止した後、第三者機関による有識者会議を設置、問題を整理したレポートを発表しました。この図を見ると、氏名や電話番号を削除、生年月日も月までに丸め、かつカードを特定する「Suica ID番号」も変換し、元の番号に戻せないようにしてからデータを渡していることが分かります。しかし、これでも私は「気持ち悪い」という感覚が拭えません。

 このように「氏名」「電話番号」がなかったとしても、そこに残るのは私たちSuica利用者の「移動情報」という、他では取得し得ない情報です。例えば目に付いた「Suica IDを変換した番号」をピックアップしてみましょう。

 ある平日で「今日最初に利用した駅」を見れば、それが自宅の最寄り駅だということが分かります。そして最終的に、午前8時台にどこかの駅で降りたとしたら、それは恐らく職場の最寄り駅でしょう。その逆に、夜に乗った駅の時刻を見れば、その勤務先が大体何時くらいまで人がいるのかも分かります。この時点で「名前は分からないけれど、月〜金で特定の通勤経路を使っている人」という所まで絞れるでしょう。人のライフスタイルを考えれば、移動情報からその利用者がどこを拠点としているかがすぐに分かってしまいます。

 もしそれが、あまり多くの人が使っていない通勤経路だったとしたら、そこから個人を容易に特定できます。その方法は例えば「SNSに書かれた情報を探す」などが考えられるでしょう。JR東日本の提供したデータだけでは、確かに氏名などの個人を識別する情報は含まれていないかもしれません。

 しかし今では、他の情報もあふれています。それをもし「名寄せ」できてしまったとしたら、一瞬でこれらの情報が「プライバシー情報の宝の山」に変化してしまうリスクがあるのです。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.