“匿名”データからでも、個人が特定されてしまう理由:「日常」の裏に潜むビッグデータ(3)(2/3 ページ)
ビジネスに生かせるビッグデータとして、個人の行動や状態に関する情報、いわゆる「パーソナルデータ」に注目が集まっている。適切に使えば大きなメリットを生む半面、複数のデータを組み合わせれば、名前を伏せていても、個人が特定されるリスクもあるという。
匿名のデータでも個人を特定できる?
パーソナルデータの価値について、人々が知るきっかけとなった大きな事件がある。2013年7月に発覚した、Suica利用履歴データの売買問題だ。
JR東日本が日立製作所にSuicaの利用履歴データを販売していたことに対し「個人情報を無断で販売した」「気持ち悪い」とWeb上でネガティブな反応が噴出した。その後、情報の削除を求める「オプトアウト申請」が殺到し、最終的にはデータの販売を断念している。
同社は利用客のSuica利用履歴から氏名などを削除し、さらにSuicaの固有IDとは異なるIDを振り直してデータを提供していた。個人情報保護法では「生存する個人の生年月日や特定の個人を識別できるデータ」が保護対象であることから、JR東日本と日立製作所は、個人を特定できないよう加工したデータは、法規制の対象外だと解釈していたという(参考記事)。
JR東日本が販売していたデータは、「No.0001:28歳の女性、7月7日10時10分にA駅で乗車、7月7日11時10分にB駅で下車、7月8日8時0分にC駅で乗車……」というように乗車履歴と年齢、性別を組み合わせたものだ。確かにこのデータ単体では個人は特定できない。
しかし実際には、平日のほぼ同時刻に「A駅のB改札からC駅のD改札を通った」というデータに、構内のコンビニで何を買ったかというようなデータが加われば、ある程度個人を特定できるレベルに達することが分かっている。
こうした匿名のパーソナルデータを扱うのはSuicaだけではない。例えばおサイフケータイ。これはパーソナルデータとダイレクトにリンクしており、どこで利用したかという履歴だけで行動を追いかけることができるため、個人を特定できる確率は高い。
データを収集されるユーザーに、ほぼ“拒否権”はない
通常、パーソナルデータを取得するかどうかはサービスを提供する側から事前に告知され、拒否することもできるのだが、拒否すると多くのサービスは使えないのが実情だ。例えば、地図アプリでは位置情報を提供しなければ現在地が確認できないし、Webブラウザの履歴を提供しなければ検索の精度を上げたり、商品のオススメはしてもらえない。
そもそも、多くのサービスは規約に同意しなければ利用できず、その規約に情報取得の項目が入っている。そのため、ユーザーがデータを提供しないという選択肢は“実質的にない”といっても過言ではない。特に会員登録が必要なサービスやアプリは、ほぼパーソナルデータが利用できるような利用規約になっている。利用画面の中に「34歳年収アップの転職」というようなターゲティング広告(利用者の情報に合わせた広告)が表示されるならば、100%間違いない。
Facebookでは専用のデータ分析チームを抱えており(参照リンク)、収集したパーソナルデータを同社が提供するターゲティング広告をはじめ、ワールドカップ観戦にFacebookがどう使われているかや、母の日に合わせてママユーザーがどれだけいるかといった情報を公開している。
データを“匿名化して分析している”と明示していることもあり、公開されたデータは概ね好意的に受け取られていた。しかし、ニュースフィードに表示する内容を操作し、それに対するユーザーの反応を調べる心理実験を秘密裏に行っていたことが、2014年7月に発表された論文で判明。論文を執筆したFacebookのデータサイエンティストが謝罪したものの(参考記事)、今までと一転、データの取り扱いに対する不信感が広がった。
また、Googleも2014年に入ってから、パーソナルデータの取り扱いに対してスタンスが変わっている。
関連記事
- 特集:ビジネスにどう生かす? ビッグデータ入門
高速道路の渋滞緩和も、コンビニの人気商品開発も……IT用語の枠を超え、いまや一般的なビジネスキーワードとなった「ビッグデータ」。本特集では、ビッグデータの基礎知識からスタートし、ビジネスや生活シーンでどのように活用されているのかを紹介していきます。 - 生活は便利に、でもプライバシーは“丸裸”? ビッグデータ活用の光と影
ビッグデータを分析し、ビジネスに役立つ新たな“気付き”や“予測”を見つけるために各企業が動いている。そうした分析は、私たちの生活を便利にしてくれる一方で、人が気づけないプライベートな事情すら丸裸にしてしまう可能性も秘めている。 - データが価値を持つ時代に、“タダ”のサービスなど存在しない
ビッグデータという言葉はビジネス用語として定着しているが、これからはあなたの日常生活の中にも入り込んでくる可能性が高い。あなたが何気なく使っている無料のサービスも、知らないうちに“対価”を支払っていた、というケースが増えてくるだろう。 - 今、ビッグデータが注目される3つの理由
ビッグデータという言葉の定義は分かったが、どうしてこんなに注目されているのかイマイチ分からない。その理由をNRIの鈴木氏に解説してもらった。 - そもそも、ビッグデータって何なの?
ビジネスの現場に溢れかえる「ビッグデータ」という言葉。何となくは分かっているけれども、具体的に説明するのは苦労する。というのも、ビッグデータという概念自体があいまいなものだからだ。なぜビッグデータには明確な定義がないのだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.