メディア

IoT×ビッグデータの基盤とセキュリティの仕組み：ビッグデータ利活用と問題解決のいま（2/4 ページ）

» 2015年06月30日 08時00分公開

　第2のパブリッククラウド上で展開される「Hadoopクラスタのセキュリティ」は、分散プログラミングフレームワーク自体にセキュアであることが求められる。例えば、Hadoop/MapReduceでは、図2に示す通り、入力ファイルから分割された複数のチャンク（かたまり）から、Mapperがデータを読み込んで一定の計算処理を行い、鍵／値のペアのリストを出力した上で、Reducerが個々の鍵に附属する値を結びつけて、結果を出力する仕組みになっている。

図2：Hadoop/MapReduceの仕組み。出典：CSA Big Data Working Group「Big Data Analytics for Security Intelligence」（2013年9月）

　特にビッグデータの観点から問題になるのは、Mapperへのセキュリティ脅威だ。以下のようなケースが想定される。


ケース	脅威
Workerノードの誤作動による計算処理	分散処理でMapperに割り当てられたWorkerノードが、不正確な構成や障害ノードによって誤作動を起こす可能性がある。また、Workerが修正されて、ユーザーの機密データが漏えいする可能性がある。
インフラストラクチャ攻撃	危険にさらされたWorkerノードは、他のWorkerと再生を目的とするMasterや中間者、MapReduceの処理に対するDoS攻撃との間の通信を傍受する可能性がある。
偽のデータノード	偽のデータノードがクラスタに追加された後、複製されたデータを受信したり、変更されたMapReduceコードを配布したりする可能性がある。

　このようなリスクへ対応するには、並列分散処理のプロセス全体におけるMapperの信頼性を保証したり、強制アクセス制御（MAC：Mandatory access control）を利用してセキュリティポリシーに基づく認証されたファイルへのアクセスを保証したりする必要がある。それ同時に、Mapper出力からの情報漏えいによるプライバシー／個人情報保護の違反を防止するためには、データを匿名化する技術の機能強化も求められる。

　ただし、MACやデータ匿名化技術の負荷によって計算処理のパフォーマンスが変動すると、現場のユーザーに影響が及んで混乱を招く可能性がある。運用管理には細心の注意が求められる。

モニタリングアプリケーションのセキュリティとは？