ビッグデータで使われるNoSQLとセキュリティ課題:ビッグデータ利活用と問題解決のいま(1/3 ページ)
動画やソーシャルデータに代表される非構造化データが急増し、バッチ処理からリアルタイム処理へと進展する中で、NoSQL型のデータベースに注目が集まっている。企業のデータベース管理者はどのようなセキュリティリスクに注意したらよいのだろうか。
ビッグデータ利活用と問題解決のいまのバックナンバーはこちら
データ分析を支えるNoSQLとクラウドの技術
従来のリレーショナルデータベース(RDB)に対し、NoSQLはSQL構文を使わないノンリレーショナルデータベース管理システムの総称であり、一般的にデータモデル構造から、「キーバリュー型」「ドキュメント指向型」「カラム指向型」「グラフ型」の4つに大別できる。データモデルごとに特徴や製品例を整理すると下記のようになる。
データモデル | データベースの特徴 | 製品例 |
---|---|---|
キーバリュー型 | 「キー」と「バリュー」の組合せから構成されるシンプルなデータモデルで、データ容量の増加に応じて容易にスケールアウトすることが可能 | Amazon Dynamo、Hibari、Voldemort、Riak、Memcached、Redis、Scalaris、Tokyo Cabinet/Tyrant |
ドキュメント指向型 | データ記述書式(例.JSON、BSON、XMLなど)で記述されたドキュメントの形態によりデータを管理する仕組みを採用し、オープンソースで使い勝手がよいことから、Webサービスで広く利用されている | Apache CouchDB、MongoDB |
カラム指向型 | キーバリュー型をより高度にしたもので、行の方向と列の方向の双方に伸ばしていける | BigTable、Apache HBase、Hypertable、Apache Cassandra |
グラフ型 | ノード(関係性を保持する主体)、リレーションシップ(ノード間における関係の有無とその関係の方向)、プロパティ(ノードの属性とリレーションシップの属性)の3つを構成要素として、データ同士の複雑な関係をグラフ化する | Neo4j、InfiniteGraph |
以下の図1は、NoSQLデータベースの種類によるデータ容量と複雑性の関係を示している。同じNoSQLであっても、データモデルの種類によって容量や複雑性が異なっている。加えてNoSQL製品の多くはオープンソースで提供されており、日本国内向けの商用サポートや商用パッケージも発展途上期にある。
ソーシャルネットワーキングサービス(SNS)では、アクセスログや数値データに加えて、文章、画像、動画、ソーシャルグラフなど、膨大かつ複雑なデータを、クラウド環境上でリアルタイムに処理し、結果を返す必要がある。
そこで、データベースの機能をシンプル化し、RDBが本来持つ排他制御の仕組みを緩和させた上で、高速処理を実現するNoSQLならではの機能を活用する動きが広がっている。NoSQLを利用するSNS/インターネットサービス企業の中には、個々のノウハウをクラウド型の分析サービス(AaaS:Analytics as a Service)としてソリューション化し、企業のマーケティング部門や新規事業部門向けに外販するところが増えている。
Copyright © ITmedia, Inc. All Rights Reserved.