メディア

クラウドのデータサービスを掘り下げる：丸山先生レクチャーシリーズ第3回リポート

分散データベースの重要性を説いてきた本年度の「丸山先生レクチャーシリーズ」。第3回のレクチャーでは、「クラウド上のデータサービス」がテーマに据えられ、BigTable、SimpleDB、Azure SDSなどのクラウド向けデータサービスについて解説が行われた。

» 2009年01月26日 08時00分公開

[渡邉利和，ITmedia]

　本年度の「丸山先生レクチャーシリーズ」では、第1回から一貫して分散データベースの重要性が指摘されつつも後回しとなっていたのだが、第3回のレクチャーでついに「クラウド上のデータサービス」がテーマに据えられ、クラウド上のデータサービスについて、その最前線の技術を解説した。

データベースをクラウド上に展開するには

　丸山先生レクチャーシリーズ第3回は、1月13日に日本IBM箱崎事業所で開催された。今回のテーマは「クラウド上のデータサービスの利用をめぐって」であり、過去2回のレクチャーでも折りに触れて言及されていたクラウド上のデータサービスをメインに据えた講演が行なわれた。

　最初に行なわれた丸山不二夫氏による講演は「Cloud上の分散データベース―BigTable、SimpleDB、Azure SDS―」と題するもので、既に実用に供されているクラウド上のデータサービスを中心に取り上げ、その出現の背景と発展のいきさつを整理するものだった。

　同氏はまず、クラウドにおけるデータサービスが直面する課題として、「ネットワーク上の情報量の爆発的な増大」と「スケーラビリティとアベイラビリティが相反する」ことを挙げた。また、インターネット上で提供されるさまざまなサービスが利用するデータベース機能では「分散メモリキャッシュ」が活用されるようになってきていることを挙げ、「データ保持やデータ操作の主な舞台は従来のファイルからメモリに移行しつつある。従来型のデータベースのインデックスの置き場所も、ファイルからメモリへといった見直しを迫られるのでは」と話す。

　次に同氏は、こうした状況を背景として登場したクラウドサービスで利用されている分散データベースの実装の発展過程について、「Google BigTable、SimpleDB、Amazon Dynamo、Microsoft SDS」という順序で世代分けできるのでは、という見解を示し、さらに「Amazon Dynamoが転換点で、MicrosoftのWindows Azureのデータサービス（SDS）はDynamoのアーキテクチャを引き継ぐ形で登場した」と位置付ける。

　なお、別の講演ではAmazonのSimpleDBとDynamoを同一視する見方も示されていた。いずれもクラウドサービスの内部で利用されているデータサービスであり、その詳細が明らかになっていない部分も多いため、情報が錯綜している現状が伺えて興味深いところだ。

クラウド上のさまざまな分散データサービス

　次いで丸山氏は、さまざまなクラウド向けデータサービスを取り上げ、その特徴や設計思想について紹介した。

　まず俎上（そじょう）に上がったのがGoogleのBigTableだ。Googleが持つ“大きすぎる規模のデータ”の量と、Googleが提供するサービスの性格上、“半構造化データでよい”という割り切りがあった上での実装ではないかと同氏は話す。また、BigTableの実装上の特徴としては、「書き込みはすべてメモリにたいして行なわれる」「書き出しに特化した設計、アペンド中心のオペレーション」「読み出しはファイルから行なわれ、書き出しと読み込みが非対称に設計されている」といった点が挙げられた。

　次に紹介されたのはAmazonのSimpleDB。こちらは“表”型のデータモデルを採用するKey／Value型のデータベースとなる。また、SimpleDBはRESTベースの他言語サポートを提供するが、そのRESTは昔の古いスタイルだという指摘もあった。データベースの検索に関しては明示的な文字列比較のみがサポートされていたが、現在はSQLに馴れた開発者のためにSELECT文がサポートされるなど、エンタープライズ用途を意識した変更も行なわれているという。

　同氏による評価は、「BigTableもSimpleDBも、エンタープライズユーザーがそのまま使うには不便な部分がある」というものだが、両者の比較では「BigTableではRESTも活用されていない」とのことで、SimpleDBの方が新しい世代に属すると位置づけられているようだ。

　一方、Amazon Dynamoは、“Dynamo: Amazon's New Key-Value Data Store”という論文で紹介されたものだが、具体的な実装があるのかどうかも含め、詳細はよく分かっていない、ということになるようだ。丸山氏はクラウドデータベースをおおよそ3世代に分類しているようで、「BigTableとAzureをつなぐ要となるのがSimple DBとDynamo」としている。

　最後に、MicrosoftのWindows AzureのデータサービスであるSDS（SQL Data Service）についても、そのスケーラビリティのためのスケールアウトへの対応手法やアベイラビリティへの配慮の様子などが紹介された。

　まとめとして丸山氏は“データベースのWeb-Scaleへの大容量化”“データベースへのScale-outの手法の導入”といった状況を受けて「分散メモリキャッシュの活用」や「リレーショナルからKey／Value型へ」といった変化が生じているとした。同氏はまた、「データベースをみるとCloudの進化がよく分かる」と語っており、クラウドの技術的な進歩を確認する際には、データサービスに注目すればよいと示唆した。

本講演にかんするファイル

講演資料（PDF）

エンタープライズITの現状とクラウドへの期待
丸レクセミナー第2回に登壇した日本IBMの執行役員・ソフトウェア開発研究所長の岩野和生氏。IBMが考えるクラウドと、それがエンタープライズITにもたらすものとは何か。
Google App EngineによるWebアプリケーションのスケールアップ
丸山先生レクチャーシリーズ 2008-2009 第2回に登壇したグーグルの石原直樹氏と本多正明氏は、Googleが考えるクラウドのキー、Google App Engineについて講演を行った。
“Windows Azure”はこう読み解け
先月開催された「丸山先生レクチャーシリーズ2008-2009」第2回では、エンタープライズITでクラウドをどう活用していくか、という課題についてさまざまな切り口からの講演が行なわれた。ここでは、丸山氏の講演内容を簡単にまとめた。
クラウドとグリッドの“微妙な”関係
クラウドとグリッドの境界が分からない方もいるかもしれない。あるいは、クラウドとグリッドはまったくの別物と考える方もいるだろう。クラウドの出現をグリッドとの関連の中に位置付け直すよい機会を富士通／国立情報学研究所OGFボードメンバ、OGSA-WG共同議長の岸本光弘氏が与えてくれた。
クラウドサービス提供ベンダーの視点からみたクラウドの現状
「クラウド時代の到来を受けて、クラウドとどう向き合うべきか」――クラウド専業のベンダーとしてアプリケーションレイヤで存在感を放つセールスフォース・ドットコムの岡本充洋氏は、開発者にむけた行動指針を示した。
クラウド時代の到来とはどういうことなのか
クラウド時代が到来しようとしている。しかし、それは一体何を意味するのだろうか。本年度の「丸山先生レクチャーシリーズ」を貫くこの大きな問題を、丸山不二夫氏がITの歴史的発展の流れの中に位置付けて読み解いた。
丸山不二夫が語る「クラウド時代にわたしたちがすべきこと」
クラウドコンピューティングがようやく普及期に入ろうとしている。これまでエンタープライズシステムを長く見続けてきた丸山不二夫氏が、自身が開講する「丸レクセミナー」のメインテーマにクラウドを据えた。ビジネスマンがこぞって注目する丸山氏にクラウドについて聞いた。
グリッド技術の普及に向け2つの団体が統合へ
グリッドコンピューティングの普及と標準化を目指すEGAとOGFという2つの団体が統合する。
「プライベート」クラウドコンピューティングが人気上昇中
「プライベート」クラウドコンピューティングは、ファイアウォールの内側に置かれた小規模なクラウド型ITシステムを通じてサービスを提供するものだ。メインストリームバージョンと異なるのは、内輪のネットワークで完結するという点だ。
クラウド向けデータベースの選択肢
クラウドコンピューティングはリレーショナルデータベース管理システム（RDBMS）モデルを崩壊寸前に追い込んでいる――クラウドコンピューティング専門家のガイアー・マグナッソン氏はこう指摘する。