Amazon、Hadoop利用の大規模分散処理サービス「Elastic MapReduce」公開クラウド上で分散並列処理

ユーザーはS3に保管した大量のデータをEC2のコンピューティング能力を使って分散並列処理し、ログ解析や財務分析に活用できる。

» 2009年04月03日 08時10分 公開
[ITmedia]

 米Amazon.com傘下のAmazon Web Servicesは4月2日、大規模なデータの分散処理サービス「Amazon Elastic MapReduce」のパブリックβ版を公開した。同社のストレージサービスAmazon S3上の大量のデータを、仮想サーバサービスAmazon EC2でHadoopを利用して処理できる。

 HadoopはGoogleが自社の検索データ処理のために開発したアルゴリズムMapReduceをJavaで実装したオープンソースプラットフォーム。Amazon Elastic MapReduceはこのプラットフォームをクラウド上で稼働させ、ユーザーのデータを分散並列処理する。

 ユーザーはAmazon Elastic MapReduceを利用することにより、Webインデックス作成、データマイニング、ログ解析といった大量のデータを扱う処理を安価に、簡単に行うことができるという。

 Amazon Elastic MapReduceは現在は米国でのみの提供で、料金は時間単位の利用ベースでEC2、S3の料金に加算される。

Copyright © ITmedia, Inc. All Rights Reserved.