ユーザーはS3に保管した大量のデータをEC2のコンピューティング能力を使って分散並列処理し、ログ解析や財務分析に活用できる。
米Amazon.com傘下のAmazon Web Servicesは4月2日、大規模なデータの分散処理サービス「Amazon Elastic MapReduce」のパブリックβ版を公開した。同社のストレージサービスAmazon S3上の大量のデータを、仮想サーバサービスAmazon EC2でHadoopを利用して処理できる。
HadoopはGoogleが自社の検索データ処理のために開発したアルゴリズムMapReduceをJavaで実装したオープンソースプラットフォーム。Amazon Elastic MapReduceはこのプラットフォームをクラウド上で稼働させ、ユーザーのデータを分散並列処理する。
ユーザーはAmazon Elastic MapReduceを利用することにより、Webインデックス作成、データマイニング、ログ解析といった大量のデータを扱う処理を安価に、簡単に行うことができるという。
Amazon Elastic MapReduceは現在は米国でのみの提供で、料金は時間単位の利用ベースでEC2、S3の料金に加算される。
Copyright © ITmedia, Inc. All Rights Reserved.