リクルートがEMCのHadoopプラットフォームを導入

「ビッグデータ」への対応に向けて、リクルートは大量データの分散処理を実現するHadoopプラットフォームを採用した。

» 2011年09月26日 15時33分 公開
[ITmedia]

 リクルートは大規模データの分散処理を強化すべく新システムを採用した。システムを提供したEMCジャパンが9月26日に発表した。

 リクルートが導入したのは、非構造型の大量データを高速に分析処理するHadoopプラットフォーム「EMC Greenplum HD Enterprise Edition(Greenplum HD EE)」。同製品は、大規模データの分散処理を支えるオープンソースのJavaソフトウェアフレームワーク「Apache Hadoop」とAPIの互換性を保ちつつ、内部実装をアーキテクチャレベルで再設計、再構築し、ハードウェアの能力を最大限引き出すほか、NFS(UNIXシステムで利用されるファイル共有システム)アクセスやボリューム単位での権限・運用ポリシー設定、スナップショット、遠隔ミラー、管理Webインタフェースなどの運用機能を実装する。

 リクルートは、2010年夏ごろからHadoopを各部門に取り入れて評価作業を進めてきた。2011年初頭よりHadoopの使用を開始し、さらなる機能強化やTCO削減を求め、2011年8月からGreenplum HD EEの検証を実施。性能面などを評価し採用に至った。

関連キーワード

Apache Hadoop | Big Data


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ