連載
» 2012年02月16日 12時00分 公開

情報爆発時代、いかに大量データを収益につなげるかレポート ビッグデータセミナー(2/2 ページ)

[唐沢正和,@IT]
前のページへ 1|2       

ビッグデータ時代に即応するための情報分析プラットフォームとは

 3番目のセッションでは、まず、日立アイ・エヌ・エス・ソフトウェア パッケージソリューション事業本部 パッケージソリューション部 部長代理の高橋誠氏が、大量データを短時間/リアルタイムに処理するために、日立グループが取り組んでいる新技術と製品の概要を紹介した。

日立アイ・エヌ・エス・ソフトウェア パッケージソリューション事業本部 パッケージソリューション部 部長代理の高橋誠氏 日立アイ・エヌ・エス・ソフトウェア
パッケージソリューション事業本部 パッケージソリューション部 部長代理の高橋誠氏

 大量データ処理のニーズに対応するソリューションとして、同社では、(1)Hadoop、(2)グリッドバッチ(uCosminexus Grid Processing Server)、(3)ストリーム(uCosminexus Stream Data Platform)という3つの新しいソフトウェア技術を展開しているという。

 「Hadoopは高速な並列分析処理が可能で、大量データを扱うシステムの開発を容易にする。グリッドバッチはデータを分割配置し、バッチ処理の並列実行によりバッチ業務を高速化できる。ストリームはインメモリ処理と差分計算処理によって大量データを超高速に分析し、リアルタイムに状況を把握・監視することができる」と高橋氏は説明。

 また、この3つのソフトウェア技術をハードウェア面から支える製品として、ブレードサーバ「HA8000-bd/BD10」を用意。同製品は、複数サーバの物理集約で1つのシステムが構成されており、Hadoopによる大量データ分散処理に適したスケールアウト型のブレードサーバとなっている。

クリックテック・ジャパン 代表取締役社長の垣田正昭氏 クリックテック・ジャパン
代表取締役社長の垣田正昭氏

 そして、これらに加えて、大量データ処理における分析プラットフォームの中核製品として同社が取り扱っているのが、連想インメモリ型の情報分析プラットフォーム「Qlik View」だ。Qlik Viewの特徴について、クリックテック・ジャパン 代表取締役社長の垣田正昭氏が説明した。

 「従来までのデータ分析手法で行われてきた統計処理は、実は“分析”ではなく“ドンブリ勘定”に過ぎない。Qlik Viewでは、独自の連想技術を活用することで、明細情報を保持したままデータ量を大幅に圧縮できる。これにより、数十億件の大量データを瞬時に計算し、細部までドリルダウンすることが可能になる」

 さらに垣田氏は、「Qlik ViewはCPUの数に比例してパフォーマンスを発揮する性質があるため、ハードウェアの進化とともに、さらに発展していくだろう」と、今後への期待を述べた。

わが社がHadoopを利用した理由と効果

 特別講演にはリクルート 住宅カンパニーSUUMOネット推進室 ジェネラルマネージャーの川本広二氏が登壇し、広告集客の最適化やカスタマー向けのサービスにビッグデータを活用した同社の具体例を紹介した。

リクルート 住宅カンパニーSUUMOネット推進室 ジェネラルマネージャーの川本広二氏 リクルート 住宅カンパニーSUUMOネット推進室 ジェネラルマネージャーの川本広二氏

 「ネット広告業界では、ビッグデータをビジネスに活用し、収益に結び付けていく考えを持っている企業は少ないのが現状。その中で当社は、全社を挙げてHadoopの運用体制を強化し始めている」

 川本氏はまずこのように述べ、リクルートが約120台のHadoopサーバを保有して積極的にHadoopを利用しており、各事業部がビッグデータを進んで活用していることを解説した。

 今回は、その取り組みの中でも、同社が運営する住宅情報サイト「SUUMO(スーモ)」におけるHadoopの活用例をピックアップ。「SUUMO」は現在、利用者数が年間約700万人、月間PVは約1.5億PVに上り、1日約1500万レコードものユーザー行動ログが発生しているという。

@IT情報マネジメント編集部からのお知らせ

大量・多種類のデータから、どうすれば“ビジネスの価値”を引き出せるのか? ビジネス/テクノロジサイドが同じ目的を見据え、収益向上、ブランディングにつなげる“現実的なポイント”を伝授!第16回@IT情報マネジメントカンファレンス『ROI最大化、収益向上に寄与するビッグデータの真意と活用の鍵』を3月8日(木)に開催します! 詳しくはカンファレンス紹介ページ


 「SUUMO」でHadoopを活用する理由について、川本氏は「まず、テレビとネットの両面でバランスよくプロモーション展開していくために、Hadoopによってマーケティングコストの最適化を図った。また、カスタマーの意志決定をサポートするマッチング精度を向上させることで、よりリアルタイムなコンテンツ提供を目指した。さらに、大量に蓄積される住宅情報などの商材データやユーザー行動ログをHadoopで分析し、マーケティングやサービスに活用していくことも大きな目的だった」と説明する。

 Hadoopの活用で得られたメリットについては、「大量かつ多様なデータを蓄積して、高速に処理できることがHadoopの最大のメリットだ。特にオンラインで分析処理を行っても、業務システムに影響が出ることがないため、今まで捨ててしまっていた情報が宝の山に変わったと実感している」と述べた。

 一方で、Hadoopを活用する際の注意点として、「Hadoopを導入しただけでは、何のメリットも得られない」と指摘。「Hadoopの導入目的に、バッチ処理の高速化やコスト削減を掲げるIT部門は多いが、それだけでなく、Hadoopがいかにビジネスに活用できるかを業務部門と議論する必要がある」と川本氏は訴える。

 「IT部門と業務部門が密にコミュニケーションをとり、Hadoopによって、どのようなビジネス課題を解決したいのかを明確化しないと、導入しただけで終わってしまう。そうならないためにも、まずは大量のデータを蓄積する仕組みを作ること。そして、Hadoopの運用体制を整備することが重要だ。社内のリソースで対応できない企業は、外部のサポートサービス、もしくはAmazon Elastic MapReduce(EMR)の利用を検討することを推奨する」とアドバイスした。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ