「大量データ」活用に向けた技術の選択基準は:Open Middleware実践講座
世の中で扱われるデータ量が増加する中、企業ではこうした「大量データ」を活用する動きが本格化しつつあります。ではどのような技術を適用していけばよいのでしょうか。
(このコンテンツは日立「Open Middleware Report vol.54」をもとに構成しています)
大量データの活用には適切な技術選びが鍵
ブロードバンドや携帯端末の普及、センサー技術の発展などにより、ITシステムが扱うデータは爆発的に増加しています。現在多くの企業では、こうしたデータを分析して業務改革や新サービスに役立てたいというニーズが高まっています。そこで大きな注目を集めているのが、Hadoopをはじめとする大量データ処理のための技術です。
同じデータを扱うにしてもニーズによって適用する基盤は異なります。例として、これらの新技術を交通サービス関連の業務に当てはめて考えてみましょう。例えば「現在起きている交通渋滞を監視したい」といった場合は、データの流れを瞬時に分析する必要があります。一方、「長期間にわたる交通量の調査を集計したい」といった場合には、大量データの集計/バッチ処理を得意とする技術が向いています。日立製作所(以下、日立)では、前者についてはCosminexusの「ストリームデータ処理」、後者のニーズに対しては「グリッドバッチソリューション」で対応しています。
ただし、同じ大量データの集計/バッチ処理でも、そこに「データ品質」や「信頼性」という観点が加わると、また選択肢は変わってきます。Webアクセスログの解析から「顧客の興味に合わせたリコメンド情報を生成する」という場合ならHadoopで十分な効果が得られます。一方、「銀行の口座振替を翌朝8時までに完了する」といったミッションクリティカルな業務では、高い信頼性を特長とするグリッドバッチが適切な選択となります。
もちろん、これらは一般論であり、すべてのケースに当てはまるわけではありません。実際の稼働状況に応じて必要なシステムを検証することが重要です。日立では「大量データアセスメントサービス」を提供しており、大量データの活用を考えている企業をコンサルテーションから実機評価、技術研修まで幅広く支援しています。
今後、大量データをビジネスで利用するには、状況に応じた技術への理解を深める必要があるでしょう。どの技術を適用すべきかということを、効果検証などをふまえて判断し、適切なシステムの導入形態を見極めることが重要なポイントとなります。
関連記事
- データの活用範囲を拡大する:リアルタイム処理で「大量データ」を使いこなせ
実世界から流れ込んでくる大量のデータを即時分析するニーズが高まっている。膨大なデータをリアルタイムに処理する技術の裏側、そしてデータ活用の今後に迫る。 - 増加する「大量データ」活用に向けて:Hadoopを本当に使いこなすための現実解
オープンソースの分散処理ソフトウェアとして注目を集めるHadoop。企業ITコンサルタントの鵜澤幹夫氏がHadoopにおけるベンダーの取り組みを聞いた。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.