リアルタイム性を備えた真のエンタープライズデータウェアハウスで勝機をつかめ−ビジネスインテリジェンスの今−その必要条件とは?

企業の戦略的ツールだったデータウェアハウスは、今やリアルタイム性を備えて戦術的な領域まで対象範囲を広げつつある。その背景から、HPのリアルタイムEDWソリューションであるHP Neoview Platformが持つ特徴を探ってみる。

» 2007年04月27日 10時00分 公開
[PR/ITmedia]
PR

データウェアハウスの現状

 1990年にデータウェアハウスが提唱され、そこで挙げられていた特徴から、データウェアハウスは「詳細時系列履歴」「統合化」「非定形に対応」といった機能を備えることが前提とされていた。しかしながら、これまではさまざまな事情や制約から、特定業務向けに特化されたデータマートで代替される例が多く、データウェアハウスは一部の専門家や経営層のための意志決定支援システムとしてのみ運用される例が多かった。いわば、企業の戦略的ツールとして利用されていたのである。

 しかし現在では、市場の動向をいち早く正しく分析し、変化に即応する企業運営が求められるようになってきた。そのため、本来構想された姿でのデータウェアハウスを全社規模で構築し、業務システムが生成する大量の情報をリアルタイムに近い形で取り込み解析する、戦術的に活用できるエンタープライズデータウェアハウスの構築に注目が集まっている。

 ベンダー側ではこれを受けて、“リアルタイムEDW(エンタープライズデータウェアハウス)”という言葉を使うようになってきた。その意味するところは、夜間バッチでデータを読み込み、翌日から利用可能になる従来のスローテンポなデータウェアハウスではなく、時々刻々の状況変化に応じて軽快に更新されていく“アクティブなデータウェアハウス”というニュアンスだ。

 データマート中心のアプローチだと、データの扱いが個々にバラバラに行なわれ、システムによって使用するデータの鮮度がまちまちで、どれが正しい情報かも分からなくなるという問題もあった。だが、全社規模のアクティブなデータウェアハウスを構築し、特定業務向けのデータマートをここから生成する形にできれば、データソースが一元化でき、“Single Version of the Truth(唯一の真実)”に基づく意志決定や業務遂行が可能になるという利点も期待できる。

リアルタイムエンタープライズデータウェアハウスを実現するには?

 HP Neoview Platform(以下 HP Neoview)は、こうした市場動向に対応する能力を備えた、日本ヒューレット・パッカードの最新データウェアハウスソリューションだ。

 リアルタイムEDWは一般的な概念に成りつつあるのが現状だが、コンセプトを机上の空論にしないためには、確固たる技術の裏付けが求められる。1990年当時に比べればプロセッサの処理能力もネットワークの帯域幅も飛躍的な進歩を遂げているが、それだけでリアルタイムEDWが実現できるわけではない。HP Neoviewは、HP社の豊富な技術的蓄積と、最新・最良のハードウェアコンポーネントとを組み合わせた“Best-Of-Breed”のソリューションであり、理想を現実化する能力を備えたプラットフォームとして提供される。

 HP Neoviewを構成する主なコンポーネントは、インテルItanium2プロセッサを搭載したHP Integrity ServerとHP StorageWorksで、OSとRDBMSにはHP NonStopで培われた超並列処理技術をベースにし、Neoview独自のものが採用される。さらに、データのロード/アンロードのためにHP ProLiant Server(Linux)も組み合わされる。

HP Neoview Platform構成コンポーネント HP Neoview Platformを構成するコンポーネント

 最大で256個のItanium2プロセッサを使用した超並列処理が行なわれるため、ソフトウェアにも超並列環境に対応したものが必要となる。そのための実績あるプラットフォームとして選ばれたのが、NonStopテクノロジーをベースにした OSとRDBMSの組み合わせだ。Neoview RDBMSはNonStop SQLをデータウェアハウス向けにチューンした専用DBシステムであり、NonStop SQL由来の超並列DBアーキテクチャーによって高いパフォーマンスを安定的に発揮することができる。

 超並列DBアーキテクチャー 高いパフォーマンスを実現する超並列DBアーキテクチャー。ESAM(Encapsulated SQL Access Manager)が配下のディスクデータを占有して管理する

 多数のプロセッサを同時並列的に利用することで高いパフォーマンスを達成する超並列システムでは、処理を分散し、常にすべてのノードを稼働させないと意味がない。アクセスされるデータ領域に偏りがあるなどの理由で一部のノードだけが使われ、ほかのノードがアイドルになっているような状態は極力避けなくてはいけない。このため、データベースの分割にはハッシュ・パーティショニングが採用されている。一般的な汎用DBで利用されているレンジ・パーティショニングはユーザーが明示的にデータ範囲を指定して分割するため、高度なノウハウを持つ技術者が設計/チューニングを行うことで高い性能が発揮できる。だが、技術的な難度は高く、当然構築に要する費用も高額になりがちだ。一方、ハッシュ・パーティショニングではデータは機械的に分散されるため、設計段階でユーザーに負担を強いることはない。機械的に平均的に分散されることから、どのようなアクセスに対してもデータディスクやプロセッサが平均的に利用されることが期待でき、設計/運用コストの低減と安定した高性能を両立できる。

 ハッシュ・パーティショニング ハッシュ・パーティショニングでは、ハッシュを利用したデータの自動分散管理が行われるため、DBの物理設計は不要となる

 また、データロード&アンロードには、データウェアハウス本体の実行用とは別のサーバ(HP ProLiant Server)が用意されている。これは、コストパフォーマンスの高いIA/Linuxサーバであり、超並列アーキテクチャーの実行と高信頼性を求められる本体側サーバとは異なるアーキテクチャーとすることで効率化を実現している。別サーバ化されたことで本体側の負荷をいたずらに増やすことがなく、オンライン稼働中にもロード/アンロード処理が実行可能となっている。このため、業務システムの情報をリアルタイムに近い形で刻々とデータウェアハウスに反映していくことが可能だ。さらに、ロード処理は本体側の並列処理との組み合わせで高いロード性能を提供する。具体的には、並列化されたデータベースに対応してデータをあらかじめ分割し、必要なデータだけを個々のノードに送るための、ハッシュ・パーティショニングやブロック・インサートへの対応を行う。さらに、標準的なインターフェースに対応しているため、一般的なサードパーティー製品との接続性も高い。システム全体を丸ごとリプレースするのではなく、既存の投資を保護しながらの導入が可能だ。

データロード/アンロード データのロード/アンロード,は別サーバによって行われる。このため、本体負荷をかけることなく、オンライン稼動中にもロード/アンロード処理が実行可能となる

 最後に、従来独立して運用されてきた業務特化型のデータマートをEDWに統合する場合、負荷の集中が問題になる。超並列アーキテクチャーはもともと多数のリクエストを効率的に処理する能力が高いが、NonStopテクノロジーを採用した OSがジョブのプライオリティを詳細に制御できるため、ユーザーの使用感を損なうことなくサーバ統合が実現できる。これは、汎用的なOSを利用するのでは実現が難しい部分であり、HP Neoview 独自の優位点ともなっている。処理に対しては255段階のプライオリティを設定できるので、全社レベルで多くの業務領域を同時にサポートする本来のエンタープライズデータウェアハウスを構築する場合も、それぞれの業務に応じて必要なレスポンス・タイムを実現するために、きめ細かな優先度設定を行うことができる。ジョブに設定されたプライオリティはディスクアクセスに対しても引き継がれるので、大量のデータアクセスを要するジョブが投入された後、すぐに応答が欲しい軽量ジョブが投入された場合でも、後者に迅速に応答することが可能になる。EDWでは、技術的に統合するだけでなく、ユーザーの満足度までを維持できなくては意味がない。HP Neoviewでは、単に複数のデータマートを統合できるというレベルにとどまらず、使用感を維持したままの統合が可能になっており、この点も机上の空論に終わらせないための技術の裏付けとして重要なポイントとなっている。

EDWは、理想から現実の世界へ

 HP Neoviewでは、実績のあるNonStopシステムの技術を活用し、EDWを単なる理想ではなく、現実的に運用可能なシステムとして提供することを可能としている。

 HP Neoviewを利用してEDWを構築すれば、業務システムで刻々と生成されるデータを迅速にデータウェアハウスに反映し、参照することが可能になる。この結果、データウェアハウスはトップエグゼクティブのための意志決定支援にとどまらず、現場の日々の業務に対応して有益な情報を提供する戦術レベルのツールとしても有用性を発揮できるようになる。しかも、その元になるデータは全社レベルで統一された最新データであり、システム間で異なる情報を参照しているといったありがちな問題も回避できる。データウェアハウスが最初に構想されて以来、その本質的な利用がやっと現実に可能となった。その意味で、今ようやくデータウェアハウスが企業で活用できる時代が到来したとも言えるだろう。

 HPでは、全社レベルでの取り組みとして社内データセンターの集約プロジェクトに取り組んでいる。データウェアハウスも統合対象となっており、2005年の段階で全世界に700を超えるデータマートが構築されていたのを、近い将来1つのデータウェアハウスに統合する計画となっている。2007年現在、今も数々のデータマートが集約されているのだが、このプロジェクトを支えているのがHP Neoviewであり、HPはベンダーであると同時に最初の大規模ユーザーでもあるということになる。社内IT部門などの要求や要望を受けてHP Neoviewは改良を受けており、HP自身がユーザーとしてその品質を実証したプラットフォームがユーザー企業へ販売されるということになる。実績を踏まえた信頼の高いデータウェアハウス プラットフォームを運用管理コストを抑えた形で導入できる点が、HP Neoviewの大きなメリットである。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本ヒューレット・パッカード株式会社
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2007年5月31日