XMLデータベースで企業の8割を占める非構造化データを管理する

XMLに関連するソフトウェアやシステム構築市場も拡大している。期待のかかるXML市場を牽引するのはどんなソフトウェアテクノロジーなのか。

» 2005年08月06日 17時15分 公開
[谷川 耕一,ITmedia]

 XMLの基本仕様である1.0がW3C(World Wide Web Consortium)に勧告されたのは1998年2月のことだ。6年後の2004年2月には最新のXML1.1が勧告され、現在まで7年余りの歳月を経て、XMLは基盤技術としての地位を時間をかけゆっくりと固めてきた。SOA(サービス指向アーキテクチャ)やEA(エンタープライズアーキテクチャ)、Webサービスなど、最近のIT業界を牽引するキーワードとともに、XMLはビジネス分野でも馴染みのある言葉の1つとなった。

 それに合わせて、XMLに関連するソフトウェアやシステム構築市場も拡大している。期待のかかるXML市場を牽引するのはどんなソフトウェアテクノロジーなのか。

「リレーショナルデーターベースvs XML」という過去の経緯

 XMLは汎用性が高く柔軟性に優れているため、システム間のプラットフォームの違いに影響されずにデータ交換が可能だ。また、情報の属性や論理構造を示すタグを自由に設定でき、人が読んで理解しやすいという特徴もある。XMLは通常、テキスト形式のデータとして扱われる。人間が理解しやすいとはいえ、大量に存在すれば管理する必要が出てくる。

 そこで登場したのがXMLデータベースだ。XMLデータベースと一口にいっても種類はさまざま。リレーショナルデーターベース(RDB)にXMLのインターフェースを持たせたものから、たんにXMLデータファイルをそのまま格納できるというものまで多様だ。ベンダーによっては、XMLの持つデータ構造の柔軟性を生かし、タグ構造を直接扱う機能を有するものを「ネイティブXMLデータベース」と呼び区別することもある。

 ネイティブXMLデータベースが世に出始めた頃は、マーケティングメッセージとして、RDBではできないことを数多く指摘されたため、あたかも、ネイティブXMLデータベースがRDBに取って代わるという誤解が生まれようとしていた。

 これに対して、RDB陣営は、次々とXMLへの対応を打ち出すことになる。圧倒的な資本力と既存システムという実績をもつリレーショナル陣営に対し、新興のXML陣営はなかなか太刀打ちできない。XMLデータベースは、いわばニッチな領域へと追いやられる傾向になっていたのだ。

非定型データを電子化する

 データウェアハウスが、国内で脚光を浴びたのは1990年代前半のこと。企業が抱えるあらゆるデータを大規模なデータベースに格納し、それを分析してすばやい意思決定支援に活用する。

 ここでいう「あらゆるデータ」は、各種システムに蓄積されている「すでに電子化されたもの」だった。会計や販売システムなどの定型的な数値や短いテキストが中心で、格納先は容量と性能を飛躍的に拡大してきたRDBだ。

 とはいえ、当初から「あらゆるデータ」には非定型なものも含まれていた。当時は、実際に非定型なデータを効率よく取り込む仕組みも、有効な非定型データそのものも存在しなかったにすぎない。もちろん、ストレージが高価であったという理由もある。企業が抱えるデータのうち、「システムに格納されているものは20%にも満たない」といわれていた。

 現在、この状況に変化はあるのだろうか。CRMなどの顧客対応履歴の管理やコラボレーションソフトなどのメッセージの交換などでは、非定型データを自動的にシステムで利用している。そもそも、業務に欠かせない存在となった電子メールは非定型データの典型だ。さらに、特許情報や政府、官公庁などの各種文書も、新たに電子化が進んでいる。これら非定型データは、各種システムに取り込まれ利用されるつつあるが、個々に独立した存在で該当のアプリケーションのなかのみで活用されている。

XMLデータベースの新たなる可能性

 新たな非定型データの電子化を加速し、活用するのがネイティブXMLデータベースということになる。ここにきて、基本的な機能に大きな進化があったわけではない。しかしながら、XMLデータベースはニッチ製品から「業務で普通に使えるソフトウェア」へと成長している。対リレーショナルからXMLの得意なところを活かし既存システムとの連繋を強調するメッセージも、XMLデータベースに期待を集める理由の1つであろう。XMLは、もともとシステム間連繋を得意としているので、このメッセージは素直に受け入れることができる。

 B2Bの企業間取引だけでなく新聞業界のNewsMLや医療業界のMMLなど、ビジネスの現場に即した標準化の策定が進んでいる状況も大きい。個人情報保護法など、コンプライアンス対応の必要に迫られ、企業が非定型データを的確に管理せざるを得ないというのも追い風だ。

もちろん、ネイティブXMLデータベースにも課題はある。大容量データを扱う際のパフォーマンスの問題、企業システムに求められる信頼性、拡張性の確保、共通的なアプリケーション開発環境の整備などの問題が、すべて解決されたわけではない。逆に考えると、RDBが数十年かけて築き上げてきたこれら課題を克服する機能や性能を、XMLデータベースにもたせればいいわけだ。

企業システムに必要な要件

 東芝ソリューションが4月に発表したXMLデータベース「TX1」は、テラバイトクラスの大容量データへの対応、企業システムとしての信頼性の確保を目指して設計されている。これらを支える機能、性能の実装は、XMLで何ができるかというよりも、顧客のニーズが先にありそれに応えるための仕様となっている。

 「XMLデータベースで企業の実用に耐えられるものはまだない。TX1は、最初から企業の中核のデータベースとして十分に使えるものを開発したいと考えた」と話すのは、プラットフォームソリューション事業部 商品企画部 参事の齋藤稔氏。東芝ソリューションがOracleデータベースを扱うシステムインテグレータとして多くの実績があることも、企業がXMLデータベースに何を求めているかを理解する助けとなっているのだろう。

 XML市場でリーダーシップをとっていくには、XMLのもつ「良さ」だけを追求してもだめだ。既存システムとの融合、既存システムが実績としてもっている優れた点をいかに積極的に取り込むかが重要なカギになる。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ