W3Cのバーナーズ‐リー氏、セマンティックWebの牽引役としてライフサイエンスに期待

かつて高エネルギー物理学がWebを軌道に乗せたように、ライフサイエンスがセマンティックWebを牽引するだろう――Web発明者でW3Cのディレクター、バーナーズ‐リー氏が語った。(IDG)

» 2005年05月19日 20時14分 公開
[IDG Japan]
IDG

 セマンティックWebは、複数のアプリケーションフォーマットや組織的な制限のために隔離された状態の科学的データを開放する鍵となり、科学者はコンピュータ処理能力をフル活用できることになるだろう。Web発明者のティム・バーナーズ‐リー氏は5月17日、そう語った。

photo Bio‐IT Worldで基調講演中のバーナーズ‐リー氏

 World Wide Web Consortium(W3C)のディレクターであるバーナーズ‐リー氏は、ボストンで開催された第4回Bio‐IT World年次カンファレンスで、「セマンティックWebにより、科学者などのユーザーは他者のデータから、予想外の助力や思いがけない付加価値を得られることになるだろう」と語った。セマンティックWebは、ユーザーやアプリケーション間でWeb上のデータを共有、再利用しやすくすることを目指したもの。

 セマンティックWebは、XMLを使ってアプリケーションを統合するための、W3CのResource Description Framework(RDF)をベースとしている。セマンティックWebのデータベースに置かれた文書と情報はマシン処理が可能なフォームで発行され、ある種のグローバルなデータベースが形成される。

 バーナーズ‐リー氏によれば、セマンティックWebは特にライフサイエンス分野の科学者にとって便利なツールになるはずという。「そして、この次世代Web技術の実装において、そのほかの多くの分野に対し、リーダーシップを発揮することになる。今現在、ライフサイエンスの関係者の間ではかなり関心が高まっており、多くの人たちがセマンティックWebや、セマンティックWebによって解決される問題にワクワクしている」と同氏。

 バーナーズ‐リー氏は、HTTP(Hypertext Transfer Protocol)やHTML(Hypertext Markup Language)といったWebの主要コンポーネントを1980年代後半に発明した人物だ。同氏はかねてから、構造化されていない有機的なWebの拡張を構想してきた。W3Cは1990年代後半にそのための最初のプロジェクトを立ち上げ、Webページへのメタデータの追加を行ってきた。

 バーナーズ‐リー氏は、ちょうど高エネルギー物理学が初期のWebを牽引したように、ライフサイエンスがセマンティックWebの採用を牽引することに期待している。

 「多分、いずれかの分野で臨界量を満たせるだろう。例えば、Webは高エネルギー物理学でうまく軌道に乗った。高エネルギー物理学のWebサイトが6つできた時点で、Webは物理学者たちにとって興味深い存在となった。それと同様に、ライフサイエンスでセマンティックWebの臨界量を満たし、半ダースから1ダース程度のオントロジーセットや新薬研究向けのコアなものを実現できれば、その時点でライフサイエンス分野のセマンティックWebは臨界点に達するだろう。そして雪だるま式に拡大し、コピーされることになるだろう。そうなれば、ほかの分野も、これはやってみる価値がありそうだと気付くはずだ」と同氏。

 またバーナーズ‐リー氏によれば、特にライフサイエンスはセマンティックWebの先駆者に適している。例えば、新薬研究では、研究者が使っているデータベースや情報システムの多くは既に、マシンで読み取り可能なフォーマットになっているか、あるいはそうした変換のための準備が整った段階にある。

 そうした取り組みの例としては、代謝、信号、遺伝子制御、遺伝子パスウェイなどに関するデータの標準的なデータ交換フォーマットを開発しているBiological Pathways Exchangeや、タンパク質に関するデータ目録に含まれる情報を統合しているUniversal Protein Resource(Uniprot)が挙げられる。

 「多くのケースでは、Uniprotと同様、オントロジー(統制語彙と階層データ構造)が存在し、既にモデリングが行われている」とバーナーズ‐リー氏。

 新薬開発ダッシュボードのセマンティックWebのプロトタイプであるBiodashでは、ユーザー向けに、疾病、薬剤の進行ステージ、分子生物学、パスウェイデータを関連付けている。このプロトタイプは、W3C、IBM、Oracle、コロラド大学などの代表者が参加するチームが開発したもので、公共のデータソースや化学資料室からの情報を遺伝子やタンパク質、パスウェイなどの生物学的存在と連携させるセマンティックWebブラウザが含まれている。

 バーナーズ‐リー氏は、セマンティックWeb向けにデータをフォーマットする作業に対しては、迅速な投資回収は約束していない。同氏は、この概念は「説明が非常に難しい」と語っている。だが同氏は15年前にも、Webについて説明しようとして同様の問題に直面したという。「当時、人々の反応は『ハイパーテキストページ? それがどうしたというんだ?』というものだった。基本的には何でも自由にリンクできるということや、それが何を意味するかということを、誰も理解できていなかった」と同氏。

 セマンティックWebがいつ軌道に乗るかと問われ、バーナーズ‐リー氏は次のように答えている。「私のほうこそ教えてほしい。私は、これから起こって欲しいと思っていることを皆さんに伝えるために全力を注いでいる。実際に起こりそうなのは、もっとはるかに危険なことだ」

Copyright(C) IDG Japan, Inc. All Rights Reserved.

注目のテーマ