セマンティックウェブ(せまんてぃっくうぇぶ)情報システム用語事典

semantic web / 意味を持つウェブ

» 2010年04月12日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 WWWで記述・公開される情報資源(コンテンツ)に意味を表す構造を与え、それを解釈する機構を整備することで、高度な知的機械処理を可能とする次世代WWWのこと。WWWの標準化団体であるW3C(World Wide Web Consortium)の勧告を通じて関連技術の標準化が進められている。

 現在、Webページの記述には主としてHTMLが使われているが、これはタイトルや見出し、段落などの文書構造を表すことはできるが、内容を示す文は単なる文字列なので、「千葉」が人名か地名か、「1500」が金額か数量かといった意味内容までを示すことはできない。そのため、現状のWWW検索では人名か地名かなどを区別することなく結果が表示される。また、WWWではWebページなどの情報資源同士をハイパーリンクでつなぐが、それがどのような関係なのかは表現されておらず、リンクの意味はリンク先のテキストを人間が読んで解釈するしかない。

 それに対してセマンティックウェブは現状のWWWを拡張して各コンテンツに機械処理可能なメタデータを追加するなどして、コンピュータによる高度な知識共有、再利用を可能とすることを目指すプロジェクトである。

 W3Cのセマンティックウェブを構成する技術としては、情報資源に一意な識別子を与えるURI、タグ(メタデータ要素)記述の基本構文とネームスペース機能を提供するXML、有向グラフとして情報資源の意味を表すRDF、RDFが使うタグの定義を記述するRDFスキーマ、RDFスキーマ同士の関係を規定するオントロジの記述言語であるOWLなどがある。

 W3Cはコンテンツの記述について、HTMLをXML化したXHTMLの推奨を続けていたが普及が進まなかったこともあって、10年以上も止まっていたHTMLの改訂に着手し、2008年1月にHTML5のドラフトを発表した。HTML5の仕様にはセマンティックウェブの要素が含まれている。

 また技術仕様としての具体化はまだだが、セマンティックウェブにはエージェントソフトウェアを使って人手に依らない高度なデータ収集・判断・評価を行う推論基盤、情報の確からしさを保証する信頼基盤を確立するという構想もある。

 セマンティクウェブの直接の提唱者は、WWWの考案者でW3Cのディレクター(最高責任者)を務めるティム・バーナーズ・リー(Tim Berners-Lee)である。バーナーズ・リーはWWW開発の当初からより知的なものを目指していたが、具体的なビジョンとして語るようになったのは1998年ごろからで、2001年の米国サイエンティフィックアメリカン誌に掲載した論文「Semantic Web」で「セマンティックウェブ」の名が広まった。

 W3Cが推進するセマンティックウェブは現在のWWWを拡張するものと位置付けられており、グローバルに分散したシステムとして構想されている。これに対してオープンなインターネットではセマンティックな処理は実現不可能という意見が根強い。

 しかし、セマンティック技術はすでにさまざなま領域で使われており、RSSによるWWWサイト更新情報の提供やマッシュアップ開発支援をはじめ、異なるデータベース間でのデータ照合や整合性維持、異なるサイト間でのコンテンツ共有やユーザーインタラクション統合などが実現されている。

参考文献

▼『セマンティック・ウェブのためのRDF/OWL入門』 神崎正英=著/森北出版/2005年1月

▼『ためしてわかるセマンティックWeb──次世代型データ活用術』 伊藤健太郎、佐藤勇紀、濱崎俊=著/技術評論社/2007年12月

▼『自分で推論する未来型ウェブ」 ティム・バーナーズ・リー、ジェームズ・ヘンドラー、オラ・ラッシーラ=著/村井純、川上博美、大川恵子=訳/日経サイエンス 2001年8月号/日経サイエンス社(「The Semantic Web」 “SCIENTIFIC AMERICAN May 2001”の邦訳)


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ