ITmedia NEWS >
ニュース
» 2010年08月09日 19時01分 UPDATE

「Google検索に欠けている情報を」 Web上の評判や対立意見を抽出、NICT「WISDOM」

キーワードやフレーズを入力すると、Web上での評価や発信者情報、対立意見などを抽出・分析できるシステムをNICTが公開した。

[ITmedia]
画像

 情報通信研究機構(NICT)は8月9日、キーワードやフレーズを入力すると、Web上での評価や、評価を発信している発信者の情報を抽出・分析できるシステム「WISDOM」(Web Information Sensibly and Discreetly Ordered and Marshaled)を公開した。NICTが独自に収集した5億件以上の日本語ページを対象に分析する。

 入力したキーワードについて、Web上にある肯定・否定意見の割合や内容を表示したり、「企業」「政府」「Q&Aサイト」など発信者ごとに絞って検索結果を確認できる。単語だけでなく、「うがいの効果」「バイオエタノールは環境に良い」などフレーズや短文でも調べられる。

 (1)発信者を自動抽出し、専門性の高い順に順位づけする「情報発信者分析技術」、(2)意見や評価を抽出し、肯定・否定を判断する「評価情報抽出技術」、(3)関連するワードや対立意見を抽出する「主要・対立・対比情報抽出技術」を盛り込んだ。

 Web上の評判を検索するシステムは従来からあったが、発信者や対立する情報など多様な観点から分析できるシステムは、WISDOMが世界初としている。情報の信頼性を判断するためのヒントとして活用してもらう狙い。今後は精度向上を図るほか、英語版・中国語版の開発も進める。

 NICTの理事長だった国立国会図書館の長尾真 館長はWISDOMスタートに当たり、「Google検索に何が欠けているかをNICT時代にいろいろ考えたが、検索上位に表示される情報の信頼性や対立情報を自然言語処理で明らかにすることだった。そこでプロジェクトをスタートさせ、WISDOMというすばらしい成果になったことは誠に喜ばしい。多くの人に使ってもらいたい」とコメントを寄せている。

Copyright © ITmedia, Inc. All Rights Reserved.