マイクロソフト,東京大学との自然言語検索共同プロジェクト「Strelitzia」を発表

【国内記事】 2001.07.25

 マイクロソフトは7月25日,都内のホテルで記者発表会を行い,デジタルデバイドの解消や次世代ユーザーサポートサービスの確立を目指し,東京大学と共同で進めてきた自然言語処理プロジェクト「Strelitzia(ストレリチア)」を発表した。

マイクロソフトの東氏

 発表会の冒頭,同社取締役で経営戦略担当の東貴彦氏は,「現在,日本で4000万台のPCが動くほどパソコン利用者は拡大している。デジタルデバイドも発生しており,サポート方法の改善が問われるようになってきた。われわれは,その対応として,話し言葉などの自然言語からもユーザーサポートが受けられるようにすることで,より人にやさしいシステムを構築しようと考えている」と話す。

 Strelitziaの大枠的な仕組みは,「サポート辞書」「ナレッジベース」「検索履歴」の3つのデータベースが支えている。この3つが適切に連動することで,話し言葉などによる曖昧検索を可能にする「自然言語検索エンジン」が機能していくという。

 データベースを個別に見てみると,サポート辞書は,主に,類義語や表現のゆれを適切に判断するためのもの。例えば,「Windows」という語を表現するのに,ユーザーによって「WINDOWS」「ウインドウズ」や,略して「Win」などとなることがある。また,スペルミスで「Widows」などと入力することも考えられ,そのような「表現のゆれ」を補正するために必要になる情報をデータベースとして蓄積していく。

 この日,Strelitziaの簡単なデモも行われている。マイクロソフトのサポートサービスのWebサイトに設定された「Strelitzia」アイコンをクリックすると,検索画面が起動現れる。そこに,ユーザーが「ワードで文章を上下に分けて入力する方法を教えて」と入力し,実行ボタンを押す。すると,「段組を設定する方法」というサポート情報がヒットし,ユーザーは要求どおりの情報を取得することができた。ただし,アドリブでもう1つ例を見せてもらうため「画面が青くなってしまったときの対処」というセンテンスで検索を掛けると,要求しているものとはほとんど関係のないデータしかヒットせず,まだまだ技術的な課題があることも垣間見えた。

 ちなみに,検索情報は前述の自然言語検索エンジンにたどりつく前に,単語分割される。「ワードで文章を上下に分けて入力する方法を教えて」ならば,例えば,「ワード」「文章」「上下」「入力」などに分割されるわけだ。この分割には,マイクロソフト製品の「Office」シリーズや「Sharepoint Portal Server」などの機能が利用されているという。

マイクロソフトと東大の役割分担は?

 産学共同プロジェクトという意味でも注目されるStrelitziaの技術的な役割分担は次のようになっている。

 マイクロソフトアジアリミテッドは,プロフェッショナルサポート本部が自然言語検索エンジンを開発。米マイクロソフトソフトコーポレーションは,Natural Language Groupが,形態素解析や表記ゆれなどの処理を手掛けたという。

 一方,東京大学からは,中川裕志教授が情報検索と専門用語抽出を,黒橋貞夫助教授が構文解析を行ったとしている。

 同社は,「ユーザーが難しいと思う利用シーンすべてに橋をかけていきたい」とする「Bridge the Digital Divide」をキーワードに,顧客満足を向上していきたいとしている。

 Strelitziaの今後のスケジュールは,8月1日より,話し言葉によるサポート技術情報検索を行う「話し言葉検索」,11月からは専門用語辞書,2002年の2月からは対話処理によるヘルプシステムがそれぞれスタートする予定となっている。

関連リンク

▼マイクロソフトオンラインサポート

▼マイクロソフト

[怒賀新也 ,ITmedia]