着信メール内容が予測候補に〜Advanced Wnn V2登場

» 2004年05月25日 14時05分 公開
[斎藤健二,ITmedia]

 オムロン ソフトウェアは5月25日、携帯電話向け日本語入力ソフト「Wnn」の最新バージョン「Advanced Wnn V2」の開発を発表した。インターネットの検索エンジンなどに使われている形態素解析機能(後述)を組み込み、受信したメールの文章に含まれている単語を、返信メールの予測候補として表示することなどが可能になった。

 従来のかな漢字変換とエンジンや辞書の共通化を図ることで、新機能を追加しながらエンジン部は175Kバイト(従来は122Kバイト)、辞書は975Kバイト(従来は750Kバイト)と軽量化した。解析速度はARM9/100MHzクラスのCPUで秒間320文字となっている。

 早ければ、年内にも同ソフトを搭載した端末が登場する見込みだ。

「直前に使われた言葉の利用頻度が高い」

 形態素解析機能とは日本語を解析して、単語を抽出する機能だ。例えば「東京の秋葉原のラーメン屋という自然文章から、『東京』『秋葉原』『ラーメン屋』といったキーワードを抽出して検索できる」(オムロン ソフトウェアSS事業部の山野恵一郎主務)。

 これを使えば、着信したメールの文章を解析して「着信メールに含まれている単語を優先して、予測候補に表示する」(山野氏)ことが可能になる。「直前に使われた言葉の利用頻度が高い」という特性をうまく生かして、予測精度を上げる試みだ。

 さらに、着信メール中のカタカナ語を自動的に辞書登録することも可能になる。例えば、

  • ミキから。あしたヒマ? 渋谷のハンズにいかない

 というメールが送られてきたら、

単語 動作
ミキ 新規登録
ヒマ 新規登録
ハンズ 辞書登録済み。頻度を上げる

 という登録を自動的に行うことができる。「カタカナは7割くらいが新語。もともとの辞書では追従できない、新しい言葉、身内の言い回しなどを効率よく予測辞書に登録できる」(山野氏)。

漢字のヨミを導く

 Wnnの形態素解析機能の応用例は、これに留まらない。例えば、メールの読み上げ機能への活用も考えられる。これまで棒読みに近かった読み上げ機能を「自然発話に近いものが可能になるのではないか」(山野氏)。

 形態素解析は、1)文章を文節に区切る 2)自立語/付属語に分割 3)品詞情報を返す 4)ヨミを振る という流れで進められる。この品詞情報やヨミ情報を活用することで、文脈に沿った読み上げが可能になるというわけだ。

 また、近年搭載が進んできたOCR機能への応用も考えられる。例えば名刺を携帯のOCRで読み込んだ場合に、形態素解析機能を使ってヨミを自動で取得。アドレス帳にそのまま登録できる──といった使い方だ。

 さらに、漢字をひらがなに自動変換することも可能だ。例えば、学童向けの携帯電話の機能として、メール本文中の難しい漢字をひらがなに自動変換する使い方ができる。「例えば、小学3年生までに習っている漢字はそのままで、習っていない漢字はひらがなに変換するという機能も可能」(山野氏)。

予測変換の次の機能は何か?

 同社が形態素解析機能を日本語入力ソフトに組み込んだ背景には、「予測変換の機能向上に限界が見えてきた。次はどうしようかと」(山野氏)という悩みがある。

 以前に使った単語を予測候補として表示するだけの初期の予測変換から、語句のつながりを学習して、直前に入力した単語に続く語句を予測する機能など、各社は機能強化を図ってきた。カナ英数変換や、絵文字/記号の学習機能も搭載例が増えてきており、各社機能面では横並びになりつつあるのが現状だ。

 この中で、オムロン ソフトウェアの方向性は「単なるかな漢字変換ソフトから、アプリケーションへの展開へ」というものだ。

 例えば、英和/和英/国語辞書の検索エンジンとしてWnnを使うなど、「かな漢字変換を超えて、データベース検索みたいなことがしたかった」(山野氏)。形態素解析機能を使って「漢字の逆引きができるようになった」のは、その目標に向けての大きな一歩だ。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年