知らない単語でも意味を推定するAI、東芝が開発 「専門用語を理解できない」解消へ
東芝が、システムに登録されていない未知の単語でも、単語の特徴や文脈から意味を推定して学習できるAIを開発したと発表した。
東芝はこのほど、システムに登録されていない未知の単語でも、単語や文脈から意味を推定し、学習していく「未知語理解AI」を開発したと発表した。ユーザーとの会話中、未知の単語を抜き出し、ユーザーに登録済みの言葉で言い直すよう提案したり、その場で学習したりするという。
専門用語や略語が多い業界では、あらかじめAIに全ての単語を学習させておくことが難しく、認識精度が上がりにくいという課題があった。ユーザーとの会話中、未知の単語が登場すると「分かりません」と答えて対話を終了するか、別の単語と間違えてしまい、会話が成り立たなくなるケースもある。従来は単語の意味を推定する際に文脈を考慮しない手法を使っていたためだ。
そこで同社は、未知の単語を抜き出し、文脈も考慮して意味を推定するAIを開発。例えば、ユーザーが「接点不良」という、システムに事前登録していない単語を使って「電源装置に接点不良がある」と報告した場合、AIが「接点不良」を未知の単語として抜き出し、文脈から状態異常の一種だと理解。その上で「『接点不良』を新規の異常状態として登録しますか?」などと返答するという。
新開発のAIは、単語の特徴から意味を推定するニューラルネットワークと、文脈から単語の意味を推定するニューラルネットワークを使い、単語の意味を推定。両者が出した結果のうち、どちらを重視するかを別のニューラルネットワークが判断する。既知の単語の場合は単語の特徴を重視するが、未知の単語の場合は文脈を重視する。
同社が実施したテストによると、従来手法と比べ、新手法では意味を推定する精度が向上したという。今後は、同社のコミュニケーションAI「RECAIUS」(リカイアス)が提供する各種音声対話サービスへの新技術の適用を検討していく。
関連記事
- 「AIの性能を上げている場合ではない」──東ロボくん開発者が危機感を募らせる、AIに勝てない中高生の読解力
東大合格を断念したAI「東ロボくん」。2016年は理系数学で偏差値76.2を記録したが、問題文の意味を理解しないAIに8割近い高校生はなぜ勝てなかったのか。NIIの新井教授が語った。 - 東芝、ミリ秒オーダーで大規模な「組み合わせ最適化問題」を計算する技術を2019年中に適用実験 金融分野などに期待
東芝は、組み合わせ最適化問題を大規模かつ高速に解ける「シミュレーテッド分岐アルゴリズム」(SB)を、FPGAなどの専用回路に実装する設計技術を発表した。実用的な問題を解く実証実験を行い、今年中の成果発表を目指す。 - ミリ波レーダーで刃物・銃・爆発物を検出 東芝がテロ対策の新技術 駅や空港での利用を想定
東芝がミリ波レーダーを使って危険物を検知し、テロを防止する技術を開発したと発表。駅や空港などの利用者に30〜300GHzの電波を一斉に照射して所持品をスキャンし、モニターに画像を生成する。実用化は2020年以降を想定しており、今後も研究開発を継続する。 - 東芝の「組み合わせ最適化最速アルゴリズム」、クラウドで一般公開
東芝は、組み合わせ最適化問題を高速・大規模に解ける「シミュレーテッド分岐アルゴリズム」を実装したマシンを、クラウド上に公開した。 - 「量子理論の副産物に過ぎなかった」──東芝の「量子コンピュータより速いアルゴリズム」誕生秘話
量子コンピュータよりも速い「シミュレーテッド分岐アルゴリズム」を開発した後藤隼人主任研究員に、開発背景を聞いた。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.