東芝はこのほど、システムに登録されていない未知の単語でも、単語や文脈から意味を推定し、学習していく「未知語理解AI」を開発したと発表した。ユーザーとの会話中、未知の単語を抜き出し、ユーザーに登録済みの言葉で言い直すよう提案したり、その場で学習したりするという。
専門用語や略語が多い業界では、あらかじめAIに全ての単語を学習させておくことが難しく、認識精度が上がりにくいという課題があった。ユーザーとの会話中、未知の単語が登場すると「分かりません」と答えて対話を終了するか、別の単語と間違えてしまい、会話が成り立たなくなるケースもある。従来は単語の意味を推定する際に文脈を考慮しない手法を使っていたためだ。
そこで同社は、未知の単語を抜き出し、文脈も考慮して意味を推定するAIを開発。例えば、ユーザーが「接点不良」という、システムに事前登録していない単語を使って「電源装置に接点不良がある」と報告した場合、AIが「接点不良」を未知の単語として抜き出し、文脈から状態異常の一種だと理解。その上で「『接点不良』を新規の異常状態として登録しますか?」などと返答するという。
新開発のAIは、単語の特徴から意味を推定するニューラルネットワークと、文脈から単語の意味を推定するニューラルネットワークを使い、単語の意味を推定。両者が出した結果のうち、どちらを重視するかを別のニューラルネットワークが判断する。既知の単語の場合は単語の特徴を重視するが、未知の単語の場合は文脈を重視する。
同社が実施したテストによると、従来手法と比べ、新手法では意味を推定する精度が向上したという。今後は、同社のコミュニケーションAI「RECAIUS」(リカイアス)が提供する各種音声対話サービスへの新技術の適用を検討していく。
「AIの性能を上げている場合ではない」──東ロボくん開発者が危機感を募らせる、AIに勝てない中高生の読解力
東芝、ミリ秒オーダーで大規模な「組み合わせ最適化問題」を計算する技術を2019年中に適用実験 金融分野などに期待
ミリ波レーダーで刃物・銃・爆発物を検出 東芝がテロ対策の新技術 駅や空港での利用を想定
東芝の「組み合わせ最適化最速アルゴリズム」、クラウドで一般公開
「量子理論の副産物に過ぎなかった」──東芝の「量子コンピュータより速いアルゴリズム」誕生秘話Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR