明確な目的や答えがある「質問」への対応と、明確な答えがない「雑談」への対応ではシステムの作り方は大きく異なる。質問対応の場合、質問の意味を解析して100種類以上ある回答のタイプ(単語、定義、理由、連想、評判など)から、最も確からしいタイプを見極め、Web上の膨大な言葉から答えを見つけるという仕組みになる。
一方雑談には、話題や回答に正解はない。東中さんたちの研究では、人間の雑談のテーマは何千とあり、一番多いテーマでも全体の1%に満たないことが分かっているという。突然、旅行の話やラーメンの話を振られても、何らかの対応ができるようにしておかなければいけない。
そして「ラーメンが好きなんだよね」と言われれば、「とんこつがいいよね」と答えても、「大阪の○○というお店がおいしい」と答えても、「私はハンバーグが好き」と答えても会話が続く可能性がある。「ラーメンが好き」という発言そのものではなく、その発言が生まれた背景(文脈)や意図をつかむことが重要になるのだ。
雑談対話のシステムを構成するには、とにかく数多くのパターン(ルール)を学習させる方法や、Twitterのリプライなど、Web上にあるデータから会話を抽出する方法など、さまざまなアプローチがあるが、よい応答を実現するのは難しいという。
「正解がない雑談をパターン化するのはキリがないんです。われわれも30万ぐらいのルールを手作業で入力したのですが、それでも利用者の満足度は半分くらいでした。最近では、Twitterやブログなど、Web上から最適と思われる言葉を検索するアプローチもありますが、データにノイズが多すぎて会話がうまく進みません。ネット上にはたくさんの人がいるので、一貫しないことを言ってしまう。
『好きだ』と言うべき場面で『嫌いだ』と言ってしまったり、語尾が統一されていなかったり、突然性別が変わったようなふるまいをしてしまったりして、なかなか対話の満足度が上がらないんですね。最近ではディープラーニングを使う方法も検討していますが、これもまだ精度が低く、それだけに頼るとかなり変な文章が出てきてしまうので、サービスにはまだ導入できない印象があります」(東中さん)
Copyright © ITmedia, Inc. All Rights Reserved.