NTT(持ち株会社)は10月16日、黒柳徹子さんをモデルにした等身大アンドロイド「totto」(トット)に音声対話システムを導入し、自律的にインタビューを行えるようにしたと発表した。相手の話に肯定的な反応を返したり、話の内容に合わせて情報を聞き出すといったことも可能。「あなたどこからいらしたの?」「北海道です」「あら素敵。北海道のどこかしら?」「函館です」「函館は夜景がキレイですてきよね」――といった会話ができるという。
tottoは、黒柳さんを3Dカメラでスキャンし等身大の型を作成して作ったアンドロイド。黒柳さんの表情やしぐさ、癖なども再現しているほか、声は「徹子の部屋」42年分の会話データを基に音声合成技術を使って制作した。電通と電通テック、テレビ朝日、エーラボによる共同開発だ。
これまでにも対話はできていたが、人間のオペレーターがテキスト入力した内容を話す仕組みだった。今回、totto自らが相手に話しかけられるようになり、より自然な対話を実現したとしている。
ニューラルネットワークなどを用い、状況や文脈に合わせた幅広い話題で自律的なインタビューが可能になったという。相手の発話に対してリアルタイムで適切な応答を返したり、相手が話した内容に相づちを打ち、肯定的な発言を生成したり、相手の話に合わせて情報を聞き出したり、相手の質問に対応する応答を高精度に選択するといった技術を導入した。
「徹子の部屋」のコンテンツを基に、黒柳さんの声、話し方、動作なども忠実に再現。声は、「徹子の部屋」の音声を手がかりニューラルネットワークを学習させることで、どんなテキストでも黒柳さんの声にチューニングできるという。音声認識面では、ニューラルネットワークに基づく音響モデリングなどにより、さまざまな話題を高速・高精度に認識できるようにした。
相手がいつでも話しかけられる機能と、相手の発話が続くか終わるかをリアルタイムに判断する機能も持たせたほか、人間が会話する際の会話内容と頭の動き、視線、表情、手の動き、姿勢などの関係性を学習し、発話に合わせた自然なモーションを自動生成することも可能にしたという。
同技術を搭載したtottoとの対話を、「WorldRobotExpo」(10月17日〜21日、東京ビッグサイト)、「InterBEE」(11月14日〜16日、千葉・幕張メッセ)、「NTTR&Dフォーラム2018(秋)」(11月29日・30日、NTT武蔵野研究所)で体験できる。
同社はtottoへ導入した機能の一部をエンジン化した対話エンジンを開発しており、事業導入を目指している。今後は、バーチャルYouTuberや、既存のキャラクターとの対話サービスへの応用などを検討する。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR