東芝の音声AIが実現する“コミュニケーション革命” 〜何気ない会話を分析、業務効率化のヒントを抽出〜

» 2020年09月25日 10時00分 公開
[PR/ITmedia]
PR

 ビジネスの世界では近年、AI(人工知能)の業務利用が加速している。その背景には、機械学習・深層学習の発展による、音声認識、言語認識、画像認識の3技術の大きな進歩がある。AIを使った外国語の翻訳、音声データのテキスト変換、画像や動画の加工などのサービスに仕事で触れたことのある人は多いだろう。

 この他にも、工場での生産活動の効率化、マーケティングにおける消費者の行動予測、不動産の価格査定、農業における収穫時期や量の予測――など、AIが活躍するジャンルは、業種・業界を問わず多岐にわたる。

 一般消費者の生活でも、ユーザーが声をかけるだけで操作できるスマート家電やスマートスピーカーは人気だ。スマホの音声アシスタントは、すっかり我々の生活になじんでいる。将棋や囲碁、チェスなどのボードゲームでは、AIは人間が遠く及ばない存在に進化を遂げている。

 このように、人力では難しい作業や手間がかかる作業をAIに任せ、人はより成果を発揮できる仕事に専念したり、身近な機器の操作をAIでより簡単にしたり、高度な戦略立案をAIに任せたりする動きは、これからさらに加速するだろう。

「非接触」×「コミュニケーション革命」がコロナ禍での意思疎通を変える

 2020年春頃からは新型コロナウイルスの感染が拡大し、人々には他者と接触しないことが強く求められているが、AIはこうした「新しい生活様式」を便利にする可能性も秘めている。「特に音声AIは、これからのビジネスや日常生活において、人々の“伴走者”となって活躍するでしょう」と、東芝デジタルソリューションズの韮澤(にらさわ)義将氏(リカイアス事業推進部長)は予測する。

 韮澤氏によると、そう予測できる理由の1つに「音声AIが非接触コミュニケーションに適していること」がある。

photo 東芝デジタルソリューションズの韮澤義将氏(リカイアス事業推進部長)

 日常生活の面では、公共設備がスマート家電のように音声AIに対応した場合、口頭でエレベーターを呼んで行き先を指定したり、オフィスや店のドアを開けたり、乗り物のチケットを買ったりできる。こうした仕組みが社会に定着するにはもう少し時間がかかりそうだが、技術的には可能だ。不特定多数が触れる箇所への接触を避けられるので、感染リスクを下げる有用な手段になるだろう。

photo 音声AIは、コロナ禍での意思疎通を変える可能性を秘めている

 ビジネスの面において、音声AIはWeb会議の発言のテキスト化などで活躍しそうだ。参加者のWeb会議ツールのアカウントとAIを紐づけると、個々人を識別する技術的なハードルが下がるため、発話者ごとに発言内容を仕分けした形で、テキスト化が可能となる。

 商談をオンラインで行う場合は、営業担当者によるセールストークをリアルタイムでAIに聞かせ、誤った説明を行った場合などに自動でアラートを表示する使い方もできる。中でも、強いコンプライアンス管理が求められる金融・保険業界の商談では、重要事項の説明がルール通りに行われているかをAIに判定してもらうことも可能だろう。

 ビジネスシーンでこういった用途を実現する製品は、すでに世の中に出始めている。韮澤氏は「人と人が直接話さなくても、コミュニケーションログを残して分析することで、会議や商談の質は高められます。音声AIは“コミュニケーション革命”を起こす可能性を秘めています」と強調する。

東芝デジタルソリューションズのコミュニケーションAI「RECAIUS」とは

 韮澤氏が事業推進部長を務めるリカイアス事業推進部では、2015年にコミュニケーションAI「RECAIUS™(リカイアス)」をリリースし、以降5年間にわたって機能の追加や改善を進めている。

 「2015年はちょうど、IoTの重要性がビジネスの世界に認知された時期です。IoTの発展を目の当たりにして、音声もITの力を組み合わせることで、大きなメリットを生み出せるのではないかと気付きました。仕事で交わされている何気ない会話の中に、売上増や業務効率化、経営の改善に直結するヒントが潜んでいるのであれば、それをAIの力で明らかにしたいと考えたのが開発のきっかけです」と韮澤氏は明かす。

 そうして生み出されたRECAIUSは、「音声合成」「音声認識」「音声対話」「知識処理」などの要素技術から成り立っている。これまで東芝グループが50年以上にわたって培ってきた技術を結集した形だ。

 東芝デジタルソリューションズでは現在、これらの技術を組み合わせ、合成音声を使った会話や、音声認識によるテキスト化など、音声に関する約15種の法人向けサービスを提供している。提供形態はSaaS型や組み込み型など多岐にわたり、顧客のさまざまなニーズに応えるラインアップをそろえている。

photo 「RECAIUS」は、仕事中の会話から「ナレッジ」を集める機能を持つ

 「使い方はさまざまですが、話し言葉をそのまま文字に起こすのではなく、話者の意図をくんだ形で音声をテキスト化したり、会話の中で同じキーワードが繰り返されている場合にアラートを出し、何らかの問題が潜んでいることに気付かせたりできます」(韮澤氏)

 韮澤氏らの熱い思いから開発されたRECAIUS。このサービスは、具体的にどんなものがあるのだろうか。

人間そっくりな合成音声を実現

 韮澤氏がサービスの代表例として紹介したのが、RECAIUS音声合成ミドルウェア「ToSpeak™」だ。ToSpeakは、実際に人が読み上げているかのような滑舌や抑揚などを再現し、自然な音声発話ができるのが特長。ユーザーは多様な電子デバイスにToSpeakを組み込み、発話機能を追加できる。

 合成音声を生成する上では、ベースとなる人の声を収録する必要があるが、ToSpeakは短時間の収録で人の声から合成音声を生成し、メモリサイズが小さな機器でも高音質を実現する。また、性別や年齢、感情表現の種類を問わず、さまざまなカスタムボイスを生成できる。

photo デバイスに自然な合成音声を組み込めるRECAIUS音声合成ミドルウェア「ToSpeak」

 AIが合成音声を発話する際は、声のトーン、読み上げる速度、抑揚を調節することで、話し方を人間に近づけている。「声優さんが話しているのを録音したのか、と言われるほどの品質を確保しています」と韮澤氏は胸を張る。

 現在は多くの企業で使われており、韮澤氏は「複数の国内メーカーのカーナビや、スマホ・タブレット向けアプリケーションに採用いただいています。大手カラオケ事業者の機器にもToSpeakを提供し、声優さんの生声を音声合成で再現した上で、お客さんと会話してカラオケを盛り上げる仕組みを構築しました」と明かす。

コンタクトセンターの接客を“可視化”

 ToSpeakは「人とシステム」のコミュニケーションの質を高められるツールだが、RECAIUSでは「人と人」のやり取りを効率化するサービスも提供している。その1つが「RECAIUSコンタクトセンタープラス」。その名の通り、コンタクトセンターを中心に展開している業務支援パッケージで、音声認識と知識処理技術を組み合わせたものだ。

 主な機能は(1)オペレーターと顧客の会話を自動でテキスト化する機能、(2)あらかじめ登録したキーワードが会話に登場した時に、自動でアラートを表示して注意を促すなどオペレーターを支援する機能、(3)やり取りの内容を要約・分析といったスーパーバイザーをサポートする機能――など。いずれも、接客の質の向上に活用できる。

photo オペレーターの応対品質を改善する「RECAIUSコンタクトセンタープラス」

 「コンタクトセンターの中には、オペレーターが電話対応を終えた後、会話の内容を記録しているところがあります。場合によっては、顧客との会話を録音した音声を聞き直す必要があり、繁忙期にはオペレーターへの負荷が増大します。RECAIUSコンタクトセンタープラスを使えば内容を自動で記録できるので、この手間を解消できます」と韮澤氏は説明する。

 実際に、RECAIUSコンタクトセンタープラスを導入している大手ITベンダーのコンタクトセンターでは、録音の聞き直し作業が大幅に減少。業務の効率化を実現しているという。同サービスには、AIが書き起こしたテキストの内容を検索できる機能もあり、過去の会話を振り返れるので、顧客対応の改善点を洗い出す作業にも一役買っているという。

ホテルスタッフの業務連絡を効率化

 RECAIUSは接客だけでなく、従業員間の意思疎通においても効果を発揮する。「RECAIUSフィールドボイスインカム」は、複数のユーザーがスマホに専用アプリをインストールすると、ユーザー同士でスマホをインカムやトランシーバーのように活用できるサービスだ。

 アプリを使ってコミュニケーションを取るだけでなく、AIに合成音声でテキストを読み上げさせることも可能。合成音声による読み上げは、多くのユーザーに一括で業務連絡を行う場合などに活用する。

 さらに、会話の履歴は全てテキスト化され、画面上に表示されるので、スタッフはスマホを確認するだけで聞き間違いを防止できる。「一般的なトランシーバーやインカムを使っていたホテルで導入いただき、業務連絡の精度向上に貢献しています」と韮澤氏は明かす。

photo 顧客対応におけるチームワークを改善する「RECAIUSフィールドボイスインカム」

 導入先のホテルではかつて、トランシーバーやインカムでスタッフ同士が連絡を取り合う際、作業の手を止めて機器を操作する必要があり、作業効率の低下を招いていた。聞き間違いを防ぐには、メモを取ったり、口頭で聞き直したりするしかなかった。フロント担当者がホテル内で働くスタッフに連絡する際は、通話している姿が宿泊客の目に入らないよう、いったんバックヤードに下がってからトランシーバーで連絡していた。

 一方、RECAIUSフィールドボイスインカムの導入後は、業務用スマホに話しかけるだけで同僚と意思疎通が図れる他、画面を見るだけでやり取りの内容を確認できるので、これらのプロセスを大きく短縮。後からテキストベースでスタッフ同士のコミュニケーションを振り返り、改善点を洗い出して業務に生かせるようになった。

 フロントと現場の意思疎通についても、フロント担当者がRECAIUSフィールドボイスインカムの機能を使って、フロントにいながら業務用PCによるテキスト入力で合成音声を生成。現場スタッフのスマホに音声で指示を送る運用に変更したため、バックヤードに下がる手間はなくなったという。

より深い“ビジネス・インサイト”の発見を目指す

 RECAIUSはこれらに加え、営業担当者が音声入力で日報を作成できる「RECAIUS報告エージェント」、作業員の両手がふさがりがちな現場などで、音声による機器操作を実現するRECAIUS音声認識ミドルウェア「ボイストリガー」など、豊富なサービスを用意している。

 「仕事における会話中には、このように、チームワークや生産性の強化に役立つ要素が隠されています。RECAIUSはこれからも業界や企業規模を問わず、コミュニケーションに課題を抱える企業を支援していきます」と韮澤氏は語る。

photo 東芝デジタルソリューションズは、RECAIUSのさらなる進化を目指していく

 韮澤氏らは今後も、RECAIUSの分析精度の強化や新サービスの開発に取り組んでいく。「優秀なセールスパーソンの話術に隠れている暗黙知をAIによって導き出し、本人も気づいていない“売れる要素”を浮き彫りにするような、セールステック領域のサービスを拡充したいと考えています。これを実現し、形式知を社内で共有して後進の育成に役立ててもらえるようにします」と同氏は意気込んでいる。

 AIが注目を集め始めた数年前は「AIは人の仕事を奪うのでは」と危惧する声もあったが、RECAIUSのような音声AIは、ビジネスパーソンの“伴走者”として、何気ない会話を仕事に役立つものに変えてくれる。RECAIUSはこれからも多くの企業の課題を解決し、ビジネスの付加価値を高めていくだろう。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:東芝デジタルソリューションズ株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2020年10月21日

関連リンク