検索
レビュー

「怒鳴り声を穏やかにするAI」に本気で怒鳴ってみた カスハラ対策で話題の技術、どんな声色になる?

「怒鳴り声を穏やかにするAI」に本気で怒鳴ってみたら、どんな声に変換されるんだろう──ソフトバンクの協力を得て、実際に試してみた。

Share
Tweet
LINE
Hatena

 AI、中でも音声関連AIの有効な用途として、電話越しの怒号を穏やかなものに変える使い方がある。コールセンターなどで活用が期待されるもので、2月2日にはソフトバンクがサービス化を発表。カスタマーハラスメントの対策ソリューション「SoftVoice」として提供を開始した。

 この話を聞けば誰しもが考えるはず。「こういうAIに思いっきり怒鳴ったら、どんな声に変換されるんだろう」──今回、SoftVoice開発陣の協力を得て、この思い付きを実際に試してみた。果たして筆者の怒号はどれだけ穏やかになるのか。

「怒鳴り声を穏やかに」ソフトバンクのSoftVoiceとは

 まず、SoftVoiceがどんなサービスか整理しておく。SoftVoiceはPCなどにインストールした専用ソフトを通し、インターネット回線を使って通話するソフトフォン向けサービスだ。ノートPCのCPUもしくはGPUで動作する軽量な音声変換AIで、コールセンターのオペレーターなどの操作に応じて顧客の声を変換。発言内容は変えず、声色だけを穏やかなものにする。

 オペレーター側は、変更先の声質を最大150種類から選んで変更できる他、抑揚も0.1〜1の10段階で調整できる。顧客との通話が長時間に及んだり、暴言や脅迫的な表現が続いたりする場合警告メッセージを流す機能もある。オペレーターから現場の管理者に警告メッセージの送信を依頼し、管理者が承認することで警告が流れ、状況に応じて3段階の警告レベルを使い分けられる。料金(税別)は、10IDで月額5万円。

photo
UIのイメージ(同社提供、以下同)

本気で怒鳴ってみた 声のビフォーアフター

 今回の検証はソフトバンクのオフィスで実施。スマートフォンに怒鳴り散らし、その音声がどのように変換されるか確かめた。実際の様子や音声は下記の動画からご覧いただきたい。

今回体験した変換は一例で、実際はもっと平たんにしたり、違った声に変換したりすることも可能という

 実際に試した記者としては、全力で怒鳴ったつもりの声が、思っていたより平たんな声色に変わってびっくりした。大声で威圧するようなニュアンスは確かに薄くなる。ただ、あくまで声色や抑揚を変えるだけなので、口調や発言内容に由来する高圧的な印象はそこまで緩和できないようにも感じた。例えば淡々となじられる場合などは、あまり効果が実感できないかもしれない。

photo
発話中の音声波形

 一方で、体感だが遅延は少ない。普通の電話と変わらない程度だ。もともとはクラウド型のAIを使って音声をテキスト化し、それを読み上げるアプローチも検討していたが、遅延が大きく断念。テキストの読み上げではなく、音声の音素やイントネーション、周波数を把握するAIモデルと、それらを基に音声を合成するAIモデルを開発し、それぞれを軽量化するアプローチで低遅延化を実現したという。

photo

現場の声取り入れさらに改善へ

 開発に携わった中谷敏行さん(AIテクノロジー本部AI&データ事業推進統括部担当部長)と今村俊雄さん(先端技術研究所先端技術開発部NTN通信開発課)によれば今後、同社はクラウドPBXベンダーとの連携を強化しSoftVoiceの展開を進めていく方針だ。

 同様の技術は他社も開発を進めているが、電話音声を安定して変換可能かつ、一般的な社用PCのCPUでも動く軽量なAIモデルの開発は容易ではないと今村さんは意気込む。ただし、具体的な販売目標などは伏せた。

 一方で、サービスには手を入れたい点がまだまだあると中谷さん。例えば変換の精度を上げるために、AIが苦手とする音をしぼり込んだり、抑揚の加減をもっと調整したりと、現場のフィードバックを得ながら改善したい点が複数あるといい、利用者の声を聞きつつ対応を進めていく考えだ。

経営×IT×事業のコラボで導くデジタル基点のビジネス改革

経営層とIT部門、そして現場業務を担う事業部門の視点を合わせ、デジタル戦略の解像度を高めるためにはどうすればいいのでしょうか。本イベントでは、ビジネストレンドを整理しながら、今知りたい経営×IT×事業のコラボレーションで全社の変革を進めるためのヒントをお届けします。

photo

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る