ChatGPTの登場以降、テキストベースのAI活用は日常化しました。そして今「テキストの次」、すなわち「リアルタイム音声対話AI」へのシフトが加速しています。一方で、実際にビジネス現場へ導入しようとすると、そこには「精度の壁」「感情表現の壁」といった技術的・実務的な課題が立ちはだかります。
音声AIは単なるインターフェースを超え、自律的に動くAIエージェントとして社会インフラになり得るのでしょうか?
AICX協会代表理事の小澤健祐氏に「声をインターフェースにした顧客体験」の現在地と、今後の展望を聞きました。聞き手は音声AIスタートアップのVerbex(東京都渋谷区)代表の森下将憲氏。前後編でお届けします。
写真左:小澤健祐(おざわ・けんすけ)企業におけるAIエージェントの実装を支援し、顧客体験と業務効率の抜本的な改善を目指す一般社団法人AICX(AI Customer Experience)協会の代表理事。年間300〜400回程講演を実施。『生成AI導入の教科書』や『AIエージェントの教科書』など2冊を出版。AICX協会では、防衛装備庁と一緒にAIエージェントの実証実験や、ドクターズという医療系PaaSをやっている会社とパートナーシップを締結して新たな医療ヘルスケアAIによるエコシステムの創出に向けた共創プロジェクトを開始している(写真右は筆者。以下Verbex撮影)森下: 音声AIが求められる背景や現状をどう見ていますか?
小澤: ChatGPTにも音声で対話する機能はありますが、音声を一旦文字にして処理をするという変換でした。それがGPT-4oの時から、音声をそのまま処理できるようになっています。そして、今まで欠けていた感情や抑揚、話すスピードといったテキスト以外のニュアンスまで取り込み、処理できるように進化してきています。
リアルタイムの音声処理はスマートスピーカーの時代からありましたが、当時はほとんどがルールベースと辞書処理で実現されていたので、”対話”というには少し違和感がありました。ただ今はAIの盛り上がりもあり、2026年はリアルタイム音声AIが起爆剤になる1年になっていくのではと思っています。
森下: LLM(大規模言語モデル)の技術が改善し、気持ちのいい対話ができる音声AIが出てきています。それとは別に、人間にとって音声が“楽”という潜在的ニーズがずっとあると思っています。
メッセージアプリだと、テキストを打つのは結構大変なので、スタンプを多用するなど、インターネット上の情報からテキストが減っています。よりイージーなコミュニケーション手法に移ってきています。音声が楽、という背景は非常に大きい要素だと思っており、技術の進歩と合わせて「爆発的に普及する」状況になってくるように思っています。
小澤: 実際、最近はタイピングが苦手になってきている気がしますね。イヤホンを使えば、周囲のノイズをカットして私の声しか拾わないので、駅のホームでもどんなところでも、恥ずかしがらずに音声入力を利用しています。
例えば製造現場でも、作業をしている人が全員イヤホンマイクをつけていて「目の前でこの部品がこうなっているんだけどどうしたらいいですか?」と問い合わせると。AIが「それはこうしてください」と回答する。こんな状況も近い将来ありうるかなと感じています。
小澤: 市場的には、テキストAIが飽きられてきていて、次を探しているという背景もあります。AIエージェントの技術が入ってくるなかで、人間とのインターフェースが重要になってきますよね。細かく指示しなくても勝手にやってくれるわけですから、人間とのインターフェースもチャットだけではなく「人間が使用する上で、いかに自然でストレスなくAIに指示できるのか」というUXが、求められるようになってきているというのが本質だと思います。
今までのプロンプトエンジニアリングは、タスクの内容を人間が考えて指示をしていました。AIエージェントになると、そこを人間が考える必要がなくなります。そうなってくると、今度はいかに使いやすく人間社会の中に溶け込ませるのかが重要になってきます。その際には音声AIを活用したインターフェースがほぼ確実になってくるでしょう。
株式会社Verbex 代表取締役CEO。2010年、Design & Technology FirmであるEverforthを創業。2018年、EverforthをWingArc1stに売却後もEverforthを牽引(けんいん)しつつ、複数のスタートアップを創出し続けるシリアル・アントレプレナー。2024年、株式会社Verbex 日本法人のCEOと、グローバル全体のCOOに就任。「声で世界をつなぐ」というビジョンを掲げ、VoiceUIの社会実装に向け音声対話AIの事業創造に取り組んでいる。
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
ANAは座席指定不可、JALは変動制マイルへ 苦境の国内線“値上げとサービス制限”の真相
ソニー半導体「27歳営業リーダー」の仕事術 なぜストーリー作りを重視するのか
ソニー平井元CEOが語る「リーダーの心得5カ条」 若くして昇進した人は要注意
28歳エンジニアがリーダー “爆速”で作った「AIワークフロー」がスゴイ
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング