「プロンプト」はもういらない キーボードを使わない「音声AIエージェント」が“必然”となる理由
音声AIは単なるインターフェースを超え、自律的に動くAIエージェントとして社会インフラになり得るのでしょうか? AICX協会代表理事の小澤健祐氏に「声をインターフェースにした顧客体験」の現在地と、今後の展望を聞きました。聞き手は音声AIスタートアップのVerbex(東京都渋谷区)代表の森下将憲氏。
ChatGPTの登場以降、テキストベースのAI活用は日常化しました。そして今「テキストの次」、すなわち「リアルタイム音声対話AI」へのシフトが加速しています。一方で、実際にビジネス現場へ導入しようとすると、そこには「精度の壁」「感情表現の壁」といった技術的・実務的な課題が立ちはだかります。
音声AIは単なるインターフェースを超え、自律的に動くAIエージェントとして社会インフラになり得るのでしょうか?
AICX協会代表理事の小澤健祐氏に「声をインターフェースにした顧客体験」の現在地と、今後の展望を聞きました。聞き手は音声AIスタートアップのVerbex(東京都渋谷区)代表の森下将憲氏。前後編でお届けします。
写真左:小澤健祐(おざわ・けんすけ)企業におけるAIエージェントの実装を支援し、顧客体験と業務効率の抜本的な改善を目指す一般社団法人AICX(AI Customer Experience)協会の代表理事。年間300〜400回程講演を実施。『生成AI導入の教科書』や『AIエージェントの教科書』など2冊を出版。AICX協会では、防衛装備庁と一緒にAIエージェントの実証実験や、ドクターズという医療系PaaSをやっている会社とパートナーシップを締結して新たな医療ヘルスケアAIによるエコシステムの創出に向けた共創プロジェクトを開始している(写真右は筆者。以下Verbex撮影)
「テキストよりも音声が楽」 人間本来のニーズが商機に
森下: 音声AIが求められる背景や現状をどう見ていますか?
小澤: ChatGPTにも音声で対話する機能はありますが、音声を一旦文字にして処理をするという変換でした。それがGPT-4oの時から、音声をそのまま処理できるようになっています。そして、今まで欠けていた感情や抑揚、話すスピードといったテキスト以外のニュアンスまで取り込み、処理できるように進化してきています。
リアルタイムの音声処理はスマートスピーカーの時代からありましたが、当時はほとんどがルールベースと辞書処理で実現されていたので、”対話”というには少し違和感がありました。ただ今はAIの盛り上がりもあり、2026年はリアルタイム音声AIが起爆剤になる1年になっていくのではと思っています。
森下: LLM(大規模言語モデル)の技術が改善し、気持ちのいい対話ができる音声AIが出てきています。それとは別に、人間にとって音声が“楽”という潜在的ニーズがずっとあると思っています。
メッセージアプリだと、テキストを打つのは結構大変なので、スタンプを多用するなど、インターネット上の情報からテキストが減っています。よりイージーなコミュニケーション手法に移ってきています。音声が楽、という背景は非常に大きい要素だと思っており、技術の進歩と合わせて「爆発的に普及する」状況になってくるように思っています。
小澤: 実際、最近はタイピングが苦手になってきている気がしますね。イヤホンを使えば、周囲のノイズをカットして私の声しか拾わないので、駅のホームでもどんなところでも、恥ずかしがらずに音声入力を利用しています。
例えば製造現場でも、作業をしている人が全員イヤホンマイクをつけていて「目の前でこの部品がこうなっているんだけどどうしたらいいですか?」と問い合わせると。AIが「それはこうしてください」と回答する。こんな状況も近い将来ありうるかなと感じています。
プロンプトエンジニアリング終わるのか?
小澤: 市場的には、テキストAIが飽きられてきていて、次を探しているという背景もあります。AIエージェントの技術が入ってくるなかで、人間とのインターフェースが重要になってきますよね。細かく指示しなくても勝手にやってくれるわけですから、人間とのインターフェースもチャットだけではなく「人間が使用する上で、いかに自然でストレスなくAIに指示できるのか」というUXが、求められるようになってきているというのが本質だと思います。
今までのプロンプトエンジニアリングは、タスクの内容を人間が考えて指示をしていました。AIエージェントになると、そこを人間が考える必要がなくなります。そうなってくると、今度はいかに使いやすく人間社会の中に溶け込ませるのかが重要になってきます。その際には音声AIを活用したインターフェースがほぼ確実になってくるでしょう。
著者紹介:森下将憲(もりした・まさのり)
株式会社Verbex 代表取締役CEO。2010年、Design & Technology FirmであるEverforthを創業。2018年、EverforthをWingArc1stに売却後もEverforthを牽引(けんいん)しつつ、複数のスタートアップを創出し続けるシリアル・アントレプレナー。2024年、株式会社Verbex 日本法人のCEOと、グローバル全体のCOOに就任。「声で世界をつなぐ」というビジョンを掲げ、VoiceUIの社会実装に向け音声対話AIの事業創造に取り組んでいる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
米国のテック系人気ユーチューバーの何人かが、こぞって「AI開発競争はGoogleが勝利した」という見出しの動画をアップしている。これでGoogleの勝利が決定したのかどうか分からないが、少なくともOpenAIの首位独走の時代は終わったのかもしれない。
ANAは座席指定不可、JALは変動制マイルへ 苦境の国内線“値上げとサービス制限”の真相
ANAは大胆な運賃体系の変更に踏み切り、JALは顧客への寄り添いを重視する戦略を取っている。目前に迫る「史上空前の燃料高騰」が浮き彫りにした国内線ビジネスの限界とは? “運賃値上げ”を見据えた両社の生存戦略を分析する。
ソニー半導体「27歳営業リーダー」の仕事術 なぜストーリー作りを重視するのか
センサー技術を得意とするソニーセミコンダクタソリューションズは、AIを駆使したエッジAIセンシングプラットフォーム「AITRIOS(アイトリオス)」を展開。その最前線で働く27歳の深山大輔さんに、社内の調整や顧客との交渉を通して最適解を生み出す醍醐味を聞いた。
ソニー平井元CEOが語る「リーダーの心得5カ条」 若くして昇進した人は要注意
ソニーグループを再生させた平井一夫元社長兼CEOが自ら実践し、体験を通じて会得したビジネスリーダーに必要な要件とは?
28歳エンジニアがリーダー “爆速”で作った「AIワークフロー」がスゴイ
SaaSの開発・販売を手掛けるサイオステクノロジーは、ワークフローシステム「Gluegent Flow」で、生成AIを活用したユーザーアシスト機能をリリースした。開発に携わったプロダクトマネージャと、発案者としてプロジェクトリーダーを務めた28歳エンジニアに舞台裏を聞いた。
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因
生産性の低さが指摘されている日本。人口減少が追い打ちをかける中で、現状を打開するためには、どうしたらいいのか。企業はAIをどのように使いこなしていくべきなのか。オードリー・タンさんに聞いた。

