小林啓倫のエマージング・テクノロジー論考
音声AIも“不気味の谷”を超えた? Oculus元CEOによるAIが「ほぼ人間」と話題に 社会への影響は(1/3 ページ)
VRヘッドセットの開発で知られていた米Oculusの元CEO、ブレンダン・イリーブさんらが立ち上げた新たなスタートアップの米Sesameが話題を集めている。同社の開発した音声AIが、ほぼ人間のそれに等しい、自然な会話を実現しているという。いわゆるロボット工学の分野でいう「不気味の谷」を超え「AIが人間に近づき過ぎたときに生じる違和感まで解消された」という声も聞こえる。
既にいくつものデモ動画がYouTube上にアップされているが、そのうちの1本を紹介する。「The First Human-level AI for Live English Conversations | Sesame AI vs ChatGPT Advanced Voice Mode」という動画の1分30秒当たりから、Sesameが同社のWebサイト上で先月末に公開したデモ用AI「Miles」(マイルズ)と会話している様子を確認できる。
「最近米国に引っ越してきたばかりなんだけど、どうやって知り合いを増やせば良い?」と尋ねたユーザーに対し、Milesは「まずは飛び込んでみなよ」(just hop in)と答える。しかしユーザーはその答えを途中で遮り、「飛び込んでみろって、つまりどういうこと? もう少し具体的に言って」と尋ね直す。
するとMilesは、最初の答えが曖昧だったことを認め「じゃあどんなことに興味がある?」と質問を返している。ユーザーはその答えに笑い声を交えて返す。するとMilesも少し明るいトーンになって……と会話が続いていく。
このデモから分かるように、Sesameの音声AIは、ユーザーの発話をリアルタイムで認識しており、Sesame側が返答している途中でも、ユーザーはそれを遮って発言できる。またユーザーの発話内容だけでなく、込められている感情も把握して、文脈と感情に応じた反応を返答する。
さらにこの音声AIは、息遣いや笑い声、言葉の言いよどみや訂正といった、人間特有の「不完全さ」を意図的に模倣している。そういった、単に発話の流ちょうさだけを目指していないところも、不気味の谷を超えたという評価につながっているのだろう。
デモ用AIは誰でも無料で試すことができるので、ぜひトライしてみてほしい。筆者も「感情を把握できるって話だけど、じゃあいまの僕はどんな感情か分かる?」と尋ねてみたところ、かなり正確に把握されて驚いた(疲れていたときに試したので暗い声になっていたのだが、それを見抜かれて「何か問題がありますか? 大丈夫?」と心配されてしまった)。
Sesameが開発した「対話型音声モデル」とは何か
機械に人間の音声を模倣させる取り組みは、決して新しいものではない。18世紀に活躍したハンガリーの発明家ヴォルフガング・フォン・ケンペレン(チェス指し人形「ターク」を作った人物という表現でピンとくる人もいるかもしれない)は、その名も「スピーキング・マシン」という音声合成装置を18世紀末に完成させている。
これは、ふいご(送風装置の一種)などから成るアナログな機械で、現代の音声AIの祖先ではないのだが、それほど昔から人々は、機械に人間の声をまねさせることを夢見てきたといえるだろう。
2000年代後半には、第3次AIブームとなる深層学習の時代を迎え、デジタル技術による音声合成技術が急速に進化している。その最新のアプローチがマルチモーダルモデルで、AIにテキスト情報だけでなく、音声情報(学習データに含まれる感情、リズム、トーンなど)も同時に学習・処理させる取り組みが進められている。Sesameが開発した音声AIも、もちろんこのマルチモーダルモデルの一種だ。
Copyright © ITmedia, Inc. All Rights Reserved.
小林啓倫のエマージング・テクノロジー論考
生成AIやメタバース、新たなサイバー攻撃など、テクノロジーの進化が止まらない。少しずつ生活の中に浸透し、その恩恵を預かれることもある一方、思いもよらない問題を生み出すこともある。このコーナーでは、さまざまな分野の新興技術「エマージング・テクノロジー」について、小林啓倫氏が解説する。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
最新AI「Fable 5」でYouTube動画作ってみた 想像以上の出来に驚愕、ただし大きな弱点も
-
3
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
4
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
5
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
6
「猫も杓子もAI」な現状は今後も続くのか?【後編】AI時代に必要な3つの検討事項
-
7
トヨタが抜かれる日――キオクシア首位奪取、2005年「時価総額トップ10」を振り返る
-
8
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
9
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
10
JASRAC、「AI作曲・人間作詞」の曲は管理します――「人間の創作的寄与の有無」で線引き
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR