2015年7月27日以前の記事
検索
連載

ChatGPT「高度な音声モード」で何ができる? 使ってみて感じたメリットその悩み、生成AIが解決(1/2 ページ)

ChatGPTの「高度な音声モード」のα版が一部の有料プランユーザーを対象に順次提供されている。従来の音声モードとの違い、活用できるシーンを紹介しよう。

Share
Tweet
LINE
Hatena
-

連載:その悩み、生成AIが解決

アイデアが浮かばない、こんな無駄な作業なくしたい――。ビジネスパーソンを悩ませる日々のさまざまな困りごと、ChatGPTに聞いてみませんか? ITジャーナリストの酒井麻里子氏がプロンプトの書き方を伝授する。

Q.徒歩移動の時間を有効活用したいと思っています。スマホなどの画面を見ずに、ChatGPTとブレストできる方法はありますか?

 ChatGPTの「高度な音声モード(advanced Voice Mode)」の、有料ユーザへの提供が開始された。タイムラグの少ないスムーズな会話ができることで、活用の幅は大きく広がる。従来の音声モードとの違いや活用できるシーンを紹介しよう。


生成AIとのやりとりは音声が当たり前に? 写真はイメージ(ゲッティイメージズ)

著者プロフィール:酒井麻里子(さかい・まりこ)

ITジャーナリスト/ライター。生成AIやXR、メタバースなどの新しいテクノロジーを中心に取材。その他、技術解説やスマホ・ガジェットなどのレビューも。著書に『趣味のChatGPT』(理工図書)、『先読み!IT×ビジネス講座ChatGPT』(共著・インプレス)など。Yahoo!ニュース公式コメンテーター。株式会社ウレルブン代表。XRと最新テクノロジーのWEBマガジン「TechComm-R」運営。


応答速度が向上 会話の割り込みも可能に

 「高度な音声モード」は、米OpenAIが2024年5月に実施したイベントでデモを披露し、通訳や声のトーン変更、カメラで映した映像の認識などを行う様子が話題となった。

 この機能は夏頃から一部ユーザーへの試験提供が行われており、筆者の手元では8月中旬から使える状態になっていた。従来はスマホアプリの画面右下に表示されているヘッドホンのアイコンから音声モードを起動できたが、新しい音声モードは、ここが波形アイコンに変わる。音声対話の画面上部に表示されるプルダウンからは、従来の音声モードとの切り替えも可能だ。


従来の音声モードと、新しい「高度な音声モード」が切り替えられる

 使ってみてまず感じるのが、会話のスムーズさだ。従来の音声モードは、話しかけてから回答が返ってくるまでに数秒かかっていた。また、AIが回答している途中に話しかけても認識されないため、続きの指示や質問をするには回答が完全に終わるまで待つ必要があった。つまり、テンポが遅く、少々まどろっこしい会話しかできなかったのだ。

 「高度な音声モード」は、返答までの時間が大きく短縮されている。さらに、回答の途中でこちらが話し始めると回答を中断する“割り込み”も可能になったので、回答が的外れだと感じたらその時点で指示をし直すといったこともできる。全体的に会話のテンポが早くなり、より人間同士の会話に近い感覚で話せるようになった印象だ。

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る