2015年7月27日以前の記事
検索
連載

ChatGPT「高度な音声モード」で何ができる? 使ってみて感じたメリットその悩み、生成AIが解決(2/2 ページ)

ChatGPTの「高度な音声モード」のα版が一部の有料プランユーザーを対象に順次提供されている。従来の音声モードとの違い、活用できるシーンを紹介しよう。

Share
Tweet
LINE
Hatena
-
前のページへ |       

「会話でのブレスト」がしやすくなった

 タイムラグの少ない会話ができるようになったことで、音声会話モードを活用できる場面は増えそうだ。多くのユーザーがメリットを実感できるのは「ながら利用」かもしれない。

 例えば、徒歩移動中や自宅で家事をしている時間、会話のできる程度の軽い運動をしているときなど、「スマホ操作はできないものの、モノを考えることはでき、耳が空いている」という状況で音声モードを立ち上げれば、ChatGPT相手にアイデア出しのブレストを行うことが可能になる。

 よいアイデアは、デスクの前にいるときではなく、他のことをしているときに浮かんだりするものだ。そんな“思いがけないタイミングでのひらめき”が生まれる助けになってくれるかもしれない。


左が聞き取り状態、右が回答中の画面。回答中でも話しかければ自動で聞き取り状態に切り替わる

通訳や話し方のトーン変更などもできる

 「高度な音声モード」は、応答速度以外にもさまざまなアップデートが行われている。例えば「今から私の話すことを英語に通訳してください」と指示してから話し始めれば、リアルタイムで通訳をしてくれる。

 また「5歳の男の子のように」「老婆のように」などの指示をすることで、回答時の話し方や声のトーンを変えることも可能だ。

 話し方の変更は、言い回しや語尾だけでなく、声の高さや話すスピードも指示した属性に合わせたものになる。好きなキャラクターになってもらって会話をするなど、いろいろと楽しい使い方ができそうだ。


通訳の指示(左)と、話し方の変更(右)の会話履歴。「ギャル」は語尾を伸ばし気味に話すなど再現度も高い

 OpenAIの公式Xの投稿によると、高度な音声モードは9月25日よりロールアウトが開始され、「今週中にすべてのPlusユーザーとTeamユーザーに展開される」とのことだ。なお、スマホのカメラで取得したリアルタイム映像に基づいて会話をする機能はまだ利用できず、まずは音声での会話のみとなる。

 ChatGPTのライバルともいえるGoogleのGeminiも、音声会話機能「Geminiライブチャット」の英語での提供を9月から開始している。今後は、生成AIとのやりとりに音声が使われるのが当たり前になっていくのかもしれない。

Copyright © ITmedia, Inc. All Rights Reserved.

前のページへ |       
ページトップに戻る