ChatGPT「高度な音声モード」で何ができる? 使ってみて感じたメリット:その悩み、生成AIが解決(1/2 ページ)
ChatGPTの「高度な音声モード」のα版が一部の有料プランユーザーを対象に順次提供されている。従来の音声モードとの違い、活用できるシーンを紹介しよう。
連載:その悩み、生成AIが解決
アイデアが浮かばない、こんな無駄な作業なくしたい――。ビジネスパーソンを悩ませる日々のさまざまな困りごと、ChatGPTに聞いてみませんか? ITジャーナリストの酒井麻里子氏がプロンプトの書き方を伝授する。
Q.徒歩移動の時間を有効活用したいと思っています。スマホなどの画面を見ずに、ChatGPTとブレストできる方法はありますか?
ChatGPTの「高度な音声モード(advanced Voice Mode)」の、有料ユーザへの提供が開始された。タイムラグの少ないスムーズな会話ができることで、活用の幅は大きく広がる。従来の音声モードとの違いや活用できるシーンを紹介しよう。
著者プロフィール:酒井麻里子(さかい・まりこ)
ITジャーナリスト/ライター。生成AIやXR、メタバースなどの新しいテクノロジーを中心に取材。その他、技術解説やスマホ・ガジェットなどのレビューも。著書に『趣味のChatGPT』(理工図書)、『先読み!IT×ビジネス講座ChatGPT』(共著・インプレス)など。Yahoo!ニュース公式コメンテーター。株式会社ウレルブン代表。XRと最新テクノロジーのWEBマガジン「TechComm-R」運営。
応答速度が向上 会話の割り込みも可能に
「高度な音声モード」は、米OpenAIが2024年5月に実施したイベントでデモを披露し、通訳や声のトーン変更、カメラで映した映像の認識などを行う様子が話題となった。
この機能は夏頃から一部ユーザーへの試験提供が行われており、筆者の手元では8月中旬から使える状態になっていた。従来はスマホアプリの画面右下に表示されているヘッドホンのアイコンから音声モードを起動できたが、新しい音声モードは、ここが波形アイコンに変わる。音声対話の画面上部に表示されるプルダウンからは、従来の音声モードとの切り替えも可能だ。
使ってみてまず感じるのが、会話のスムーズさだ。従来の音声モードは、話しかけてから回答が返ってくるまでに数秒かかっていた。また、AIが回答している途中に話しかけても認識されないため、続きの指示や質問をするには回答が完全に終わるまで待つ必要があった。つまり、テンポが遅く、少々まどろっこしい会話しかできなかったのだ。
「高度な音声モード」は、返答までの時間が大きく短縮されている。さらに、回答の途中でこちらが話し始めると回答を中断する“割り込み”も可能になったので、回答が的外れだと感じたらその時点で指示をし直すといったこともできる。全体的に会話のテンポが早くなり、より人間同士の会話に近い感覚で話せるようになった印象だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
さらば文字起こし! 生成AIで「議事録作成」をラクにするポイントは?
連載「その悩み、生成AIが解決」番外編は、文字起こしツールの進化や、文字起こしデータからChatGPTなどで議事録を作成する場合のポイントなど、音声文字起こしについて、今知ってしておきたいトピックを解説する。
GPT-4oは無料でどこまで使える? 検証して分かったこと
2024年5月に登場したGPT-4oは、無料プランのユーザーにも回数などの制限つきで開放された。無料でどこまでできるのか、あらためて整理する。
超時短! GPTsでプレゼン資料を作る方法【前編】
PowerPointファイルでプレゼン資料を作る作業負担を減らしたい――。無料ユーザーにも回数制限付きで開放された「GPTs」を使えば、負担を一気に軽減できる。
GPTsでスライド作成 パワポのデータ出力手順は?【後編】
無料版GPTsでプレゼン資料を作る方法【後編】では、GPTsを使ってPowerPointファイルのデータを出力する手順を見ていく。
超簡単! 無料開放の「GPTs」で社内用FAQを作る方法
社内問い合わせの対応が面倒くさい……ならばAIで自動化してみよう。無料ユーザーにも機能が開放されることになった「GPTs」の機能で、オリジナルのチャットを作成する方法とは。

