速報
OpenAI、5月に予告したChatGPTの高度な音声モード提供を延期
OpenAIは、「GPT-4o」発表イベントで予告した高度な音声モードの提供開始時期を、当初の6月下旬から延期すると発表した。「リリースの基準に達するまでにあと1カ月必要」としている。
米OpenAIは6月25日(現地時間)、5月の発表イベントで予告したChatGPTアプリのGPT-4oベースの新しい高度な音声モードのα版提供開始を、当初の6月下旬から延期すると発表した。「リリースの基準に達するまでにあと1カ月必要」としている。
「例えば特定のコンテンツを検出して応答を拒否するモデルの機能を改善している」という。
高度な音声モードは、感情や非言語的なジェスチャーの意味を理解して応答できるというもの。これにより、AIとのリアルタイムで自然な会話が可能になるとしている。
秋にはすべての有料版ユーザーが利用可能になる予定という。また、5月にデモを行った動画機能と画面共有機能の展開にも取り組んでいる(提供時期は未定)と説明した。
高度な音声モードをめぐっては、女性の音声が俳優のスカーレット・ヨハンソンの音声に似ていると話題になった。ヨハンソンはこの件に対応するため弁護士を雇ったと語った。
OpenAIは同日、macOS版ChatGPTアプリを一般公開したことも発表した。[Option]+[スペース]で、メールやスクリーンショットなど、「画面上のあらゆるものについてチャットできる」としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
OpenAIの現・元従業員ら、AIシステム構築の無謀さと秘密主義を告発
OpenAIとGoogle DeepMindの現従業員、元従業員のグループは、OpenAIを含むAI企業に対し、AIに関する安全性対策の改善と、危険性を報告した従業員の保護を求める書簡を公開した。参加者の1人は「AGI時代に責任ある行動をとるという自信がなくなったため、OpenAIを辞めた」と語った。
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIが、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。
「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
OpenAIが発表した新たなマルチモーダル生成AIモデル「GPT-4o」。モデル名の読み方やその由来を紹介する。また、このモデルの音声とアルトマンCEOが好きだという映画「her」の声を聴き比べてみよう。
OpenAIの「ChatGPT」アプリ、音声機能が無料ユーザーでも利用可能に(サーバトラブル中→復旧済み)
OpenAIはChatGPTアプリの音声機能を無料ユーザーにも解放したと発表した。この発表を退社したグレッグ・ブロックマン元社長もリポストした。本稿執筆現在、サービスはダウンしている。

