速報
SpotifyのPodcast、OpenAIの技術で本人の声での多言語吹き替えが可能に
Spotifyは、OpenAIの生成AI音声技術を採用し、Podcastのホストの声のまま他の言語に吹き替える「Voice Translation」を発表した。まずは英語からスペイン語に吹き替えた番組を公開した。
スウェーデンSpotifyは9月25日(現地時間)、生成AI採用でPodcastをホスト自身の声で複数言語に吹き替える新機能「Voice Translation」を発表した。米OpenAIが同日発表した新しい音声技術と、3月リリースの音声文字起こしツール「Whisper」を採用する。
OpenAIは、新しい音声技術で「わずか数秒間の実際の音声からリアルな合成音声を作成できる」としている。
まずはパイロット版として一部の英語によるホストと提携し、同日スペイン語の吹替版を公開した。今後、フランス語、ドイツ語などでも可能にし、提携ホストを拡大していく計画だ。
Spotifyは「クリエイター自身の声を使うことで、音声翻訳はこれまで以上にリアルな方法で世界中のリスナーにホストのインスピレーションを受け取る力を与える」と語った。
ダニエル・エクCEOのXのポストで、スティーブン・バートレット氏とレックス・フリードマン氏のスペイン語吹き替えを試聴できる。
関連記事
- ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。 - YouTube、クリエイター向けイベントでAI搭載の複数ツールを発表
YouTubeはクリエイター向けイベントを開催し、複数の編集ツールを発表した。YouTubeショートの背景を生成AIで作る「Dream Screen」など、AI搭載のものが中心だ。 - 英語が苦手でも世界へ羽ばたける? 自分の声で“セルフ吹き替え”してくれるアプリがすごかった
先日、Twitterに流れてきた情報から知ることになったアプリ、「Captions」を試してみたところ、今後は多くのコンテンツがワールド化するかもしれないという手応えを感じた。現時点で確認できるCaptionsのインパクトと、これがもたらす将来の可能性を考えてみる。 - Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
Metaは、新たな音声生成AIモデル「Voicebox」を発表した。従来のTTSの20倍の速度で音声を生成するとしている。ノイズ除去や言い間違いの修正、英語のスピーチを声はそのままフランス語に変換するなどが可能だ。 - OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始 「gpt-3.5-turbo」も発表
OpenAIは「ChatGPT API」と「Whisper API」の提供を開始した。ChatGPT APIの価格は1000トークン当たり0.002ドル。Azureの専用インスタンスプランも提供する。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.