Googleは6月9日、ライブ音声翻訳向けの新しいオーディオモデル「Gemini 3.5 Live Translate」を発表した。話し終わりを待ってから翻訳する従来のターン制システムと異なり、発話を数秒だけ遅れて追いかける形で連続的に音声を生成するのが特徴だ。
同モデルは70超の言語を自動検出し、話者のイントネーションやテンポ、声の高さを保ったまま自然な翻訳音声を生成する。
提供は同日から順次始まっており、開発者向けにはGemini Live APIとGoogle AI Studioでパブリックプレビューとして公開された。一般ユーザー向けには、Android/iOSのGoogle翻訳アプリにグローバル展開される。
Androidでは、スマートフォンを通話のように耳に当てると受話口から翻訳音声が流れる「リスニングモード」も順次提供されるとのことだ。
Google Meetの音声翻訳も同モデルへ移行する。対応言語は従来の5言語から70超に拡大し、英語を介さない2000以上の言語の組み合わせを1つの会議内で翻訳できるようになる。こちらは6月から一部のWorkspaceビジネス顧客向けプライベートプレビューとして提供され、2026年内に対象を広げる予定だ。なお、生成された音声には全て電子透かし「SynthID」が埋め込まれる。
Anthropicは6月12日、最先端の人工知能(AI)モデル「Claude Fable 5」と「Claude Mythos 5」の提供を全ての顧客に対して直ちに停止すると発表した。米政府から国家安全保障を理由に輸出管理の対象に指定され、国内外の外国人によるアクセスを停止するよう命じられたためだ。日本も制限の対象に含まれるとみられる。
同社は6月9日、従来の最上位モデル「Claude Opus」を上回る同社史上最高の性能を持つFable 5を一般向けに公開したばかりだった。Fable 5には高度な安全対策が施されていたが、米政府はその安全対策を迂回する手法が見つかったと判断したようだ。今回の命令により、安全装置を一部解除して政府関係の組織などに限定提供されていたMythos 5とともに、全ての提供が遮断された。
今回の命令では、同社の外国籍従業員によるアクセスも停止される。なお、一般向けに提供されているClaude Opusなど、他のAIモデルについては今回の措置による影響を受けないという。
2万円台でサファイアガラス採用! 機能充実の高コスパスマートウォッチ「Amazfit Active 3 Premium」徹底レビュー
AIモデルの性能競争から降りたAppleの狙いとは? AI時代の“計画的長寿命化”と「Siri AI」がユーザーとアプリをつなぐ理由
実売5万円切り! GEEKOMの格安ミニPC「AIR12」実機レビュー
DJI初の360度カメラドローン「DJI Avata 360」実機レポ 多彩な8K空撮、これは“空飛ぶOsmo 360”だ
ミニPCに強みの「MINISFORUM」 ミニワークステーションの新モデルから「謎の拡張カード」まで多彩な製品を披露Copyright © ITmedia, Inc. All Rights Reserved.