米Googleは12月12日(現地時間)、Geminiの機能を活用した音声通話と翻訳関連の複数の新機能を発表した。ライブ音声エージェントの能力を向上させる新しいオーディオモデルのリリース、「Google翻訳」のテキスト翻訳機能の改善、イヤホンを使ったリアルタイムの音声間翻訳の提供、言語学習ツールの拡張だ。
ライブ音声エージェント(リアルタイムで応答するAI)向けにアップデートした「Gemini 2.5 Flash Native Audio」をリリースした。このモデルは、複雑なワークフローの処理やユーザーの指示のナビゲート、より自然な会話を行う能力が向上しているという。複数ターンの会話品質が大幅に向上し、以前の会話の文脈をより効果的に取得できるため、よりまとまりのある会話を実現できるとしている。
同日から、「Google AI Studio」や「Vertex AI」などで利用可能になり、「Gemini Live」(日本では「Geminiライブ」)や「Search Live」(日本での提供はまだ)への展開も始まっている。開発者向けには、「Vertex AI」で一般提供され、「Gemini API」でプレビューとして利用可能になった。
Google翻訳のテキスト翻訳に、Geminiの最先端の翻訳機能が導入された。これにより、イディオムや地域の表現、スラングなど、より微妙な意味合いを持つフレーズに対して、より賢く、自然で正確な翻訳が提供されるという。例えば、米国での「stealing my thunder」(直訳では「私の雷を盗む」だが、「手柄やアイデアを横取りする」という意味)のような慣用句を正しく翻訳できるようになったとしている。
このアップデートは、まずは米国とインドのAndroidおよびiOS版のGoogle翻訳アプリおよびWebで提供を開始する。英語と、スペイン語、ヒンディー語、中国語、日本語、ドイツ語を含む約20の言語間の翻訳で利用可能だ。
Geminiの新しいネイティブな音声間翻訳機能に基づき、イヤホンを使用してリアルタイム翻訳を聞くことができるβ体験も展開している。話者の抑揚、ペース、ピッチを保持することで、より自然な翻訳を作成するというものだ。話されている言語を識別して翻訳を開始するので、ユーザーは、翻訳を開始するために話されている言語を知る必要もない。
同日から、米国、メキシコ、インドのAndroid版Google翻訳アプリで展開されており、70以上の言語をサポートしている。iOS版およびその他の地域への展開は2026年に予定している。
以下の動画では、フランス語から英語、韓国語、中国語、ドイツ語から英語へのリアルタイム翻訳の様子を視聴できる。
Google翻訳アプリで、言語学習ツールを拡張した。スピーキング練習に基づいた有用なヒントを提供する改善されたフィードバックが追加され、Duolingoの学習アプリのような、連続学習日数を追跡することで学習目標を達成するための新しい方法も導入された。
この機能は、ドイツ、インド、スウェーデン、台湾を含む約20の新しい国々に拡大されており、英語からドイツ語やポルトガル語への、また、ベンガル語、簡体字中国語、オランダ語、ドイツ語、ヒンディー語、イタリア語、ルーマニア語、スウェーデン語から英語への学習などが可能になる。
Google翻訳、会話を“リアルタイムでAI翻訳”する新機能 米国などで先行提供
語学学習アプリ「Duolingo」、日本語話者向けに3言語追加 生成AIでコンテンツ追加を加速
Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上
Google翻訳、新たに110言語をサポート LLM「PaLM 2」の貢献で倍増Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR