Google、Gemini活用で翻訳・会話能力を強化 イヤホンでのリアルタイム翻訳も改善
Googleは、Geminiの機能を活用した複数の翻訳・音声関連新機能を発表した。「Gemini 2.5 Flash Native Audio」を導入し、Geminiライブの会話能力を向上。Google翻訳にはGeminiの最先端翻訳機能が導入され、慣用句などの翻訳精度が向上した。また、イヤホンでのリアルタイム音声間翻訳機能や、Duolingoのような言語学習ツールの拡張も行われた。
米Googleは12月12日(現地時間)、Geminiの機能を活用した音声通話と翻訳関連の複数の新機能を発表した。ライブ音声エージェントの能力を向上させる新しいオーディオモデルのリリース、「Google翻訳」のテキスト翻訳機能の改善、イヤホンを使ったリアルタイムの音声間翻訳の提供、言語学習ツールの拡張だ。
Gemini 2.5 Flash Native Audio
ライブ音声エージェント(リアルタイムで応答するAI)向けにアップデートした「Gemini 2.5 Flash Native Audio」をリリースした。このモデルは、複雑なワークフローの処理やユーザーの指示のナビゲート、より自然な会話を行う能力が向上しているという。複数ターンの会話品質が大幅に向上し、以前の会話の文脈をより効果的に取得できるため、よりまとまりのある会話を実現できるとしている。
同日から、「Google AI Studio」や「Vertex AI」などで利用可能になり、「Gemini Live」(日本では「Geminiライブ」)や「Search Live」(日本での提供はまだ)への展開も始まっている。開発者向けには、「Vertex AI」で一般提供され、「Gemini API」でプレビューとして利用可能になった。
Geminiの翻訳機能の「Google翻訳」のテキスト翻訳への導入
Google翻訳のテキスト翻訳に、Geminiの最先端の翻訳機能が導入された。これにより、イディオムや地域の表現、スラングなど、より微妙な意味合いを持つフレーズに対して、より賢く、自然で正確な翻訳が提供されるという。例えば、米国での「stealing my thunder」(直訳では「私の雷を盗む」だが、「手柄やアイデアを横取りする」という意味)のような慣用句を正しく翻訳できるようになったとしている。
このアップデートは、まずは米国とインドのAndroidおよびiOS版のGoogle翻訳アプリおよびWebで提供を開始する。英語と、スペイン語、ヒンディー語、中国語、日本語、ドイツ語を含む約20の言語間の翻訳で利用可能だ。
イヤホンでのリアルタイム翻訳
Geminiの新しいネイティブな音声間翻訳機能に基づき、イヤホンを使用してリアルタイム翻訳を聞くことができるβ体験も展開している。話者の抑揚、ペース、ピッチを保持することで、より自然な翻訳を作成するというものだ。話されている言語を識別して翻訳を開始するので、ユーザーは、翻訳を開始するために話されている言語を知る必要もない。
同日から、米国、メキシコ、インドのAndroid版Google翻訳アプリで展開されており、70以上の言語をサポートしている。iOS版およびその他の地域への展開は2026年に予定している。
以下の動画では、フランス語から英語、韓国語、中国語、ドイツ語から英語へのリアルタイム翻訳の様子を視聴できる。
Google翻訳アプリでの言語学習ツール
Google翻訳アプリで、言語学習ツールを拡張した。スピーキング練習に基づいた有用なヒントを提供する改善されたフィードバックが追加され、Duolingoの学習アプリのような、連続学習日数を追跡することで学習目標を達成するための新しい方法も導入された。
この機能は、ドイツ、インド、スウェーデン、台湾を含む約20の新しい国々に拡大されており、英語からドイツ語やポルトガル語への、また、ベンガル語、簡体字中国語、オランダ語、ドイツ語、ヒンディー語、イタリア語、ルーマニア語、スウェーデン語から英語への学習などが可能になる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google翻訳、会話を“リアルタイムでAI翻訳”する新機能 米国などで先行提供
米Googleは8月26日(現地時間)、アプリ「Google Translate(Google翻訳)」に会話をリアルタイムで翻訳できる新機能を追加したと発表した。AIモデル「Gemini」を活用したもので、まずは米国、インド、メキシコのユーザー向けに提供を始めた。
語学学習アプリ「Duolingo」、日本語話者向けに3言語追加 生成AIでコンテンツ追加を加速
Duolingoは4月30日(現地時間)、日本語話者向けにスペイン語、ドイツ語、イタリア語の3コースを新たに追加した。全言語UIの合計で、計148の新コースを公開。生成AIや社内システムの活用により、1年足らずでこれらの開発・公開を実現したという。
Google、思考するAI「Gemini 2.5」発表──推論能力とコーディング能力が大幅向上
Googleは、AI推論モデル「Gemini 2.5」を発表した。最初のリリースの「Gemini 2.5 Pro Experimental」はマルチモーダルな推論モデルで、Gemini Advancedなどで利用可能だ。
Google翻訳、新たに110言語をサポート LLM「PaLM 2」の貢献で倍増
Googleは、自動翻訳サービス「Google翻訳」の対応言語に新たに110言語追加したと発表した。LLM「PaLM 2」が類似言語の効率的な学習に貢献した。これで対応言語は243になった。

