Googleが軽量AIモデル「Gemma 3n」を発表　スマホ上で高性能マルチモーダルAI　Claude 3.7 Sonnetに肉薄：Google I/O 2025

» 2025年05月21日 05時26分公開

　米Googleは5月20日、モバイルデバイス向けの新しいAIモデル「Gemma 3n」を発表した。スマートフォンやタブレットなどのモバイルデバイス上で直接動作する高性能なマルチモーダルAIで、テキスト、画像、音声、動画を理解・処理できる能力を備える。

モバイルデバイス向けの新しいAIモデル「Gemma 3n」

　同社のオープンなAIモデル「Gemma 3」シリーズの中でも、モバイルデバイス上での効率的な実行に特化して設計されている。Google DeepMindが開発した「Per-Layer Embeddings」と呼ばれる技術により、実際のパラメータ数は5Bと8B（50億、80億パラメータ）でありながら、メモリ上への展開が必要なパラメータ数は2Bと4B（データサイズとしては2GBから3GB）と比較的小さなフットプリントで動作する。

　Gemma 3nはモバイルデバイス上で従来のGemma 3 4Bと比較して約1.5倍速く応答を開始し、品質も大幅に向上しているという。また、「mix'n'match」と呼ばれる機能により、4Bモデルから特定のユースケースに最適なサブモデルを動的に作成し、品質とレイテンシーのトレードオフを調整することも可能だ。4Bのモデルは米Anthropicの「Claude 3.7 Sonnet」に肉薄するベンチマークスコアを獲得し、「GPT-4.1-nano」「Llama-4-Maverick」「Phi 4」を上回ったという。

LLMのベンチマークサイト「Chatbot Arena」でClaude 3.7 Sonnetに近いレーティングスコアを獲得した

　特筆すべき点として、Gemma 3nはオーディオ処理能力を備えており、高品質な自動音声認識や翻訳が可能になっている。また、日本語を含む多言語対応も強化したとしている。

　Gemma 3nの開発は、米Qualcomm、台湾MediaTek、韓国Samsung System LSIなどのモバイルハードウェアリーダーと緊密に協力して行われた。同じアーキテクチャは今年後半に提供される次世代のGemini Nanoにも採用される予定という。

　開発者は本日から早期プレビューとしてGemma 3nを利用できる。ブラウザ上で直接試せる「Google AI Studio」と、ローカル環境での開発に対応した「Google AI Edge」の2つの方法が提供されている。

Google検索に「AIモード」　質問を解釈してAIが回答、高度なレポートも作成　「エージェント機能」でチケット予約も
米Googleは、Google検索に「AIモード」を追加すると発表した。AI機能とWeb検索を組み合わせ、ユーザーの質問に対し、より高度な回答ができる。同日から米国で一般ユーザーに展開。同社の新機能の先行体験ユーザー向けに、今後数週間から数カ月以内に提供予定。
「NotebookLM」に動画生成機能　実装時期は「かなり近いうちに」　まずは英語のみ対応
米Googleは5月20日（現地時間）、AIメモツール「NotebookLM」に動画生成機能を実装すると発表した。
Windows 11がMCP対応へ　AIエージェントがファイルシステムやアプリへアクセス可能に
米Microsoftが、Windows 11のMCP（Model Context Protocol）対応を予告した。まずは今後数カ月以内に、一部のパートナー向けにプレビュー版を公開する予定。