Googleが軽量AIモデル「Gemma 3n」を発表　スマホ上で高性能マルチモーダルAI　Claude 3.7 Sonnetに肉薄

公開 2025年05月21日 05時39分

[ITmedia]

印刷する

　米Googleは5月20日、モバイルデバイス向けの新しいAIモデル「Gemma 3n」を発表した。スマートフォンやタブレットなどのモバイルデバイス上で直接動作する高性能なマルチモーダルAIで、テキスト、画像、音声、動画を理解・処理できる能力を備える。

モバイルデバイス向けの新しいAIモデル「Gemma 3n」

　同社のオープンなAIモデル「Gemma 3」シリーズの中でも、モバイルデバイス上での効率的な実行に特化して設計されている。Google DeepMindが開発した「Per-Layer Embeddings」と呼ばれる技術により、実際のパラメータ数は5Bと8B（50億、80億パラメータ）でありながら、メモリ上への展開が必要なパラメータ数は2Bと4B（データサイズとしては2GBから3GB）と比較的小さなフットプリントで動作する。

　Gemma 3nはモバイルデバイス上で従来のGemma 3 4Bと比較して約1.5倍速く応答を開始し、品質も大幅に向上しているという。また、「mix'n'match」と呼ばれる機能により、4Bモデルから特定のユースケースに最適なサブモデルを動的に作成し、品質とレイテンシーのトレードオフを調整することも可能だ。4Bのモデルは米Anthropicの「Claude 3.7 Sonnet」に肉薄するベンチマークスコアを獲得し、「GPT-4.1-nano」「Llama-4-Maverick」「Phi 4」を上回ったという。

LLMのベンチマークサイト「Chatbot Arena」でClaude 3.7 Sonnetに近いレーティングスコアを獲得した

　特筆すべき点として、Gemma 3nはオーディオ処理能力を備えており、高品質な自動音声認識や翻訳が可能になっている。また、日本語を含む多言語対応も強化したとしている。

　Gemma 3nの開発は、米Qualcomm、台湾MediaTek、韓国Samsung System LSIなどのモバイルハードウェアリーダーと緊密に協力して行われた。同じアーキテクチャは今年後半に提供される次世代のGemini Nanoにも採用される予定という。

　開発者は本日から早期プレビューとしてGemma 3nを利用できる。ブラウザ上で直接試せる「Google AI Studio」と、ローカル環境での開発に対応した「Google AI Edge」の2つの方法が提供されている。

印刷する

SpecialPR

この記事の著者

井上輝一

2016年3月からITmediaにジョイン。ITmedia Mobile、PC USER、LifeStyle、ヘルスケアで編集・執筆を兼務。2017年4月からITmedia NEWSでの兼務も開始。2019年4月にNEWS専属となる。スマートフォンやPCといったガジェット系の他、理系（神経科学）のバックグラウンドを生かして科学系のネタや、量子コンピュータ、ブロックチェーン、AIなど多岐に渡って取材している。