“iPhoneだけで動くAI”の全貌　Google「Gemma 4」は何がスゴイの？

英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」（ジェマ4）が、リリースからわずか1週間で200万ダウンロードを突破した。AIが処理する文字の単位であるトークン使用量に応じた利用料の高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。

[湯川鶴章、エクサウィザーズ AI新聞編集長] PC用表示関連情報

LINE

Hatena

　英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」（ジェマ4）が、リリースからわずか1週間で200万ダウンロードを突破した。

　前世代の「Gemma 3」が過去1年間で積み上げた670万ダウンロードと比較しても、その立ち上がりの速さは際立っている。

　AIが処理する文字の単位であるトークン使用量に応じた利用料の高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。

　一方、オープンソースでリリースしたのは、自動プログラミング機能であるコーディングエージェントで売り上げを伸ばす競合AI企業へ打撃を与えようという戦略なのかもしれない。

英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」（ジェマ4）が、リリースからわずか1週間で200万ダウンロードを突破した（米Googleのシカゴフルトンマーケットビル。以下写真提供：ゲッティイメージズ）

全サイズで動画・画像に対応　ライセンスは完全オープン

　Gemma 4は、画像やテキスト、音声など複数種類のデータを同時に処理できるマルチモーダルモデルとして設計されている。実効パラメータ数が23億に相当するE2B、45億に相当するE4B、310億の密モデル、そして複数の専門AIを切り替えて効率よく動かす26B A4BのMixture-of-Expertsという4つのサイズで提供される。

　全てのモデルが画像と動画の入力をサポートし、小型のE2BやE4Bでは音声入力にも対応する。一度に扱えるデータ量を示すコンテキストウィンドウは、小型モデルで128K、大型モデルで256Kトークンへと大幅に拡張された。

　ライセンスは「Apache 2.0」で完全オープンであり、商業利用も含めた自由な活用が可能だ。

ローカル環境に特化した「Gemma 4」　何が技術的ブレークスルー？

　手元のマシンでAIを駆動させるローカル推論を意識したアーキテクチャ面では、複数の改良が施されている。

　直近のデータと全体のデータの双方にバランスよく目を配る特殊な設計や、処理の途中でデータの劣化を防ぎ、高い精度を保つ技術である「Per-Layer Embeddings」、さらに過去の計算結果を賢く使い回して処理を大幅に高速化する「Shared KV Cache」などが特徴だ。

　また、画像を認識する機能は写真の縦横比が変わっても柔軟に対応でき、データ処理の軽重を状況に合わせて調整できる設計になっている。AIの評価サイトを運営する米Hugging Faceが発表した性能ランキングでは、大型モデルだけでなく、複数の専門AIを組み合わせて効率性を重視したモデルも、軒並みトップクラスの数値を記録。言葉のやりとりと画像や動画の処理の双方において、極めて優秀な実力を証明した。

iPhoneで秒間40トークン　スマホがクラウド不要で自律駆動する日

　特に注目を集めたのが、市販のスマートフォンでの高速な動きだ。開発者らは「iPhone 17 Pro」を使い、Apple製品に最適化された専用の仕組みを介して、1秒間に40文字近くのテキストを書き出す圧倒的なスピードでの動作に成功した。

　また「PokeClaw」と呼ばれる試作アプリは、Gemma 4を用いてAndroidスマートフォンを、ネットに接続せずスマホの中だけで完結する形で自動操作することに成功。わずか2日で開発されたとして話題を呼んだ。さらに米Red HatがAIプラットフォーム「Red Hat AI」で、データのサイズを大幅に削って扱いやすくした企業向けの高性能モデルを公開するなど、ビジネス現場での活用も急速に進んでいる。

全方位での即時サポート

　Gemma 4が急激に普及した背景には、リリースされた瞬間から、開発者向けの周辺環境やツールとの連携が完璧に整っていたことがある。AIの主要プラットフォームであるHugging Faceや、半導体大手の米NVIDIAをはじめ、「vLLM」「llama.cpp」「Ollama」「Unsloth」「SGLang」、米Docker、米Cloudflareといった数多くの有力サービスやプラットフォームが一斉に対応を表明した。例えばOllamaは、NVIDIAの最新の画像処理半導体であるBlackwell GPUを組み込んだ自社のクラウドサービス上でGemma 4の配信を開始。これにより企業や開発者は、自前で高価なシステムを構築・管理する手間を一切かけることなく、手軽にその高性能に触れられるようになっている。

月額制サービスへの脅威　「1回0.20ドル」が壊すAIの価格破壊

　Gemma 4の台頭は、既存の有料AIサービスを脅かす存在としても注目されている。利用者からは「手元のPCでこれだけ動くなら、毎月お金を払ってクラウド型のAIを使う必要がなくなる」という声も上がっており、スマートフォンやPCといった端末そのもので無料のAIを動かすトレンドを一気に加速させる可能性がある。

　事実、AIの実力を測る主要な性能比較テストでは、中核となる大型モデルが世界トップ3に入った。それほどの高性能でありながら、1回当たりの処理コストを約0.20ドルという安さに抑えられる点も高く評価されている。

Googleの思惑：無料開放の裏にあるVertex AIへの誘導線

　Googleは4月10日に英ロンドンでGemma 4に関する基調講演をし、その詳細を発表した。オープンなAIの普及を後押ししつつ、より高度な安全性や大規模な運用を求める企業に対しては、自社のクラウドサービスである「Google Cloud」や、企業向けのAI開発・運用基盤である「Vertex AI」へと促す戦略のようだ。

　Gemma 4は単なる性能の向上にとどまらず「高性能なAIをクラウドに依存せず、手元のスマートフォンやPCで動かす」という次世代の開発スタイルを定着させる存在として、AI業界に新たな地平を切り開いたといえそうだ。

「手元のスマートフォンやPCで動かす」という次世代の開発スタイルを定着させる存在として、AI業界に新たな地平を切り開いたといえそうだ

本記事は、エクサウィザーズが法人向けChatGPT「exaBase 生成AI」の利用者向けに提供しているAI新聞「Gemma 4、リリース1週間で200万ダウンロード突破――「ローカルAI時代」の新基準に」（2026年4月9日掲載）を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。

著者プロフィール

湯川鶴章

AIスタートアップのエクサウィザーズ AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。17年12月から現職。主な著書に『人工知能、ロボット、人の心。』（15年）、『次世代マーケティングプラットフォーム』（07年）、『ネットは新聞を殺すのか』（03年）などがある。

“iPhoneだけで動くAI”の全貌 Google「Gemma 4」は何がスゴイの？

全サイズで動画・画像に対応 ライセンスは完全オープン

ローカル環境に特化した「Gemma 4」 何が技術的ブレークスルー？

iPhoneで秒間40トークン スマホがクラウド不要で自律駆動する日