“iPhoneだけで動くAI”の全貌 Google「Gemma 4」は何がスゴイの?
英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」(ジェマ4)が、リリースからわずか1週間で200万ダウンロードを突破した。AIが処理する文字の単位であるトークン使用量に応じた利用料の高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。
英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」(ジェマ4)が、リリースからわずか1週間で200万ダウンロードを突破した。
前世代の「Gemma 3」が過去1年間で積み上げた670万ダウンロードと比較しても、その立ち上がりの速さは際立っている。
AIが処理する文字の単位であるトークン使用量に応じた利用料の高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。
一方、オープンソースでリリースしたのは、自動プログラミング機能であるコーディングエージェントで売り上げを伸ばす競合AI企業へ打撃を与えようという戦略なのかもしれない。
英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」(ジェマ4)が、リリースからわずか1週間で200万ダウンロードを突破した(米Googleのシカゴフルトンマーケットビル。以下写真提供:ゲッティイメージズ)
全サイズで動画・画像に対応 ライセンスは完全オープン
Gemma 4は、画像やテキスト、音声など複数種類のデータを同時に処理できるマルチモーダルモデルとして設計されている。実効パラメータ数が23億に相当するE2B、45億に相当するE4B、310億の密モデル、そして複数の専門AIを切り替えて効率よく動かす26B A4BのMixture-of-Expertsという4つのサイズで提供される。
全てのモデルが画像と動画の入力をサポートし、小型のE2BやE4Bでは音声入力にも対応する。一度に扱えるデータ量を示すコンテキストウィンドウは、小型モデルで128K、大型モデルで256Kトークンへと大幅に拡張された。
ライセンスは「Apache 2.0」で完全オープンであり、商業利用も含めた自由な活用が可能だ。
ローカル環境に特化した「Gemma 4」 何が技術的ブレークスルー?
手元のマシンでAIを駆動させるローカル推論を意識したアーキテクチャ面では、複数の改良が施されている。
直近のデータと全体のデータの双方にバランスよく目を配る特殊な設計や、処理の途中でデータの劣化を防ぎ、高い精度を保つ技術である「Per-Layer Embeddings」、さらに過去の計算結果を賢く使い回して処理を大幅に高速化する「Shared KV Cache」などが特徴だ。
また、画像を認識する機能は写真の縦横比が変わっても柔軟に対応でき、データ処理の軽重を状況に合わせて調整できる設計になっている。AIの評価サイトを運営する米Hugging Faceが発表した性能ランキングでは、大型モデルだけでなく、複数の専門AIを組み合わせて効率性を重視したモデルも、軒並みトップクラスの数値を記録。言葉のやりとりと画像や動画の処理の双方において、極めて優秀な実力を証明した。
iPhoneで秒間40トークン スマホがクラウド不要で自律駆動する日
特に注目を集めたのが、市販のスマートフォンでの高速な動きだ。開発者らは「iPhone 17 Pro」を使い、Apple製品に最適化された専用の仕組みを介して、1秒間に40文字近くのテキストを書き出す圧倒的なスピードでの動作に成功した。
また「PokeClaw」と呼ばれる試作アプリは、Gemma 4を用いてAndroidスマートフォンを、ネットに接続せずスマホの中だけで完結する形で自動操作することに成功。わずか2日で開発されたとして話題を呼んだ。さらに米Red HatがAIプラットフォーム「Red Hat AI」で、データのサイズを大幅に削って扱いやすくした企業向けの高性能モデルを公開するなど、ビジネス現場での活用も急速に進んでいる。
全方位での即時サポート
Gemma 4が急激に普及した背景には、リリースされた瞬間から、開発者向けの周辺環境やツールとの連携が完璧に整っていたことがある。AIの主要プラットフォームであるHugging Faceや、半導体大手の米NVIDIAをはじめ、「vLLM」「llama.cpp」「Ollama」「Unsloth」「SGLang」、米Docker、米Cloudflareといった数多くの有力サービスやプラットフォームが一斉に対応を表明した。例えばOllamaは、NVIDIAの最新の画像処理半導体であるBlackwell GPUを組み込んだ自社のクラウドサービス上でGemma 4の配信を開始。これにより企業や開発者は、自前で高価なシステムを構築・管理する手間を一切かけることなく、手軽にその高性能に触れられるようになっている。
月額制サービスへの脅威 「1回0.20ドル」が壊すAIの価格破壊
Gemma 4の台頭は、既存の有料AIサービスを脅かす存在としても注目されている。利用者からは「手元のPCでこれだけ動くなら、毎月お金を払ってクラウド型のAIを使う必要がなくなる」という声も上がっており、スマートフォンやPCといった端末そのもので無料のAIを動かすトレンドを一気に加速させる可能性がある。
事実、AIの実力を測る主要な性能比較テストでは、中核となる大型モデルが世界トップ3に入った。それほどの高性能でありながら、1回当たりの処理コストを約0.20ドルという安さに抑えられる点も高く評価されている。
Googleの思惑:無料開放の裏にあるVertex AIへの誘導線
Googleは4月10日に英ロンドンでGemma 4に関する基調講演をし、その詳細を発表した。オープンなAIの普及を後押ししつつ、より高度な安全性や大規模な運用を求める企業に対しては、自社のクラウドサービスである「Google Cloud」や、企業向けのAI開発・運用基盤である「Vertex AI」へと促す戦略のようだ。
Gemma 4は単なる性能の向上にとどまらず「高性能なAIをクラウドに依存せず、手元のスマートフォンやPCで動かす」という次世代の開発スタイルを定着させる存在として、AI業界に新たな地平を切り開いたといえそうだ。
本記事は、エクサウィザーズが法人向けChatGPT「exaBase 生成AI」の利用者向けに提供しているAI新聞「Gemma 4、リリース1週間で200万ダウンロード突破――「ローカルAI時代」の新基準に」(2026年4月9日掲載)を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。
© エクサウィザーズ AI新聞
関連記事
Googleが拒否した軍事AIを成功へ 異端企業「Palantir」が示す、次なるAIの戦場
AIの戦場で圧倒的な存在感を放つのが、米コロラド州デンバーに本社を置くPalantir Technologies(パランティアテクノロジーズ)だ。 AI業界がモデル性能の覇権争いに明け暮れる中、Palantirは全く異なる価値観でAIの時代を切り拓き、業績を急拡大させている。
「学歴は無価値に」 米トップエンジニアが明かす、AI時代に“大化けする人材”の共通点
「履歴書の時代は終わった」──AIの普及によって、企業の採用や人材評価のルールが大きく変わり始めている。
人間は「取締役」、AIが「CEO」 サム・アルトマンがAGI論争を終了させてまで語りたかった「ASI」の未来図
「AGI」(汎用人工知能)は、気付かないうちに到達してしまった――だから次はASI(超知能)の定義を決めよう」。米OpenAIのサム・アルトマンCEOは、AGIをめぐる終わりのない論争に決着をつけるかのような提案をしている。宣言を急ぐ裏には、Microsoftとの間に抱える“巨額契約の時限爆弾”があった。AIがCEOになる」衝撃の未来図とは?
「人間がコードを書く時代は終わった」 “Claude Code”が引き起こす「知能の価格崩壊」
AIがソフトウェアを書く時代が、いよいよ本格的に始まりつつある。「GitHub」の公開コミットの約4%が、米AnthropicのAIエージェント「Claude Code」によって書かれていて、2026年末には20%以上に達するという。この変化は、単なる「AIコーディングツール」の普及ではない。PCの使い方そのものが変わり始めている。
AIによる“社会崩壊”まで残り3年 トップ識者が警告する「地獄のシナリオ」
AIがもたらす生産性の爆発は、最終的には人類に豊かさをもたらす可能性がある。しかしその途中には、社会が崩壊しかねない危険な移行期があるという。
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
米国のテック系人気ユーチューバーの何人かが、こぞって「AI開発競争はGoogleが勝利した」という見出しの動画をアップしている。これでGoogleの勝利が決定したのかどうか分からないが、少なくともOpenAIの首位独走の時代は終わったのかもしれない。
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因
生産性の低さが指摘されている日本。人口減少が追い打ちをかける中で、現状を打開するためには、どうしたらいいのか。企業はAIをどのように使いこなしていくべきなのか。オードリー・タンさんに聞いた。
NTT「IOWN構想」に世界が動き出した 成否を握る“ブレークスルー技術”とは?
NTTが提唱する「IOWN構想」では2030年をメドに伝送容量を現在の125倍、遅延を200分の1、電力消費を100分の1に抑える計画だ。飛躍期を迎えたIOWNの歩みと、米南部ダラスで開かれた推進組織のメンバー会議の現地取材から今後の課題を展望する。

