「Gemma 4 12B」登場 メモリ16GBのノートPCでも動作するマルチモーダルモデル
米Googleは6月3日(現地時間)、マルチモーダルのオープンウェイトモデル「Gemma 4 12B」を発表した。メモリ16GBのノートPCでも動作可能で、ベンチマークはより大型の「Gemma 4 26B」にも迫るという。
特徴は、小型モデルながら画像と音声の入力に対応している点だ。画像と音声を言語モデルに入力する場合、従来はそれぞれを別々のエンコーダーで変換してから言語モデルに渡すのが一般的だった。Gemma 4 12Bは、画像を軽量の埋め込みモジュールで処理し、音声は生の信号をテキストトークンと同じ次元空間へ直接投影することで、入力の遅延とメモリ使用量を抑えた。
ベンチマークでは、上位の26Bモデルに迫る性能を達成したという。高度な専門知識を問う「GPQA Diamond」では78.8%(26Bモデルは82.3%)、専門知識や論理的思考力を問う「MMLU Pro」は77.2%(同82.6%)となっており、いずれも前世代の「Gemma 3 27B」を超える性能だ。
モデルの重みは「Apache 2.0」ライセンスで公開されており、「Hugging Face」や「Kaggle」からダウンロードできる。「LM Studio」「Ollama」などのアプリで利用できる他、「llama.cpp」や「vLLM」などのツールや、「Google Cloud」での開発にも利用可能。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
Microsoft、自律エージェント「Scout」発表 OpenClawベースでMCP対応
-
2
Claude Opus 4.8は忖度(そんたく)しません “正直すぎる”のも善しあし?
-
3
Microsoft、NVIDIAのSoC搭載でAI特化のミニPC「Surface RTX Spark Dev Box」披露
-
4
【Pythonで学ぶデータ分析】ベイズ統計の考え方をやさしく学ぶ ~ 初めてでも流れが分かる入門編
-
5
NVIDIAの「RTX Spark」と搭載ノートPCがCOMUPTEX TAIPEIのMediaTekブースに集結
-
6
Microsoft、初の自社推論モデル「MAI-Thinking-1」発表 蒸留なしでゼロから学習
-
7
それで、メモリ不足はいつまで続くの? なかなか終わらない狂騒のウラ側
-
8
「FDE」って結局、客先常駐SEのリブランディングじゃないの? アクセンチュアに聞いてみた
-
9
シャドーAIに「ログイン情報」を渡している割合は? Oktaの実態調査で判明
-
10
「AI使うな」より「使うなら教えて」 エージェント時代のガバナンス再設計
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR