Google、拡散型テキスト生成モデル「DiffusionGemma」公開 ローカルGPUで毎秒1000トークン超
米Googleは6月10日(現地時間)、テキスト生成を最大4倍高速化するオープンな実験的AIモデル「DiffusionGemma」を発表した。Apache 2.0ライセンスの下、Hugging Faceで重みを公開しており、誰でもダウンロードして試すことができる。
DiffusionGemmaは、画像生成で広く使われている「diffusion」(拡散)の手法をテキスト生成に応用したモデル。Googleは昨年の「Google I/O」で拡散ベースの言語モデル「Gemini Diffusion」を発表していたが、その後具体的な展開は発表されていなかった。
DiffusionGemmaは、このGemini Diffusionの研究成果をオープンモデルの「Gemma 4」ファミリーに統合したもので、約1年越しに拡散型テキスト生成技術が開発者の手に届く形となった。
現在主流のLLMは、トークンを1つずつ左から右へ順番に生成する「自己回帰型」と呼ばれる仕組みを採用している。DiffusionGemmaはこれとは異なり、ランダムなプレースホルダーから出発して256トークンのブロックを一括で並列生成し、複数回の反復でテキストを洗練していく。双方向のアテンション機構を備えており、生成中にブロック全体を評価して誤りを自己修正できるため、インライン編集やコード補完、マークダウンの整形などの非線形のテキスト生成タスクに強みがあるとGoogleは説明している。この並列処理により、デコードのボトルネックがメモリ帯域幅から演算能力へとシフトし、GPU本来の計算性能を引き出せるようになるという。
モデルの構造は260億パラメータのMixture of Experts(MoE)で、推論時に実際に活性化するのは38億パラメータのみ。量子化すれば18GBのVRAMに収まるため、ハイエンドのコンシューマー向けGPUでも動作する。ただしGoogleは、DiffusionGemmaの出力品質は標準的なGemma 4よりも低いとしており、最高品質を求める用途には引き続きGemma 4の使用を推奨している。速度優先のモデルであり、ローカルかつ少数ユーザーでの推論でこそ真価を発揮する一方、クラウド上で大量のリクエストをバッチ処理するような高トラフィック環境では自己回帰型モデルの方が効率的な場合があるという。
性能面では、米NVIDIAの「H100」単体で毎秒1000トークン以上、コンシューマー向けの「GeForce RTX 5090」で毎秒700トークン以上の生成速度を示している。
NVIDIAも同日、DiffusionGemmaへの初日対応を発表した。NVIDIAはDGX Spark上で毎秒150トークン、DGX Stationではさらに高速な推論が可能だとしており、クラウドに依存せずローカルで高速なAI推論を実現する方向性を強調している。
DiffusionGemmaのモデル重みはHugging Faceからダウンロードでき、vLLM、Hugging Face Transformers、MLX、Unsloth、NVIDIA NeMoなど主要な開発ツールで利用可能だ。Google Cloud Model GardenやNVIDIA NIMを通じたクラウド上での実行にも対応する。Googleは同モデルを「実験的」と位置付けており、対話型のローカルAIシステムにおいて速度を重視する開発者や研究者を主なターゲットとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ChatGPTで広告表示へ 無料・Goプランが対象 6月22日にポリシー更新
-
2
AIエージェントもフィッシング詐欺に引っかかる? 米セキュリティ企業がOpenClawで検証 結果は……
-
3
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
4
Anthropicの最新AI「Fable 5」、試すなら今? Claudeのレート制限リセット サブスクで使えるのは6月22日まで
-
5
生成AI台頭、経営コンサルの倒産・廃業が過去最多ペース “補助金頼み”限界に
-
6
「猫も杓子もAI」な現状は今後も続くのか?【後編】AI時代に必要な3つの検討事項
-
7
Apple「Siri AI」、13億台超が“利用不能”か? 新機能の拡大阻む“弱点”とは
-
8
Anthropic、最上位「ミュトス」級モデルを一般提供 悪用防ぐ保護機能を備えた「Claude Fable 5」
-
9
政府・著名人のInstagramアカウントが次々に乗っ取り被害 原因はMetaのAIアシスタント?
-
10
“Claude Fable 5の次"に備えよ――Anthropicが東京でイベント開催、「Claude」責任者が明かした開発者向け3つの指針
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR