Google DeepMindから“拡散言語モデル”「Gemini Diffusion」登場　文字通り爆速で文章・コード生成

公開 2025年05月21日 07時00分

[ITmedia]

印刷する

　米Google DeepMindは5月20日（現地時間）、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。

超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」（出典：Google DeepMind、以下同様）

　速度は、ユーザーの入力を受け付けてから生成を始めるまでが約0.84秒。文章の生成速度は1479トークン／秒。1トークンはおおよそ1単語なので、約1500単語（1500文字ではない）が毎秒生成されるイメージだ。Google I/Oの中でも「またたく間に生成が終わる」と表現されていた。

Gemini Diffusionの文章生成速度。文字通りの爆速

　これは、画像生成や動画生成に使われている「拡散モデル」という生成手法を文章生成に取り入れたもの。現在主流の大規模言語モデル（LLM）は1トークンずつ生成しては再入力し次のトークンを生成する……ということを繰り返すため、「時間がかかり、かつ出力の品質や一貫性にも制限される可能性がある」とDeepMindは説明している。

　拡散モデルはランダムなノイズを洗練させていくことで最終的な出力結果を得るモデル。トークンを1つずつ予想するわけではなく、かつ生成プロセス中にエラーの修正も可能という。「数学やコードを含む編集タスクで優れた能力を発揮する」（同社）としている。

　性能については、得意不得意はあるもののGemini 2.0 Flash Liteと概ね同等のようだ。

Gemini 2.0 Flash Liteとの各種ベンチマーク性能の比較

印刷する

SpecialPR

この記事の著者

井上輝一

2016年3月からITmediaにジョイン。ITmedia Mobile、PC USER、LifeStyle、ヘルスケアで編集・執筆を兼務。2017年4月からITmedia NEWSでの兼務も開始。2019年4月にNEWS専属となる。スマートフォンやPCといったガジェット系の他、理系（神経科学）のバックグラウンドを生かして科学系のネタや、量子コンピュータ、ブロックチェーン、AIなど多岐に渡って取材している。