米Google DeepMindは5月20日(現地時間)、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。
速度は、ユーザーの入力を受け付けてから生成を始めるまでが約0.84秒。文章の生成速度は1479トークン/秒。1トークンはおおよそ1単語なので、約1500単語(1500文字ではない)が毎秒生成されるイメージだ。Google I/Oの中でも「またたく間に生成が終わる」と表現されていた。
これは、画像生成や動画生成に使われている「拡散モデル」という生成手法を文章生成に取り入れたもの。現在主流の大規模言語モデル(LLM)は1トークンずつ生成しては再入力し次のトークンを生成する……ということを繰り返すため、「時間がかかり、かつ出力の品質や一貫性にも制限される可能性がある」とDeepMindは説明している。
拡散モデルはランダムなノイズを洗練させていくことで最終的な出力結果を得るモデル。トークンを1つずつ予想するわけではなく、かつ生成プロセス中にエラーの修正も可能という。「数学やコードを含む編集タスクで優れた能力を発揮する」(同社)としている。
性能については、得意不得意はあるもののGemini 2.0 Flash Liteと概ね同等のようだ。
Googleが軽量AIモデル「Gemma 3n」を発表 スマホ上で高性能マルチモーダルAI Claude 3.7 Sonnetに肉薄
Googleからも非同期コーディングエージェント「Jules」 OpenAI「Codex」対抗か
Google検索に「AIモード」 質問を解釈してAIが回答、高度なレポートも作成 「エージェント機能」でチケット予約も
Googleが“月額249.99ドル”の高額サブスク発表 「Gemini」「NotebookLM」など使い放題 まずは米国のみで
グーグル、AI映画製作ツール「Flow」発表 プロンプトと画像からシーン生成、カットの追加・拡張も自在にCopyright © ITmedia, Inc. All Rights Reserved.