ニュース
Google DeepMindから“拡散言語モデル”「Gemini Diffusion」登場 文字通り爆速で文章・コード生成:Google I/O 2025
米Google DeepMindが、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。
米Google DeepMindは5月20日(現地時間)、開発者向け年次イベント「Google I/O 2025」の中で、超高速に文章やコードを生成できるAIモデル「Gemini Diffusion」を発表した。ウェイティングリストへの登録フォームを公開している。
速度は、ユーザーの入力を受け付けてから生成を始めるまでが約0.84秒。文章の生成速度は1479トークン/秒。1トークンはおおよそ1単語なので、約1500単語(1500文字ではない)が毎秒生成されるイメージだ。Google I/Oの中でも「またたく間に生成が終わる」と表現されていた。
これは、画像生成や動画生成に使われている「拡散モデル」という生成手法を文章生成に取り入れたもの。現在主流の大規模言語モデル(LLM)は1トークンずつ生成しては再入力し次のトークンを生成する……ということを繰り返すため、「時間がかかり、かつ出力の品質や一貫性にも制限される可能性がある」とDeepMindは説明している。
拡散モデルはランダムなノイズを洗練させていくことで最終的な出力結果を得るモデル。トークンを1つずつ予想するわけではなく、かつ生成プロセス中にエラーの修正も可能という。「数学やコードを含む編集タスクで優れた能力を発揮する」(同社)としている。
性能については、得意不得意はあるもののGemini 2.0 Flash Liteと概ね同等のようだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Googleが軽量AIモデル「Gemma 3n」を発表 スマホ上で高性能マルチモーダルAI Claude 3.7 Sonnetに肉薄
米Googleが、モバイルデバイス向けの新しいAIモデル「Gemma 3n」を発表した。スマートフォンやタブレットなどのモバイルデバイス上で直接動作する高性能なマルチモーダルAIで、テキスト、画像、音声、動画を理解・処理できる能力を備える。
Googleからも非同期コーディングエージェント「Jules」 OpenAI「Codex」対抗か
米Googleが、非同期コーディングエージェント「Jules」の提供を始めた。ソースコード管理プラットフォーム「GitHub」と接続し、ユーザーの指示に従ってソースコードを編集する。
Google検索に「AIモード」 質問を解釈してAIが回答、高度なレポートも作成 「エージェント機能」でチケット予約も
米Googleは、Google検索に「AIモード」を追加すると発表した。AI機能とWeb検索を組み合わせ、ユーザーの質問に対し、より高度な回答ができる。同日から米国で一般ユーザーに展開。同社の新機能の先行体験ユーザー向けに、今後数週間から数カ月以内に提供予定。
Googleが“月額249.99ドル”の高額サブスク発表 「Gemini」「NotebookLM」など使い放題 まずは米国のみで
米Googleは、AIツールのサブスクリプションサービス「Google AI Ultra」を発表した。チャットAI「Gemini」やAIメモツール「NotebookLM」、映画作成AIツール「Flow」などAIツールが使い放題になる月額プラン。まずは月額249.99ドルで米国のみに提供する。
グーグル、AI映画製作ツール「Flow」発表 プロンプトと画像からシーン生成、カットの追加・拡張も自在に
米Googleが同社の年次カンファレンス「Google I/O」で、AI映画製作ツール「Flow」を発表した。3つの画像と映像のイメージをプロンプトで入力すると数秒のシーンを生成。これにプロンプトを加えてカットを追加していったり、生成したシーンの長さを拡張したりして、長編動画としてストーリーを表現することができるという。


