Google、「Gemini 2.0 Flash Thinking」公開 「o1」競合の“思考過程を示す”推論AIモデル
Googleは、新たな推論AI「Gemini 2.0 Flash Thinking」の実験版をAI Studioで公開した。複雑な課題には、OpenAIの「o1」のように数秒“考え”る。思考過程も表示する。
米Googleは12月19日(現地時間)、新たな推論AIモデル「Gemini 2.0 Flash Thinking」を発表し、Experimental(実験)モデルをGoogle AI Studioで公開した。
Gemini 2.0 Flash Thinkingは、回答の一部としてモデルが行う「思考プロセス」、つまり、問題を解決するためにどのような手順で考え、どのような情報を参照したのかを、人間が理解できる形で示すようにトレーニングされた推論モデル。ベースとした「Gemini 2.0 Flash」よりも、より強力な推論機能を備えており、マルチモーダル理解、推論、コーディングに最適という。
Google DeepMindとGoogle Researchのチーフサイエンティスト、ジェフ・ディーン氏はXのポストで、「思考を明示的に示すモデル」と説明した。同氏がシェアしたデモでは、「電子は、x=-0.15nmとx=+0.15nm の壁を持つ1次元の無限ポテンシャル井戸に閉じ込められている。電子が井戸内のエネルギーレベルを変えるときに放出される最も波長の長い4つの光子を見つけよ」という課題に対し、AIが考える過程を示しながら解に到達する様子が示されている。
AI Studioのリードプロダクト、ローガン・キルパトリック氏は、画像を使ったプロンプトの例として、4つのビリヤードの玉の画像に「この中の3つの玉を使って30にするには?」というデモを紹介した。
米OpenAIの推論モデル「o1」と同様に、複雑な課題を与えると数秒間「Thinking」する。
Google AI Studioでの利用には、以下の制限がある。
- 入力トークンの上限は3万2000個
- テキストと画像の入力のみ
- 出力トークの上限は8000個
- テキストのみの出力
- 検索やコード実行などの組み込みツールの使用なし
キルパトリック氏は、「これは、推論の旅の小さな第一歩にすぎない」と語った。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google、Gemini Advanced向けに「2.0 Experimental Advanced」モデル提供開始
Googleは、Gemini Advancedユーザー向けに「2.0 Experimental Advanced」モデルの提供を開始した。コーディング、数学、推論、指示の追跡などの複雑なタスクで大幅に改善されたプレビューモデルを使える。
Google、「NotebookLM」の有料プラン追加 「音声概要」での会話機能も
GoogleはAI搭載のリサーチアシスタント「NotebookLM」に新機能を追加し、有料プラン「NotebookLM Plus」を発表した。有料プランは2025年には「Google One AI Premium」でも利用可能になる。
Google、AIモデル「Gemini 2.0」発表 Advancedで利用可能に
Googleは、次世代AIモデル「Gemini 2.0」と、それに関連する多数の取り組みを発表した。一部の機能は有料プランで既に体験可能だ。マルチモーダルエージェントProject Astraの進捗も紹介している。
ChatGPTに「o1」登場 じっくり考えて賢さアップ、数学オリンピック予選で8割正答 プレビュー版はきょうから
米OpenAIが、新たなAIモデル「o1」を発表した。ユーザーの入力に対し時間をかけて考え返答することで、従来よりも複雑なタスクを正しく解けるようになるという。同日からChatGPT Plus、Teamユーザーはプレビュー版が利用可能になる。

