米Googleは12月6日(現地時間)、同日発表したマルチモーダル推論機能を備える新生成AIモデル「Gemini」のミドルサイズ版「Gemini Pro」の英語版をBardに搭載すると発表した。同日から英語で使えるようになる。また、フルサイズ版「Gemini Ultra」搭載のBardのハイエンド版「Bard Advanced」を2024年初頭にリリースする計画だ(Bard Advancedが無料なのか、一般ユーザーにも公開されるのかは今のところ不明)。
Gemini Ultraは多数のベンチマークで米OpenAIのGPT-4を上回ったが、Gemini ProのベンチマークはGPT-3.5とほぼ同等(Googleは8つのベンチマークのうち6つで上回ったとしているが、僅差だ)なので、OpenAIの無料のChatGPTと同等レベルとみられる。
Googleは、Gemini ProをBard向けに調整することで、Bardの理解力、データを要約する力、推論力、コーディング、プランニングなどの能力が従来よりはるかに向上したとしている。
テキストベースのプロンプトでGemini Proを試せるのは英語のみだが、日本でも英語で入力すれば利用可能だ。なお、今回のアップデートでは本格的なマルチモーダル機能はまだなく、絵を描くといったプロンプトには「That’s not something I’m able to do yet.」と返答する。「他のモダリティのサポートも近日中に予定している」という。
したがって、現行のBardでは以下の動画のようなマルチモーダルなやり取りはまだできないが、Bard Adancedに期待したい。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR