メディア

Google、マルチモーダル生成AIモデル「Gemini」発表　Ultraは“人間の専門家を上回る”

» 2023年12月07日 12時53分公開

　米Googleは12月6日（現地時間）、マルチモーダル生成AIモデルの第1弾として「Gemini」を発表した。データセンターからモバイルデバイスに至るまでのあらゆる場所で効率的に動作するという。

「Gemini」

　Geminiの最初のバージョンとなる1.0は「Ultra」「Pro」「Nano」の3サイズに分かれる。テキスト、画像、音声、動画、コードなど、さまざまな種類の情報を一般化してシームレスに理解し、操作し、組み合わせることができるという。これらはGoogleが「Google DeepMind」の設立時に抱いていたビジョンを実現したものだという。具体的な位置づけは次の通り。

Gemini Ultra……非常に複雑なタスクに対応する、高性能かつ最大のモデル
Gemini Pro……幅広いタスクに対応する最良のモデル
Gemini Nano……デバイス上のタスクに最も効率的なモデル

これら3サイズのイメージ

　最も大きなサイズとなるUltraは自然な画像の理解から数学的推論、音声や動画の理解に至るまで、広く使用されている32の業界ベンチマークのうち30で最高の水準を記録したという。数学、物理学、歴史、法律、医学、倫理など57の科目の組み合わせて知識と問題解決能力をテストするMMLU（大規模マルチタスク言語理解）で 90.00%と高いスコアを叩き出し、“人間の専門家を上回る”パフォーマンスを示したという。

　Ultraは2024年に開発者や企業に向けて公開される計画だが、その前に一部の顧客、開発者、パートナー、安全責任専門家から得たフィードバックを生かし、改良が行われる。

Ultraが記録したスコア

　Proは対話型AIサービス「Bard」（英語版のみ）に実装される。Bard提供以来最大のアップデートによって、Bardは無料かつ高性能な会話型生成AIサービスに進化したという。

　Nanoはデバイスだけで動作するように設計されたコンパクトなサイズのGeminiだ。「Tensor 3」プロセッサを搭載したハイエンドのスマートフォン「Pixel 8 Pro」に実装された。音声データの内容をテキストで要約できる他、キーボードアプリ「Gboard」のスマートリプライがPixel 8 Proで生成できるようになる。ただし、当面の間は英語のみでしか利用できないという。

　重複するが、GoogleはGeminiを「マルチモーダルでの高度な推論性能を備えた高性能AIモデル」と紹介している。複数（マルチ）の形式と手段（モーダル）を組み合わせて、あらゆるタスクをこなす──それがマルチモーダル生成AIモデルのGeminiだ。

「Pixel 8 Pro」にGoogleの生成AIモデル「Gemini Nano」搭載　その他の「Feature Drops」も一気に紹介
GoogleはOpenAIのGPT-4と競合する新生成AIモデル「Gemini」を発表した。その最小モデル「Gemini Nano」は「Tensor 3」搭載の「Pixel 8 Pro」で利用可能に。今年最後の多数の「Feature Drops」も紹介した。
「Android 14」正式版リリース　ロック画面のカスタマイズが容易に／「AI壁紙」も導入
Googleが10月5日、Android 14の正式版をリリースした。カスタマイズピッカーを使ってロック画面や壁紙を簡単に調整できるようになる。Pixel 8／8 Pro向けにはAIが自動で壁紙を生成する機能も導入する。
「AIのGoogle」復活に強い意志　Google I/O 2023で発表されたAIサービスまとめ
Googleは日本時間の5月11日2時から、年次開発者会議「Google I/O 2023」を開催しました。今回はデバイスに加えて、AIを活用したサービスも発表しています。発表内容を見ると、「AIのGoogle」復活に向けた強い意志を感じるものでした。
Googleの対話型AIサービス「Bard」は何に役立つ？　的確な回答を得られるヒントなどが公開
Google Japanは12月1日、対話型AIサービス「Bard」が日本でどのように活用されているのかを調査し、ランキング形式で発表した。調査は5月10～11月15日に行われた。Bardが何に役立つのかが一目で分かるランキングの他、より的確な回答を得るヒントなども公開された。
Googleの対話型AI「Bard」を試してみた　ChatGPTやBingよりも優れている点は？
Googleが3月に一般提供を開始した実験的な会話形AI「Bard」。これまで米国と英国からしか利用できませんでしたが、4月18日から日本からも利用が可能になりました。せっかくなので、新しいBingやChatGPT（GPT-3.5）とBardに同じ質問をして、その回答を比べてみました。

アクセストップ10

2024年04月28日更新

Evernote、サービス継続を発表　日本法人の閉鎖で混乱　火消しに動くも、移行先に「Notion」選ぶ声（2024年04月27日）
貼り付ければOK、配線不要の小型ドライブレコーダー発売　スマート感知センサーで自動録画（2024年04月25日）
スマホのバッテリー切れでもSuicaで改札通過できる？　iPhoneで検証してみた（2024年04月27日）
Evernoteからの乗り換えでオススメのメモアプリ5選　無料で使うならどれがいい？（2024年02月13日）
Evernote日本法人の解散、「アプリ終了」との誤解につながる　サービス改悪、告知不足がユーザー離れに拍車（2024年04月26日）
楽天モバイルで「身に覚えのないeSIM再発行」の危険性　緩すぎる2つのプロセスは改善すべき（2024年04月27日）
通話専用にオススメの通信サービス　楽天モバイルやpovo2.0を追加契約した方がお得？（2024年04月28日）
シャープ、5月8日にスマートフォンAQUOSの新製品を発表（2024年04月24日）
楽天系の支払い・ポイントサービスのスマホアプリが統合へ　「スマホ決済」が再び熱くなる？（2024年04月27日）
スマホを携帯キャリアで買うのは損？　本体のみをお得に買う方法を解説（2024年04月24日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

Google、マルチモーダル生成AIモデル「Gemini」発表　Ultraは“人間の専門家を上回る”

関連記事

関連リンク

アクセストップ10

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

Google、マルチモーダル生成AIモデル「Gemini」発表 Ultraは“人間の専門家を上回る”

関連記事

関連リンク

アクセストップ10

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

Google、マルチモーダル生成AIモデル「Gemini」発表　Ultraは“人間の専門家を上回る”