Googleが「Gemini 1.5 Pro」をアップデート、軽量版「Gemini 1.5 Flash」もリリース
米Googleが5月14日(現地時間)、マルチモーダル生成AIモデル「Gemini」のアップデートについて発表した。「Gemini 1.5 Pro」のコンテキストウィンドウを100万トークンから200万トークンに拡張。高速な応答が可能な軽量モデル「Gemini 1.5 Flash」もリリースする。
米Googleが5月14日(現地時間)、マルチモーダル生成AIモデル「Gemini」のアップデートについて発表した。
2024年2月にリリースした「Gemini 1.5 Pro」のコンテキストウィンドウ(一度に処理できる単語や画像などの構成要素)を100万トークンから200万トークンに拡張。さらに、コード作成やマルチターン会話、音声や画像の理解などの品質も向上させた。例えば、レストランで撮影した料理のレシピを教えてもらったり、数学の問題の写真を撮って解き方を教えてもらったりすることが、1枚の画像からできるという。
Gemini 1.5 Proよりも高速な応答が可能な軽量モデル「Gemini 1.5 Flash」もリリースする。要約、チャット、チャットアプリ、画像やビデオのキャプション、文章や表からのデータ抽出に優れているという。
Gemini 1.5 Proと1.5 Flashでは100万トークンのコンテキストウィンドウを利用できる。100万トークンあれば、合計1500ページのドキュメントを理解したり、100件のメールを要約したりできるという。長いコンテキストウィンドウを活用できるよう、Google ドライブ経由でファイルをGemini Advancedにアップロードできる機能も追加した。
Gemini 1.5 Proで200万トークンを利用するには、Google AI StudioまたはGoogle Cloudユーザー向けのVertex AIの待機リストに参加する必要がある。
Gemini 1.5 ProとGemini Flashのいずれも、現在200以上の国と地域でプレビュー版を提供しており、6月に一般提供する予定。1.5 Proは、150カ国以上と35以上の言語にて、有料プランGemini Advancedの契約者が利用できる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google、マルチモーダル生成AIモデル「Gemini」発表 Ultraは“人間の専門家を上回る”
米Googleは12月6日(現地時間)、マルチモーダル生成AIモデルの第1弾として「Gemini」を発表した。データセンターからモバイルデバイスに至るまでのあらゆる場所で効率的に動作するという。年次開発者会議「Google I/O」で予告されていた。「Pixel 8 Pro」にGoogleの生成AIモデル「Gemini Nano」搭載 その他の「Feature Drops」も一気に紹介
GoogleはOpenAIのGPT-4と競合する新生成AIモデル「Gemini」を発表した。その最小モデル「Gemini Nano」は「Tensor 3」搭載の「Pixel 8 Pro」で利用可能に。今年最後の多数の「Feature Drops」も紹介した。日本ではダウンロード未対応の「Gemini」アプリをPixel 7で使ってみた
Googleは2月8日、会話型生成AIサービス「Bard」の名称を利用している大規模言語モデル(LLM)と同じ「Gemini」に改称。これに合わせ、新たにモバイルアプリも発表しました。日本ではGoogle Playからまだダウンロードできませんが、Pixel 7では使用可能なので試してみました。Geminiとの会話、一部のAndroid端末の「メッセージ」で可能に
Googleは、Androidで使える複数のAI関連新機能を発表した。例えば、一部のAndroid端末では「メッセージ」で生成AI「Gemini」と会話できるようになる。まずは英語のみではあるが、日本もサポート対象地域だ。Google、マルチモーダル生成AIモデル「Gemini」のアプリ発表 「Bard」の名称変更も
米Googleは2月8日(現地時間)、マルチモーダル生成AIモデル、「Gemini」のスマートフォン向けアプリを発表。高性能AIモデルがモバイルデバイスに開放された格好。合わせて、常に複雑なタスクに対応する、高性能かつ最大のモデルである「Gemini Ultra 1.0」を搭載した「Gemini Advanced」も発表された。