Google I/O 2024
AIチャット「Gemini Advanced」に「Gemini 1.5 Pro」実装 日本語にも対応開始&スプレッドシードの分析なども可能に
米Googleは5月14日(現地時間)、大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入すると発表した。1.5 Proは100万トークン(おおむね単語数の意味)のコンテキストウィンドウ(AIモデルが応答を生成できるテキストの量)を持つAIモデル。最大1500ページの文書を読み解いたり、100件の電子メールを要約できたりするという。
コンテキストウィンドウを活用するために、Googleドライブ経由でGemini Advancedへファイルを直接アップロードできる機能も追加した。同社は「間もなく、1時間のビデオコンテンツや、3万行を超えるコードベースを処理できるようになる」とアピールしている。なお、Gemini 1.5 ProとGemini Advancedの両方で日本語に対応している。
これにより、GoogleドキュメントやPDF、スプレッドシードのデータをアップロードすることも可能に。Gemini Advancedをデータアナリストとして機能させることで、スプレッドシート上のデータの分析やグラフの構築などが可能になるという。
なお、アップロードしたデータは、AIモデルのトレーニングには使用しないとしている。
音声会話機能「Live」も数カ月以内に実装へ
また今後、Geminiのマルチモーダル機能を拡充する予定も明かした。Gemini Advancedの登録者向けに、音声会話機能「Live for Gemini Advanced」を数カ月以内に公開する予定。これはGeminiと声で双方向のコミュニケーションが可能になる機能で、同社はこれを「Live」と呼称している。
「Gemini Live を使用すると、Geminiに話しかけて、応答できるさまざまな自然な音声の中から選択できる。他の会話と同じように、自分のペースで話したり、応答の途中で中断して質問を明確にしたりすることもできる」(同社)
さらに2024年後半には、Live利用時にカメラを利用できるようにする予定。これによって、カメラで写したものについても会話が可能になるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
3
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
6
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
7
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
8
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
9
日本の「完璧主義」から脱却し中国ヒューマノイドにどう立ち向かうか
-
10
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR