AIチャット「Gemini Advanced」に「Gemini 1.5 Pro」実装　日本語にも対応開始＆スプレッドシードの分析なども可能に：Google I/O 2024

» 2024年05月15日 04時33分公開

　米Googleは5月14日（現地時間）、大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入すると発表した。1.5 Proは100万トークン（おおむね単語数の意味）のコンテキストウィンドウ（AIモデルが応答を生成できるテキストの量）を持つAIモデル。最大1500ページの文書を読み解いたり、100件の電子メールを要約できたりするという。

大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入

　コンテキストウィンドウを活用するために、Googleドライブ経由でGemini Advancedへファイルを直接アップロードできる機能も追加した。同社は「間もなく、1時間のビデオコンテンツや、3万行を超えるコードベースを処理できるようになる」とアピールしている。なお、Gemini 1.5 ProとGemini Advancedの両方で日本語に対応している。

　これにより、GoogleドキュメントやPDF、スプレッドシードのデータをアップロードすることも可能に。Gemini Advancedをデータアナリストとして機能させることで、スプレッドシート上のデータの分析やグラフの構築などが可能になるという。

　なお、アップロードしたデータは、AIモデルのトレーニングには使用しないとしている。

音声会話機能「Live」も数カ月以内に実装へ

　また今後、Geminiのマルチモーダル機能を拡充する予定も明かした。Gemini Advancedの登録者向けに、音声会話機能「Live for Gemini Advanced」を数カ月以内に公開する予定。これはGeminiと声で双方向のコミュニケーションが可能になる機能で、同社はこれを「Live」と呼称している。

音声会話機能「Live for Gemini Advanced」

　「Gemini Live を使用すると、Geminiに話しかけて、応答できるさまざまな自然な音声の中から選択できる。他の会話と同じように、自分のペースで話したり、応答の途中で中断して質問を明確にしたりすることもできる」（同社）

　さらに2024年後半には、Live利用時にカメラを利用できるようにする予定。これによって、カメラで写したものについても会話が可能になるとしている。

米Google、動画生成AI「Veo」発表　テキストから60秒超え動画を作成　サンプルも多数公開
米Googleは、動画生成AI「Veo」を発表した。
米Google、大規模言語モデル「Gemini 1.5 Flash」発表　1.5 Proの軽量版　きょうから利用可能
米Googleは、大規模言語モデル（LLM）「Gemini 1.5 Flash」を発表した。
有料クラウドストレージ「Google One」ユーザーが1億人突破　「Gemini Advanced」効果も
Googleの有料クラウドストレージ「Google One」の加入者数が2月9日、1億人を突破した。前日発表の生成AI「Gemini Advanced」を使うには、新プラン「AIプレミアム」に加入するしかない。
Google、「Gemini 1.5 Pro」限定リリース　コンテキストウィンドウは100万トークン
Googleは、生成AIの次世代モデル「Gemini 1.5」を発表した。動画なら1時間、音声なら11時間、コードなら3万行、ワードなら70万語を1度に処理できるとしている。まずはVertex AIとAI Studioユーザーに限定プレビューを提供する。