GeminiにPDFやWord、Excel、テキストファイルなどの検索機能を組み込める「File Search in Gemini API」提供開始
Google Cloudは、同社の生成AIサービスであるGeminiに、PDFやWord、Excel、テキストファイルなどのさまざまなファイル形式を読み込ませて検索可能にするフルマネージドなRAGシステム「File Search in Gemini API」の提供開始を発表しました。
この記事は新野淳一氏のブログ「Publickey」に掲載された「GeminiにPDFやWord、Excel、テキストファイルなどの検索機能を組み込める「File Search in Gemini API」提供開始、フルマネージドなRAGシステムを提供」(2025年11月10日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
Google Cloudは、同社の生成AIサービスであるGeminiに、PDFやWord、Excel、テキストファイルなどのさまざまなファイル形式を読み込ませて検索可能にするフルマネージドなRAGシステム「File Search in Gemini API」の提供開始を発表しました。
Geminiのような生成AIを企業内で活用するとき、Geminiに社内のドキュメントなどを読み込ませることで社内固有の質問に関してもGeminiが回答できるようになります。
このときによく使われるのがRAG(Retrieval-Augmented Generation)と呼ばれる手法です。
しかしRAGのためのシステムを構築するには、RAG構築のためのサービスやベクトルデータベースなどを用意し、必要に応じて前処理やプログラミングなどを行い、Geminiなどの生成AIと組み合わせるなどの作業が求められます。
File Search in Gemini API
今回発表された「File Search in Gemini API」は、外部サービスなどを組み合わせることなくAPIを操作するだけでGeminiに対応したRAGを構築できるというものです。
具体的にはAPIを通じてまず検索対象となるファイルを保存する「ファイル検索ストア」を作成し、そこにファイルをアップロードします。
そのファイル検索ストアにファイルをアップロードすると、自動的にチャンク化され、ファイル検索エンベディングに変換されて、インデックスが作成されます。
アップロードしたファイル自体は48時間後に削除されます。
そしてファイル検索ツールファイル検索ストアを指定することにより、Geminiが指定されたファイル検索ストアでセマンティック検索を実行し、情報を見つけられるようになります。
検索結果にはアップロードしたドキュメントのどの部分が回答の生成に使用されたかが示される引用情報が含まれることがあります。これによりファクトチェックが可能になります。
現時点でサポートされているGeminiのモデルは「gemini-2.5-pro」と「gemini-2.5-flash」の2つ。
対応する主なファイルフォーマットはPDF、Word、Excel、ECMAScript/JavaScript、JSON、Latex、HTML、Markdown、RTF、プレーンテキストなどです。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google、検索・広告トップ交代やGeminiアプリのGoogle DeepMindへの移管を発表
Googleは、検索・広告部門で長年責任者を務めてきたプラバカール・ラガヴァン氏の後任にニック・フォックス氏を指名した。また、Geminiアプリを傘下のGoogle DeepMindに移管する。
Google、ChromeにGeminiボタンを追加し、AIブラウザに
Googleは、デスクトップ版Chromeに「Geminiボタン」を追加すると発表した。複数タブの要約や比較、YouTube動画との連携などが可能になる。またアドレスバーに「AIモード」を導入し、複雑な質問にも回答するようになる。まず米国で提供を開始し、順次世界展開する予定だ。
Google Cloudとオラクルが提携、Oracle Cloud上でGeminiを提供開始
Google Cloudと米Oracleは生成AIにおける提携を拡大し、Gemini 2.5などGoogle Cloudの最新の生成AIモデルをOracle Cloudで提供することを発表しました。
生成AIの弱点が相次ぎ発覚 ChatGPTやGeminiがサイバー攻撃の標的に 情報流出や不正操作の恐れも
米OpenAIの「ChatGPT」やGoogleの「Gemini」など、主要生成AIの弱点や脆弱性が次々に発覚している。
