米Googleは5月29日(現地時間)、開発者会議「Google I/O 2026」で、ユーザーの日常的なデジタル業務を自律的に処理するパーソナルAIエージェント「Gemini Spark」を発表した。従来のAIアシスタントが「質問への回答」にとどまっていたのに対し、Gemini Sparkはユーザーの指示のもとで能動的に「行動」することを最大の特徴としている。
Gemini Sparkは、最新モデル「Gemini 3.5」とエージェント開発プラットフォーム「Antigravity」を基盤に構築されており、Google Cloud上の専用仮想マシンで動作する。ユーザーがノートPCを閉じたりスマートフォンの画面をロックしたりした後も、バックグラウンドでタスクを継続できる点が従来にない特徴だ。AndroidとiOSの両方に対応しており、すべてのタスクやステータスはデバイス間でリアルタイムに同期される。
Gmail、Googleドキュメント、Googleスライド、GoogleドライブなどのGoogle Workspaceのツールと連携し、複雑なワークフローを代行する。例えばイベントの出欠確認をGmailから自動集計してスプレッドシートに反映したり、未回答者へのリマインダーメールを送ったりといった一連の作業をまとめて処理できる。また「Ghostwriter」と呼ばれるスキルを使えば、ユーザー自身の文体を学習し、本人らしいトーンでメールや報告書の下書きを作成することも可能だ。さらに、複数のタスクを音声でまとめて伝えるだけでAIが個別に分解・整理して実行に移す「ブレインダンプ」機能も備える。
自律的な動作が拡大するため、安全性の確保にも配慮しているという。メールの送信や支払い、カレンダーへの予定追加など、影響の大きい操作を実行する前には、必ずユーザーに確認を求める設計になっている。また、専用ダッシュボードからバックグラウンドで動いているタスクをリアルタイムで確認、管理できるため、AIが何をしているかを常に把握できるとしている。
外部サービスとの連携についても予定が示された。MCP(Model Context Protocol)を通じて今夏にはCanva、OpenTable、Instacartなどのサードパーティツールとの接続が始まる。
同じく今夏にはChromeブラウザ内で直接動作するようになるほか、複数のWebサイトをまたいでタスクをこなす「エージェント型ブラウザ」としての機能も追加される予定だ。
今週から信頼できるテスター向けに先行提供を開始し、来週には米国のGoogle AI Ultra加入者向けにβ版を公開する予定だ。
Google検索が「AI検索」に──エージェント機能やマルチモーダル入力に対応
現実世界を基に"動き回れる"仮想空間を生成 Googleの世界生成AI「Project Genie」にストリートビュー連携機能
Google、AIグラス発売へ オーディオグラスは26年秋、ディスプレイ内蔵タイプも投入予定
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR