米Google、「プロジェクトアストラ」を発表 スマホに映したモノをAIが“即解説” ユーザーからは「超クール」と期待の声:Google I/O 2024
米Google傘下のGoogle DeepMindは、AIアシスタントに関するプロジェクト「Project Astra」を発表した。
米Google傘下のGoogle DeepMindと米Googleは5月14日(現地時間)、AIアシスタントに関するプロジェクト「Project Astra」を発表した。「日常生活で本当に役立つ未来のAIアシスタントの構築を目指したプロジェクト」と紹介し、デモ動画を公開。スマートフォンでリアルタイムに撮影した物体について説明を求めると、AIがスムーズに回答する様子が映っている。
動画内では「Tell me when you see sometihng that makes sound.」(音が出るものを見たら教えて)と人が指示し、周りをスマホで撮影すると、米Googleの生成AI「Gemini」が「I see a speaker , which makes sound.」(音が出るスピーカーが見える)と答え、スピーカーがあることを説明する様子が確認できる。
その後、スマホに映ったスピーカーの音を発する部分に対して、画面上で矢印を手描きして「この部分は何と呼ぶの?」と説明を求めると、Geminiは「これはツイーターです」とスムーズにやりとりしている。他にも、PCモニターに映ったコードについて解説を求めると、わずか3秒ほどの間をおいて、その解説を始める様子などが映像には収録されている。
Google DeepMindのデミス・ハサビスCEOは自身のXアカウント(@demishassabis)で「長い間、私たちは日常生活で真に役立つ普遍的なAIエージェントを目指してきた」と明かし、別のデモ動画を公開している。なお、デモ動画はもう1本あり、同日に開催している米Googleの年次カンファレンス「Google I/O 2024」の基調講演の配信動画の様子をAIと一緒に視聴し、解説させている様子をGoogle DeepMindの公式X(@GoogleDeepMind)で公開している。
現段階ではプロジェクトの詳細などは説明おらず、サービスとして公開するのかなども不明。しかし、一連のデモ動画を見たユーザーからの期待度は高く「超クール」「これは本当にすごい」「私にとっての絶対的なゲームチェンジャーはAstraだ」など、AIと一緒に過ごす“未来の生活”に思いをはせる声が多く上がっている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIチャット「Gemini Advanced」に「Gemini 1.5 Pro」実装 日本語にも対応開始&スプレッドシードの分析なども可能に
米Googleは、大規模言語モデル「Gemini 1.5 Pro」をAIチャット「Gemini Advanced」に導入すると発表した。
米Google、大規模言語モデル「Gemini 1.5 Flash」発表 1.5 Proの軽量版 きょうから利用可能
米Googleは、大規模言語モデル(LLM)「Gemini 1.5 Flash」を発表した。
米Google、動画生成AI「Veo」発表 テキストから60秒超え動画を作成 サンプルも多数公開
米Googleは、動画生成AI「Veo」を発表した。
Google、オープンな生成AIモデル「Gemma」公開 商用利用OK、Geminiと同じ技術の軽量LLM
米Googleは、大規模言語モデル(LLM)「Gemma」を公開した。同社が開発するLLM「Gemini」に使ったのと同じ技術を活用して開発した軽量版LLMで、同社は「オープンなAIモデル」として位置付けている。商用利用も可能としている。
