Google I/Oで明かされたAndroidの進化 日本で「Googleメッセージ」開始、RCS対応でKDDIと連携(1/2 ページ)
Googleは、5月14日から15日(現地時間)に渡り、米カリフォルニア州マウンテンビューで、開発者向けイベントの「Google I/O」を開催している。生成AIモデルGeminiの最新版である「Gemini 1.5 Pro」や、高速版の「Gemini 1.5 Flash」を発表するとともに、Google DeepMindが開発中のAIエージェント「Project Astra」を披露した。Androidの新機能や、日本での「Googleメッセージ」対応も発表した。
Googleは、5月14日から15日(現地時間)に渡り、米カリフォルニア州マウンテンビューで、開発者向けイベントの「Google I/O」を開催している。14日の基調講演では、同社CEOのスンダー・ピチャイ氏ら幹部が登壇。生成AIモデルGeminiの最新版である「Gemini 1.5 Pro」や、高速版の「Gemini 1.5 Flash」を発表するとともに、Google DeepMindが開発中のAIエージェント「Project Astra(アストラ)」を披露した。
OpenAIの「GPT-4o」に真っ向から対抗 よりリアルなシーンでAIを生かす方法を提示
ピチャイ氏が、冒頭、「われわれは10年以上に渡ってAIに投資してきた。そして、研究開発や製品、インフラといったあらゆるレイヤーに革新を起こしてきた」と語ったように、基調講演はAIに特化したストーリーで組み立てられていた。上記のGeminiやAstraはもちろん、AndroidやGoogleの各サービスに、どのような形でAIが生かされていくのかといった内容が話題の中心だった。
Google I/Oの会期前日にあたる13日(現地時間)には、OpenAIがマルチモーダルに対応した「GPT-4o」を発表しているが、それに真っ向から対抗した格好だ。AIの性能披露に特化していたOpenAIに対し、ユーザーに定着しているサービスを抱えるGoogleは、よりリアルなシーンでAIを生かす方法を提示しているようにも見えた。AndroidでのAI活用は、その一例といえる。
【訂正:2024年5月16日11時15分 初出時、20億ユーザーの表記に誤りがありました。おわびして訂正いたします。】
GeminiをAndroidのAIアシスタントとして採用、画面上でオーバーレイする新機能も
Androidはそれをユーザーに広げる最大のプラットフォーム。基調講演でも、AIをコアにしたAndroidの新機能が大々的に紹介された。その1つが、サムスン電子のGalaxyや、GoogleのPixelが対応している「かこって検索」だ。この機能が進化し、方程式を解いたり、数学の証明問題を解いたりといったことが可能になる。かこって検索は、現在対応端末が限定されているが、Googleによると、2024年末までに2億台で利用可能になることが明かされている。
もう1つが、GeminiをAndroidのAIアシスタントとして採用していく方針だ。現在、一部の端末には通知が届き、アシスタント機能をGoogleアシスタントからGeminiに置き換えることが可能。ルーティンなどの家電をコントロールする機能の一部が非対応だが、生成AIを活用することで受け答えがより自然に、かつ賢くなる。
基調講演で新たに紹介されたのが、画面上にオーバーレイする形でGeminiが表示され、生成されたテキストや画像をそのままバックグラウンドのアプリにドラッグ&ドロップできる機能だ。また、現状ではPDFの要約は、スクリーンショットを送る形になっているが、これも直接その中身を読み取れるようになる。
さらに、Androidでは、オンデバイスのAIも強化。新たに詐欺電話の内容を解析して、それをユーザーに警告する機能にも対応していく。GoogleでAndroidなどのプロダクトマネージメントを統括するサミール・サマット氏は、こうした一連の機能を「Androidだけ」と強調。iOSに比べ、AI活用が進んでいることをアピールしていることをほのめかした。
新AIエージェント「Project Astra」を試してみた
現状ではあくまでプロジェクトという位置付けで製品にはなっていないが、Project Astraも、スマホのマイクやカメラといったデイバイスから得た複数の情報を分析、活用するマルチモーダルのAIだ。こちらは、囲碁プログラムの「AhphaGo」や「AlphaGo ZERO」を手掛けてきがGoogleのDeepMindが開発。Geminiも統合している。
基調講演もデモでは、カメラを通じてオフィスの中にあるさまざまな物体を認識しつつ、ユーザーの質問にテンポよく回答していく映像が流された。しかも、Project Astraは、その情報を記憶しており、最後にメガネがどこにあるのかを言い当てることまでできた。Project Astraは、2024年にGeminiに搭載されることになるという。
Google I/Oの会場では、そのProject Astraを実際に試すこともできた。筆者が選んだのは、画面上に描いたものが何かを言い当てるゲーム。線を描いていき、Project Astraに質問を投げかけると、それが何かを説明しようとする。絵を書き進めていくと、答えがより正解に近づいていく格好だ。その様子は、以下の動画を確認してほしい。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など
米Googleが、Android向けに搭載するAI関連の新機能を発表した。特定の部分を丸で囲って検索ができる「かこって検索」を、学習に活用できるようにする。Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。Google、マルチモーダルなAIアシスタント「Project Astra」デモでARメガネをチラ見せ
GoogleはリアルタイムのマルチモーダルAIアシスタントプロジェクト「Project Astra」を発表した。デモ動画には、Pixel搭載のプロトタイプとの会話を途中でARメガネに切り替える場面も。Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗
Googleは「Google I/O 2024」で、テキストから動画を生成するAIモデル「Veo」を発表した。ウェイティングリストに登録できる。1080pの1分以上の動画を生成できる。Google フォト、Geminiを活用した「Ask Photos」機能 質問して写真を検索
米Googleが、Google フォトにAIモデル「Gemini」を活用した検索機能「Ask Photos」を発表した。試験的な機能として、今後数カ月にわたって提供する。Google フォトのチャット画面で問いかけることで、特定の思い出を探したり、写真や動画に含まれる情報を探したりできる。Googleが「Gemini 1.5 Pro」をアップデート、軽量版「Gemini 1.5 Flash」もリリース
米Googleが5月14日(現地時間)、マルチモーダル生成AIモデル「Gemini」のアップデートについて発表した。「Gemini 1.5 Pro」のコンテキストウィンドウを100万トークンから200万トークンに拡張。高速な応答が可能な軽量モデル「Gemini 1.5 Flash」もリリースする。