「AIのGoogle」復活に強い意志 Google I/O 2023で発表されたAIサービスまとめGoogle I/O 2023(1/2 ページ)

» 2023年05月11日 18時19分 公開
[山本竜也ITmedia]

 Googleは日本時間の5月11日2時から、年次開発者会議「Google I/O 2023」を開催しました。Google I/Oでは例年、新型Pixelスマートフォンなどのハードウェア製品の他、さまざまな新サービスも発表されており、今年も「Pixel 7a」「Pixel Fold」「Pixel Tablet」などに加えて、主にAIを活用した新サービスがいくつか発表されています。

Google I/O Google I/Oの基調講演ではAI関連の発表が多数行われました

 ここでは、ハードウェア以外に発表されたサービスに関してまとめたいと思います。

AIが返信メールの文面を書いてくれる「Help me write」

 Gmailにはメールの内容に合わせて短い返信文を提案する「Smart Reply」があり、英語やスペイン語などでは文章を入力中に続く文章の候補を表示する「Smart Compose」も利用できます、いずれも機械学習を用いた機能ですが、これらを拡張し、希望する内容を指示するとその文面を作成してくれる「Help me write」を発表しました。既にGoogleのチャットAIサービス「Bard」でもこれに近いことができますが、Help me writeでは、返信するメールの内容を踏まえた文章を生成できます。

Google I/O Gmailの文面を作成する「Help me write」

 基調講演では例として、飛行機が欠航したためバウチャー(クーポン)の提供を伝える航空会社からメールに対して、「ask for a full refund for this canceled flight」(欠航したフライトの全額返金をリクエストする)という指示を入力し、全額返金を求めるメールを作成する様子が公開されています。

Google I/O チャットAIのように短い指示を与えると、それに沿った文面を作成してくれる

 作成された文章は、直接編集することもできる他、「フォーマルに」「詳細に」「短く」などと指示して再作成も可能です。

Google マップの経路に沿ったイマーシブビュー

 Googleは2022年のGoogle I/Oで、Google マップに衛星写真とストリートビューから3次元画像を生成し、地図上の様子をより詳細に確認できるイマーシブビューを発表しました。今年はそれをさらに拡張し、Google マップで経路検索した際に、その経路に沿ったイマーシブビューを表示する新機能を発表しました。経路上の天気や空気の質なども確認できるとのことです。

Google I/O Google マップでは経路にそったイマーシブビューを表示可能に

 単に地図でルートを表示されるよりも、イマーシブビューで経路上の様子を確認できると、例えば「少し遠回りになるけど、こちらの方が緑が多くて気持ちが良さそう」などと経路を決めることができそうです。

 経路のイマーシブビューは、今夏に展開を開始し、年末までにロンドン、ニューヨーク、東京、サンフランシスコを含む15都市で利用可能になります。

Googleフォトに「Magic Editor」

 Pixel向けに提供されていた「消しゴムマジック(Magic Eraser)」は、Google Oneの加入特典として他のAndroid端末やiPhoneでも利用可能になりました。そして今年のGoogle I/Oでは、さらに強力な「Magic Editor」が発表されました。

 不要なものを削除するだけだった消しゴムマジックとは違い、Magic Editorでは空の様子を変更したり、被写体の位置をずらして写真中央に移動したりといったことが可能に。もともと写っていなかった部分はAIが自動的に補完します。

Google I/O Googleフォトにはあらたに「Magic Editor」を追加

 ここまで加工することに抵抗を覚える人もいるかもしれませんが、Photoshopで加工するのと大差はないともいえそうです。とはいえ、これが写真なのか、AIによる生成物なのかという議論は今後活発になるかもしれません。

 Magic Editorは今年後半に一部のPixelsスマートフォンで早期アクセスが開始される予定です。

次世代の大規模言語モデル「PaLM 2」発表

 生成AIなどで利用される大規模言語モデル(LLM)の次世代版となるPaLM 2も発表されています。高性能であると同時に、PaLMよりも高速かつ効率的になったとのことです。Gecko、Otter、Bison、Unicornというの4つのサイズがよういされており、このうち最小となるGeckoは、モバイルデバイス上でオフラインでの利用が可能となっています。

Google I/O 大規模言語モデルの最新版「PaLM 2」発表

 既にGoogle製品で利用されるLLMはPaLM 2に置き換わっているようで、実験的チャットAIのBardもPaLM 2になりました。これに伴い、新たに日本語と韓国語でも利用可能となっています。

 また、PaLM 2は機能を特化した形での利用で真価を発揮するとのこと。例えば、医学分野に特化して訓練された「Med-PaLM 2」は、米国医師免許試験問題の85%に正解できるとのこと。現在、X線やマンもグラフなどの情報から診断を行えるようにすることにも取り組んでいるとのことです。

 さらに、まだ学習中だという次世代基盤モデル「Gemini」についても触れられています。Geminiはマルチモーダル(テキストや画像、動画、音声などを一度に処理できる技術)でツールとAPIの統合が効率的になるよう、ゼロから作成されており、まだ初期段階ではあるものの、以前のモデルにはなかった優れたマルチモーダルが既に確認されているとのことです。

Bardが進化、日本語への対応も

 先に少し触れましたが、Googleの実験的チャットAI「Bard」の更新も発表されています。まず1つは、英語に加えて日本語と韓国語に対応し、180カ国以上で利用可能となっています。また、Bardの応答をGmailやGoogleドキュメントにエクスポート可能になり、ダークモードにも対応しました。

Google I/O Bardが日本語と韓国語に対応

 コーディング機能も強化されており、間もなく、コードの引用元を明確にするとのこと。注釈をクリックするだけでBardは引用した部分に下線を引き、ソースへのリンクを表示できるようになります。

 この他、現在Bardでは、生成したPythonのコードをColab(ブラウザ上でPythonのコードを記述・実行できるGoogleのサービス)にエクスポートできるようになっていますが、今後、Replit(オンライン統合開発環境)へのエクスポートもサポート予定となっています。

 さらに、Googleのサービスだけではなく、外部パートナーの拡張機能も利用可能になるとのこと。今後数カ月以内にAdobeの画像生成AI「Adobe Firefly」がBardから利用できるようになるとのことです。

Google I/O BardからAdobeの画像生成AI「Adobe Firefly」が利用可能に
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー

2024年