検索
ニュース

「Geminiの技術は使うが、Geminiではない」 WWDC26で見えたApple流AIとプライバシー戦略の核心(4/5 ページ)

6月8日に開幕したAppleの開発者会議「WWDC26」の主役は、アーキテクチャが刷新された「Apple Intelligence」と、劇的な進化を遂げた次世代「Siri AI」だった。本記事では、Siriがどのようにパーソナルコンテキストを理解し、アプリを横断してタスクを処理するのかを見ていく。

Share
Tweet
LINE
Hatena

Siri AIで何ができるのか――他のAIとの違いを体系的に整理する

 では、進化したApple Intelligenceとそれを動かすSiri AIで、実際にどんなことができるのだろうか。機能の柱は5つに分けられる。


プライバシーへの配慮は最大限に図ったという。だから、安心して極めてプライベートなことについてもアシストをする、というのがApple Intelligenceのスタンスだ。ここでは、これから訪れる絶景スポット近くに住む友人の住所を過去のメッセージのやり取りから見つけ出している。

 1つ目は「パーソナルコンテキスト理解」だ。友人がメッセージで勧めてきたレストランを探したり、古いメールからホテルの予約確認番号を引き出したり、最近の旅行で家族と撮った写真を呼び出したりできる。前述の見積もり比較や、写真を家族の共有アルバムに追加する操作もこれにあたる。

Webを検索して最新情報について答えられるのもSiri AIの強さだ。間もなく開催されるコンサートの日時をWebで調べて教えた後、どうやったらチケットが入手できるかを聞くと「抽選になっている」と教えてくれる。「抽選日にリマインダーを設定して」と頼むとリマインダーをセットしてくれる

 2つ目は「広範な世界知識」だ。Apple IntelligenceはWeb上の最新情報を取得し、Private Cloud Computeを使って答えを生成できる。コンサートの開催日を調べてチケット入手方法を尋ね、抽選のあるチケットであれば、抽選日のリマインダーを設定する――といった操作が会話だけでシームレスにできてしまう。


Apple Intelligenceは、画面上に表示された内容についても把握できる。ここでは開いた書類に書かれている内容について質問しようとしている。

 3つ目は「オンスクリーン認識」と「アプリ操作」だ。今使っているアプリと作業内容に応じてSiriが手助けを調整し、メールをゼロから書いたり写真を編集して共有したりといった、複数アプリにまたがる作業をこなす。

カメラで捉えた情報も認識可能で、しかも、その情報をうまく活用できる。ここでは飲食店でのレシートを元に誰が何を食べたからいくら支払う必要があるか個別精算をアシストしている。

Apple Vision Proでは、卓上のブーツを見ただけで商品情報などを元に大きさを推定し、リュックに収まるかを教えてくれる

 4つ目は「ビジュアルインテリジェンス」だ。iPhoneではカメラアプリに新しいSiriモードとして統合され、シャッターボタンを押すだけでSiriが目の前のものを見て役立つ応答を返す。料理にかざせば栄養情報が得られ、iPadではスクリーンショット、Macではキーボードショートカット、Vision Proでは見ているものに視線を向けるだけで使える。

 今回、基調講演で個人的に驚いたのが、このApple Vision Proのデモだ。Webブラウザ上でECサイトのリュックサックの商品ページを見ながら「このリュックサックは機内に持ち込める?」とSiri AIに聞くと、カレンダーからアイスランドへの旅行があることを調べ、その飛行機チケットの手荷物のポリシーと照らし合わせながら、「はい。この商品は機内に持ち込めます」と教えてくれる。

 さらにテーブルに置かれたブーツを見て「これはリュックに入る?」と聞くと、商品情報を調べて容量的に入るかを教えてくれる、というものだ。どの程度、正確かは分からないが、本当にここまでの相談ができるなら、いろいろと利便性が高まりそうだ。

文章の下書きを書くといったこともこれまで通り可能だ。これまで通りChatGPTを使うオプションも残るのか、ChatGPT連携時代の「作文ツール」はどうなるのかは気になるポイントだ

 Siri AIの機能の柱で5つ目は、「ライティングツール」だ。どこで入力していてもSiriで文章を書け、MailやMessagesでは相手ごとの普段のコミュニケーションの仕方を反映する。さらにシステム全体で自動校正が働き、サードパーティー製アプリの多くでも利用できる。

 これらに加え、Image Playgroundも進化し、フォトリアリスティックを含むより柔軟で幅広いスタイルの高品質な画像を生成できるようになるという。

Image Playgroundも大幅に進化し、よりリアルな絵が描けるようになったのに加え、絵の部分修正などができるようになった。これは他の描画AIと比べた際に強みになる可能性がある

 ここで、これまでのApple Intelligenceや他社の生成AIと比較しておきたい。

 最新のSiri AIと、これまでのSiriとの最大の違いは、「会話の連続性」と応じてくれる相談内容の圧倒的な幅の広さだ。

 AIを中核に据えて再構築されたSiri AIは、はるかに有能なアシスタントに進化している。会話履歴を後から振り返れる専用のSiriアプリも新設された。ここで特筆すべきは、その会話の履歴の見た目の美しさだ。他の生成AIの履歴機能というと文字が中心で読み込まないと区別がつかない。

 しかし、そこはさすが圧倒的なデザイン力を持つAppleだ。AIとの過去の知的なやり取りを視覚的にもすぐに見つけ出し、振り返ることができる美しく考えられた画面設計になっていそうだ。

 またiCloudを通じてプライベートに同期されるため、iPhoneで始めた会話をiPadで続け、Macで仕上げる、といった使い方もできるようになった。

 ChatGPTやClaude、Geminiといった汎用(はんよう)の生成AIと比べると、Apple Intelligenceの立ち位置はより明確だ。これらが「対話の中で何でも答えるチャットボット」を出発点とし、最近ではPCの画面を乗っ取って、アプリの操作もできるようになってきた。ただし、どのウィンドウがどのアプリのものかとか常に画面を認識しながら作業を行うので、実は作業スピードは人間と比べてもかなり遅くじれったいことが多い。

 これに対して、Apple IntelligenceはOSを提供する会社であるAppleの機能だ。

 OSやアプリに自然に溶け込んでおり、アプリの側もAIと連携するように設計変更を頼まれている。つまり、人間のようなマウス操作を再現しながら処理をするのではなく、Apple Intelligenceと各アプリが直接データをやり取りしながら目的を達成していくため、無駄がなく効率的だ。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る