検索
ニュース

「Geminiの技術は使うが、Geminiではない」 WWDC26で見えたApple流AIとプライバシー戦略の核心(2/5 ページ)

6月8日に開幕したAppleの開発者会議「WWDC26」の主役は、アーキテクチャが刷新された「Apple Intelligence」と、劇的な進化を遂げた次世代「Siri AI」だった。本記事では、Siriがどのようにパーソナルコンテキストを理解し、アプリを横断してタスクを処理するのかを見ていく。

Share
Tweet
LINE
Hatena

アーキテクチャーはどう変わったのか――1枚の図で読み解く


Apple Intelligenceの構成図。左側はデバイス上での処理、右側はプライベートクラウドコンピュートだ。青い部分はApple独自開発の部分、濃い青の部分はAppleとGoogleのコラボにより可能になった部分だ(ChatGPTを利用して筆者作成)

 Apple Intelligenceで、まず注目すべきはその「土台(アーキテクチャー)」が刷新されたことだろう。上の図が新しいApple Intelligenceの構造図だ。左の「On-device」、つまりあなたのiPhoneやMacといったデバイス上のAIの構成を、上から下へ見ていこう。

 一番上の「System experience」は、あなたが直接見える部分、つまり音声で話しかけたり、文字で要求をタイプしたり、Visual Intelligence機能で撮影したり、ダイナミックアイランドから飛び出てくる応答を読んだりといった「Siriとのやりとり」、Assistant experienceと呼ばれる部分だ。

 その下にずらりと並んでいる四角は、あなたが毎日使っているアプリ(Apps)だが、実は今後、これらのアプリもApple Intelligenceと連携を始める。

 今回、新たに加わった主役級のキャラが「System orchestrator(システムオーケストレーター)」と呼ばれる部分だ。

 要するに“司令塔”のことで、あなたの「あれやって」という頼みごとを受け取り、誰にどの仕事を振ればいいかを差配する、オーケストラの指揮者のような存在だと考えてほしい(私はこれまで、ソフトウェアデザインの観点から「ユーザーの要求を適材適所で他のAIやアプリに割り振る“番頭”の役割が必須になる」と予想してきた。今回姿を現したSystem orchestratorは、まさにその“番頭”に他ならない)。

 このSystem orchestratorは、3人の部下を従えている。アプリの機能を呼び出す「App toolbox」、デバイスの上の情報を探し出す「Spotlight index」、そして今あなたが画面で何を見ているかを把握する「On-screen context」だ。

 一番下に描かれているのは「On-device models」、つまりデバイスの中で動くAIの頭脳であり、中央に置かれた「AFM Core Advanced」がその中心だ。AFMとはApple Foundation Models、つまりApple独自のAIの頭脳のことだと覚えておけばいい。スマートフォンの中だけで完結する軽い仕事は、この頭脳が行っている。ただし、小さく薄く使えるエネルギーも限られたデバイス上の頭脳でできる処理は限られている。

 デバイス側の頭脳では、どうやっても対応しきれない問題に直面すると、図の右側のPrivate Cloud Computeのお出ましとなる。

 上の部屋「Models on Private Cloud Compute」には鍵マークが付いている。ここには大きくて賢い頭脳――テキスト用の「AFM Cloud」「AFM Cloud Pro」、画像用の「ADM Cloud」――が控えていて、デバイスだけでは手に余る重い仕事を引き受ける。

 鍵マークは「ここに送られたあなたのデータも厳重に守られる」という意味だ。下の「World Knowledge(世界の知識)」は地球儀のアイコンで、AppleがAIに学習させた世界に関する知識やWebを検索して得られる最新情報を表している。

 今回のApple IntelligenceではGoogleとのコラボレーションが話題になっているが、図では、どの部分で協力しているかも分かるようにした。

 色の薄い青が「Appleが独自に作った部分」、グラデーションの濃い青が「AppleとGoogleが協力した部分」となっている。よく見ると、頭脳にあたるAFM系のモデルの多くが、Googleとのコラボであることが分かる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る