米Appleの年次開発者会議「WWDC 2026」では、かねてよりの予告通り、「Apple Intelligence」と「Siri」の大幅な刷新が発表された。2024年に発表したものの、当初予定していた性能を発揮しきれず、2年の間にプロジェクトを「リブート」し、今回の刷新となった。
では、Apple IntelligenceとSiriはどう変わったのだろうか? 現地取材で見えてきたことをまとめてみたい。
Apple Intelligenceとは、Apple製品で横断的に使われるAI機能の総称だ。2024年に発表されたものが第1世代とすると、それを2025年に改良したのが第2世代であり、今回の大幅刷新で「第3世代」に移行する。
第3世代のApple Intelligenceを使ったSiriは「Siri AI」と呼ばれる。音声やテキストでの対話はもちろん、画像内の内容や、デバイス内のメール・メッセージ・画像・ファイルなどを把握し、それらから得た「個人の文脈」を生かしてより多彩なAI処理を可能にする。
例えばメールの返事を代筆するとき、対話する相手との関係性を生かす。相手が友人であれば友人相手らしく、会社の上司であれば上司を相手にするのにふさわしい文体で文章を作る。友人とのホームパーティーを企画する場合にも、過去の会話から、利用者と対話しつつ内容を考える。
こうしたことは、第3世代Apple Intelligenceが大きく刷新されているものでありつつ、「プライバシー重視」という基本的な方針を、2024年のApple Intelligenceから変えていないために実現できている。プライバシーを重視し、データはあくまで「機器を利用する個人」に帰属し、Appleも利用しないし蓄積もしない。
処理の大半はデバイス内で処理する「オンデバイス」構成であり、クラウドを必要とする処理も、Appleが作った「Private Cloud Compute(PCC)」で処理する。PCCはデータを蓄積する構造を持たず、ユーザーの持つデバイスの「処理命令」に応じてクラウドで処理をし、終わったらデバイスに結果を返して、処理データを捨てる。というよりも、処理終了後に残しておく機能自体がない。
オンデバイスが基本であり、PCCを併用するという形であるため、Apple Intelligenceの利用は基本的に無料だ。これは、機能を利用する消費者から見ても、Apple Intelligenceに内包されるAIモデル「Apple Foundation Model(AFM)」を活用するデベロッパーにとっても、非常に重要なことだ。
ただし、第3世代からは「全ての要素が常に無料」ではなくなった。画像を大量に生成した場合などは、有料サービスである「iCloud+」の利用者が有利になる。この点は後ほど解説する。
第3世代=リブートしたApple Intelligenceの最大の特徴は、いわゆるエージェンティックAI的動作が増えたことだ。
命令を与えるとSiriが把握し、内容を分析してAIモデルで個別に処理する。AIの処理内容の決定には、オンデバイスで動作する「System Orchestrator」が使われ、Appleデバイス内にあるメールやメッセージ、画像、ファイルなどをインデックス化した情報を元に「自分にあった回答」「その場にふさわしい回答」などを目指す。
オンデバイス処理のイメージは以下の画像になる。システムの中の複数の要素がAFMと呼ばれるオンデバイスAIの元に動作する。
また従来、Apple Intelligenceの機能はデバイスごとに機能の差異が大きかった。例えば、画像から内容把握や予定の登録などを実現する「Visual Intelligence」は「iPhone」のみのもので、「Mac」や「iPad」で使える機能が限られていた。
しかし第3世代から製品種別ごとの差異は小さくなり、基本的には、主要デバイス全てで同じ機能が使えるようになっている。今回、WWDCでの変更といえるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR