間近に迫ったWWDC23に何を期待するか? 多くの人はApple製HMDと答えるだろうが、筆者は違う。新たなAI戦略だ。
OpenAI ChatGPTとそのバリエーションであるMicrosoft Bing AI、Google Bardといった大規模言語モデル(LLM)や画像生成ではMidjourney、DALL-E、Stable Diffusion、Adobe Firefly、Photoshopジェネレーティブ塗りつぶしなどの生成AI(最近は生成系AIではなく生成AIとなったようだ)の勢いがすさまじい。
考えてみれば、ビッグテック、いわゆるGAFA、GAFAMの中で自ら生成AIに手を出していないのはAppleだけである。プロダクトとして出してはいないがF(Facebook=Meta)もLLaMAというLLMをオープンソースで提供していて草の根LLMブームを下支えしている。
そんな中、Appleはいったい何をしているのか。「うちはデバイスメーカーでプラットフォーマーだから」とあぐらをかいているだけさ……というのはちと考えにくい。
機械学習については自社での研究成果を表に出しているものの、生成AIについてAppleが目立った動きをしたのは、2022年12月に発表したStable DiffusionのAppleシリコンへの最適化への協力くらい。
Appleはこの分野においてはどう考えても出遅れている。そう思われても仕方がない。
生成AIの眠れる獅子、Appleは6月5日(日本時間では6日)に迫った世界開発者会議WWDC23で何を出してくるのか。今回はそれを考えてみたい。
現在、生成AIの中心として君臨しているのはOpenAIのChatGPTだ。ベースとなる技術をGPT-3.5turboからGPT4に上げ、回答の精度を向上させたが、それ以上に大きな衝撃を与えたのが、ChatGPTプラグインの登場だ。OpenAIはAPIを開放しており(有料だが)、チャットAPIと組み合わせたサードパーティー製プラグインを開発できるようにした。ChatGPTからはプラグインストアにアクセスもできる。
インプットはChatGPTで、アウトプットは用途に合わせたプラグインを使うことで、さまざまな分野に活用できる。その中の1つに、Wolfram ResearchのWolfram Alpha(Wolfram|Alphaとも表記する)がある。同社のMathematicaをベースにさまざまな計算の答えを出すことができる他、客観的事実に基づく回答を出す機能もある。Siriがいち早くこの機能をライセンスして組み込んだことも有名だ。
これはある意味、新たなアプリストアの誕生だ。App Storeのように売り上げから一定比率を徴取するわけではないが、サードパーティーまたはユーザーから使った分のAPI利用料を得られる。ChatGPTに入口としての汎用(はんよう)性があるからこそ成立するやり方であり、この方法であればApp Storeのいわゆる「Apple税」をスキップできる可能性すらある。
OpenAIはさらに踏み込んできた。iOS版ChatGPTの投入だ。GPT-4などの新機能が使えるChatGPT Plusのアプリ内課金にも対応している。料金は、Web版と同じく月額20ドル(日本では3000円)。アプリ版だからといって上乗せしていないところが良心的だ。
アプリストアとして競合する可能性があるとはいえ、少なくとも現段階ではOpenAIとAppleは敵対することなくスムーズに認可された印象を受ける。しかし、モバイルデバイスのプラットフォーマーとしては中抜きされてしまう可能性は残ったままだ。ちなみにiOS版ChatGPTアプリはプラグインには未対応である。
このiOS版が実によくできているのだ。特に音声認識。Siriでも使っているiOS標準の音声認識は「チャットジーピーティー」と話すと「チャットGPティー」とか「ちょっとGPティー」と書き取ってしまうが、ChatGPTアプリは「ChatGPT」または「チャットGPT」を認識。さらに、英語と日本語の混在もうまく認識してくれる。ただし、ローカル処理ではないので最終的な認識には時間を要する。
試しに、ChatGPTアプリにSiriとの違いを解説してもらった。
ChatGPTとSiriは、両方ともAIベースのインタラクティブな対話システムですが、いくつかの主な違いがあります。
1. 設計と目的: ChatGPTは、広範な一般的な知識を持つAI言語モデルであり、様々なトピックに関して対話できます。一方、Siriは、Appleのデバイス(iPhone、iPad、Macなど)に組み込まれた音声アシスタントです。Siriの主な目的は、音声による情報検索やデバイスの制御など、特定のタスクをサポートすることです。
2. インタフェース: ChatGPTは、テキストベースの対話を通じて情報をやり取りします。一方、Siriは、音声コマンドを使用して対話します。Siriは、音声入力と出力に特化しており、ユーザーの声に応答します。
3. データソースと学習: ChatGPTは、大量のインターネット上のテキストデータを学習しています。そのため、一般的な知識を持ち、幅広いトピックに対応できます。一方、Siriは、Appleが提供するデータとユーザーの利用履歴から学習しています。このため、特定のアプリやデバイスに関連した情報に特化しています。
4. カスタマイズ性と制限: ChatGPTは、幅広いトピックに対応する柔軟性がありますが、誤った情報を提供する可能性もあります。Siriは、Appleが設計したタスクに特化しており、Apple製品やアプリケーションに関する情報に特化しています。
総括すると、ChatGPTは一般的な対話や知識の共有に優れており、SiriはAppleデバイスの操作やアプリケーションの利用をサポートするために特化しています。
ここに書かれているように、双方にメリット、デメリットがあるのだが、両方をうまく組み合わせれば、より良い体験になるのではとは多くの人が思うところ。実際、それを試している例もいくつか登場している。
Copyright © ITmedia, Inc. All Rights Reserved.