「ChatGPT」アプリの登場で“生成AIとSiriの関係”はどう変わる? AppleのAI戦略を予想する:松尾公也のAppleWIRE(1/3 ページ)
間近に迫ったWWDC23に何を期待するか? 多くの人はApple製HMDと答えるだろうが、筆者は新たなAI戦略に期待する。WWDCで発表されるであろうiPhoneの次期OSであるiOS 17では、大規模言語モデル(LLM)が何らかの形で使えるようになるのではないか。
間近に迫ったWWDC23に何を期待するか? 多くの人はApple製HMDと答えるだろうが、筆者は違う。新たなAI戦略だ。
OpenAI ChatGPTとそのバリエーションであるMicrosoft Bing AI、Google Bardといった大規模言語モデル(LLM)や画像生成ではMidjourney、DALL-E、Stable Diffusion、Adobe Firefly、Photoshopジェネレーティブ塗りつぶしなどの生成AI(最近は生成系AIではなく生成AIとなったようだ)の勢いがすさまじい。
考えてみれば、ビッグテック、いわゆるGAFA、GAFAMの中で自ら生成AIに手を出していないのはAppleだけである。プロダクトとして出してはいないがF(Facebook=Meta)もLLaMAというLLMをオープンソースで提供していて草の根LLMブームを下支えしている。
そんな中、Appleはいったい何をしているのか。「うちはデバイスメーカーでプラットフォーマーだから」とあぐらをかいているだけさ……というのはちと考えにくい。
機械学習については自社での研究成果を表に出しているものの、生成AIについてAppleが目立った動きをしたのは、2022年12月に発表したStable DiffusionのAppleシリコンへの最適化への協力くらい。
Appleはこの分野においてはどう考えても出遅れている。そう思われても仕方がない。
生成AIの眠れる獅子、Appleは6月5日(日本時間では6日)に迫った世界開発者会議WWDC23で何を出してくるのか。今回はそれを考えてみたい。
ChatGPTアプリ登場の衝撃
現在、生成AIの中心として君臨しているのはOpenAIのChatGPTだ。ベースとなる技術をGPT-3.5turboからGPT4に上げ、回答の精度を向上させたが、それ以上に大きな衝撃を与えたのが、ChatGPTプラグインの登場だ。OpenAIはAPIを開放しており(有料だが)、チャットAPIと組み合わせたサードパーティー製プラグインを開発できるようにした。ChatGPTからはプラグインストアにアクセスもできる。
インプットはChatGPTで、アウトプットは用途に合わせたプラグインを使うことで、さまざまな分野に活用できる。その中の1つに、Wolfram ResearchのWolfram Alpha(Wolfram|Alphaとも表記する)がある。同社のMathematicaをベースにさまざまな計算の答えを出すことができる他、客観的事実に基づく回答を出す機能もある。Siriがいち早くこの機能をライセンスして組み込んだことも有名だ。
これはある意味、新たなアプリストアの誕生だ。App Storeのように売り上げから一定比率を徴取するわけではないが、サードパーティーまたはユーザーから使った分のAPI利用料を得られる。ChatGPTに入口としての汎用(はんよう)性があるからこそ成立するやり方であり、この方法であればApp Storeのいわゆる「Apple税」をスキップできる可能性すらある。
OpenAIはさらに踏み込んできた。iOS版ChatGPTの投入だ。GPT-4などの新機能が使えるChatGPT Plusのアプリ内課金にも対応している。料金は、Web版と同じく月額20ドル(日本では3000円)。アプリ版だからといって上乗せしていないところが良心的だ。
アプリストアとして競合する可能性があるとはいえ、少なくとも現段階ではOpenAIとAppleは敵対することなくスムーズに認可された印象を受ける。しかし、モバイルデバイスのプラットフォーマーとしては中抜きされてしまう可能性は残ったままだ。ちなみにiOS版ChatGPTアプリはプラグインには未対応である。
このiOS版が実によくできているのだ。特に音声認識。Siriでも使っているiOS標準の音声認識は「チャットジーピーティー」と話すと「チャットGPティー」とか「ちょっとGPティー」と書き取ってしまうが、ChatGPTアプリは「ChatGPT」または「チャットGPT」を認識。さらに、英語と日本語の混在もうまく認識してくれる。ただし、ローカル処理ではないので最終的な認識には時間を要する。
試しに、ChatGPTアプリにSiriとの違いを解説してもらった。
ChatGPTとSiriは、両方ともAIベースのインタラクティブな対話システムですが、いくつかの主な違いがあります。
1. 設計と目的: ChatGPTは、広範な一般的な知識を持つAI言語モデルであり、様々なトピックに関して対話できます。一方、Siriは、Appleのデバイス(iPhone、iPad、Macなど)に組み込まれた音声アシスタントです。Siriの主な目的は、音声による情報検索やデバイスの制御など、特定のタスクをサポートすることです。
2. インタフェース: ChatGPTは、テキストベースの対話を通じて情報をやり取りします。一方、Siriは、音声コマンドを使用して対話します。Siriは、音声入力と出力に特化しており、ユーザーの声に応答します。
3. データソースと学習: ChatGPTは、大量のインターネット上のテキストデータを学習しています。そのため、一般的な知識を持ち、幅広いトピックに対応できます。一方、Siriは、Appleが提供するデータとユーザーの利用履歴から学習しています。このため、特定のアプリやデバイスに関連した情報に特化しています。
4. カスタマイズ性と制限: ChatGPTは、幅広いトピックに対応する柔軟性がありますが、誤った情報を提供する可能性もあります。Siriは、Appleが設計したタスクに特化しており、Apple製品やアプリケーションに関する情報に特化しています。
総括すると、ChatGPTは一般的な対話や知識の共有に優れており、SiriはAppleデバイスの操作やアプリケーションの利用をサポートするために特化しています。
ここに書かれているように、双方にメリット、デメリットがあるのだが、両方をうまく組み合わせれば、より良い体験になるのではとは多くの人が思うところ。実際、それを試している例もいくつか登場している。
関連記事
AppleがiPhone/iPadの新アクセシビリティ機能を発表 簡易ホーム画面や自分の音声作成など
米Appleが5月16日(現地時間)、iPhone/iPadユーザーのアクセシビリティに関する新機能を発表。2023年後半以降の提供予定としている。新機能は主に認知、視覚、聴覚、身体に障害を持つ人にフォーカスしたものとなっている。ChatGPTを利用する際にやってはいけない3つのこと
相変わらず話題に事欠かない、ChatGPTを始めとする会話形AI。既に調べ物や書類作成などのとっかかりとして日常的に使っているという人も多いでしょう。ChatGPTのようなサービスはうまく使えば有用な反面、気を付けなければいけないこともいくつかあります。今さら聞けない「ChatGPT」:ビジネスに役立つ使い方と、間違った使い方
AIがさまざまな質問に答えてくれると話題の「ChatGPT(チャットGPT)」。使いはじめに役立つ基本のキをまとめました。質問するだけではない、オススメの使い方も紹介します。ChatGPT×LINEのサービスが急増 “スマホ視点”で対話型AIとの向き合い方を考える
画像・動画・3Dデータ・音楽・テキストなど、さまざまなコンテンツを一瞬で生成できるサービスが、既に市場にあふれている。AIチャットサービスをスマートフォンからも簡単に扱えるサービスも増えてきた。対話型AIサービスに対して、どのように向き合えばいいのかを考えてみたい。「ChatGPT」と「Microsoft Bing」は何が違う? スマホでの使い方から回答内容までを徹底比較
同じ言語モデル「GPT-4」をベースにした対話型AI「ChatGPT」と「Bing」。利用するにはどうすればよいのでしょうか。同じ質問をした場合、回答に差があるのかなどを検証しました。ChatGPTに「iPhoneとAndroidどちらがオススメなのか」聞いてみた
OpenAIが開発した対話型サービス「ChatGPT」が話題を集めています。そこで、ITmedia Mobileでは、モバイルに関連する質問を投げかけてみることにしました。今回質問したのは「iPhoneとAndroid、どちらがオススメですか?」です。
Copyright © ITmedia, Inc. All Rights Reserved.