Appleの生成AI「MM1」は何ができるの? 他のLLMを凌駕する性能とはCIO Dive

他のビッグテックが独自の生成AIを繰り出す中、慎重な姿勢を取ってきたApple。ついに同社の取り組みを明らかにする研究論文が発表された。他社のLLMを凌駕するApple製LLMの性能とは?

» 2024年04月16日 13時15分 公開
[Lindsey WilkinsonCIO Dive]

この記事は会員限定です。会員登録すると全てご覧いただけます。

CIO Dive

 2024年3月14日(現地時間、以下同)に発表された研究論文によると、Appleは複数のデータタイプとモデルアーキテクチャの組み合わせで訓練された、マルチモーダル大規模言語モデル(LLM)を構築している(注1)。この研究論文にはApple従業員約30人が著者として名を連ねている。

ついに明らかになった「MM1」 他のLLMを上回る性能とは? 

 Appleの研究者は、テキストのみのデータやキャプション付きの画像、画像と長文文書の組み合わせを利用して「MM1」を訓練した。OpenAIが開発した「ChatGPT」は公開後にアプトプットの質が低下したと話題になったが、Appleの研究者らはある手だてによってMM1のアウトプットが改善されることを確認したという。

 アウトプットを改善するためには、高解像度の写真を使ってLLMを微調整する必要がある。彼らはまた、LLMの計算能力を高める方法も発見した。このアプローチでは、複数の小さなサブネットワークをLLMに作成し、一部のサブネットワークを特定のプロンプトに従ってアクティブにする(注2)。

iPhoneにGeminiやChatGPTが搭載される?

 Appleは生成AI(人工知能)の“深い部分”に飛び込むのをためらっていたが、それももうすぐ終わりを迎えるかもしれない(注3)。

 ティム・クックCEOは「生成AIに関しては、社内で多くの作業を進めている。われわれは実際に仕事を進めてからその仕事について話すこと、そして先走らないというやり方を取っている」と、2024年2月に開催された同社の第1四半期決算説明会で述べた(注4)。

 クック氏によると、同社はこれまでAIに膨大な時間と労力を費やしてきたという。

 Appleは2023年5月、機密データの流出が懸念されることを理由として、OpenAIの「ChatGPT」とMicrosoftが支援する「GitHub Copilot」の社内での利用を制限したと報じられた(注5)。

 サイバーセキュリティトレーニングを提供する研究・教育機関SANS Technology Instituteのエド・スクーディス氏(プレジデント)は「CIO Dive」に対し、「GitHub Copilotを使用しているとMicrosoftに情報が流出する可能性が高い。Appleがあらゆる機密をMicrosoftに漏らしたくないと考えるのは当然だ」と語った。Appleは、容易にアクセスできる既製の生成AIツールの代替手段を従業員に与えようとしている。

 Bloombergが2023年7月に報じたところによると、Appleは構築したLLMをテストするために社内でチャットbotを展開した(注6)。2024年3月18日にはiPhoneのAI機能にGoogleの「Gemini」やChatGPTを組み込むことを検討しているとも報じられた(注7)。

 Appleの調査によると、MM1はキャプションの作成や視覚的な質問応答において他のLLMを大きく上回っているという。

 生成AIを顧客に提供する方法といった詳細については「2024年後半に発表する」とクック氏は述べる。例年開催している同社の開発者向けイベント「Worldwide Developers Conference」(WWDC)は2024年6月10〜14日にオンラインで実施する予定だ。

© Industry Dive. All rights reserved.