Appleの生成AI「MM1」は何ができるの？　他のLLMを凌駕する性能とは：CIO Dive

他のビッグテックが独自の生成AIを繰り出す中、慎重な姿勢を取ってきたApple。ついに同社の取り組みを明らかにする研究論文が発表された。他社のLLMを凌駕するApple製LLMの性能とは？

LINE

Hatena

　2024年3月14日（現地時間、以下同）に発表された研究論文によると、Appleは複数のデータタイプとモデルアーキテクチャの組み合わせで訓練された、マルチモーダル大規模言語モデル（LLM）を構築している（注1）。この研究論文にはApple従業員約30人が著者として名を連ねている。

ついに明らかになった「MM1」他のLLMを上回る性能とは？　

　Appleの研究者は、テキストのみのデータやキャプション付きの画像、画像と長文文書の組み合わせを利用して「MM1」を訓練した。OpenAIが開発した「ChatGPT」は公開後にアプトプットの質が低下したと話題になったが、Appleの研究者らはある手だてによってMM1のアウトプットが改善されることを確認したという。

　アウトプットを改善するためには、高解像度の写真を使ってLLMを微調整する必要がある。彼らはまた、LLMの計算能力を高める方法も発見した。このアプローチでは、複数の小さなサブネットワークをLLMに作成し、一部のサブネットワークを特定のプロンプトに従ってアクティブにする（注2）。

iPhoneにGeminiやChatGPTが搭載される？

　Appleは生成AI（人工知能）の“深い部分”に飛び込むのをためらっていたが、それももうすぐ終わりを迎えるかもしれない（注3）。

　ティム・クックCEOは「生成AIに関しては、社内で多くの作業を進めている。われわれは実際に仕事を進めてからその仕事について話すこと、そして先走らないというやり方を取っている」と、2024年2月に開催された同社の第1四半期決算説明会で述べた（注4）。

　クック氏によると、同社はこれまでAIに膨大な時間と労力を費やしてきたという。

　Appleは2023年5月、機密データの流出が懸念されることを理由として、OpenAIの「ChatGPT」とMicrosoftが支援する「GitHub Copilot」の社内での利用を制限したと報じられた（注5）。

　サイバーセキュリティトレーニングを提供する研究・教育機関SANS Technology Instituteのエド・スクーディス氏（プレジデント）は「CIO Dive」に対し、「GitHub Copilotを使用しているとMicrosoftに情報が流出する可能性が高い。Appleがあらゆる機密をMicrosoftに漏らしたくないと考えるのは当然だ」と語った。Appleは、容易にアクセスできる既製の生成AIツールの代替手段を従業員に与えようとしている。

　Bloombergが2023年7月に報じたところによると、Appleは構築したLLMをテストするために社内でチャットbotを展開した（注6）。2024年3月18日にはiPhoneのAI機能にGoogleの「Gemini」やChatGPTを組み込むことを検討しているとも報じられた（注7）。

　Appleの調査によると、MM1はキャプションの作成や視覚的な質問応答において他のLLMを大きく上回っているという。

　生成AIを顧客に提供する方法といった詳細については「2024年後半に発表する」とクック氏は述べる。例年開催している同社の開発者向けイベント「Worldwide Developers Conference」（WWDC）は2024年6月10～14日にオンラインで実施する予定だ。

（注1）MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training（Apple）
（注2）Mixture of Experts Explained（Hugging Face）
（注3）Apple isn’t ready to enter the generative AI fray, yet（CIO Dive）
（注4）Apple Inc. (AAPL) Q1 2024 Earnings Call Transcript（Seeking Alpha）
（注5）Apple restricts ChatGPT, GitHub Copilot use over data worries: report（CIO Dive）
（注6）Apple Tests ‘Apple GPT,’ Develops Generative AI Tools to Catch OpenAI（Bloomberg）
（注7）Apple Is in Talks to Let Google Gemini Power iPhone AI Features（Bloomberg）

（初出）Apple researchers build multimodal LLM as AI strategy takes shape

原文へのリンク

関連情報

「生成AIで一発逆転は可能だ」　DX“後進”企業こそ得られるメリットを解説
これまでDXに取り組んでこなかった企業が生成AIを利用することで「一発逆転」することは可能か？　ムシが良すぎるこの問いかけに「やり方によっては可能だ。メリットは大きい」と答えるDX支援のプロがいる。「DX後進企業」だからこそ得られるメリットと、導入失敗を避けるために押さえるべきポイントとは。
ChatGPTが“ばか”になっている？　研究で明らかになった「噂の真相」
「ChatGPTが“ばか”になっている」「しかも有料版の方が無料版よりもまずい回答をしている」といったうわさは本当か？　スタンフォード大学とカリフォルニア大学の研究結果を紹介する。
Zoomの「個人データ利用」はなぜ批判されたのか　顛末を振り返る
AIを利用したサービスを活用する際に、個人データが収集されることへの懸念は根強い。Zoomはこの懸念に応える形で利用規約を改訂したが、それでも批判は続いた。なぜか。
Copilot for Securityはどう使えばいい？　マイクロソフトがプロンプトの例を公開
Microsoftは2024年4月1日から「Copilot for Security」の提供を開始した。Copilot for Securityは、新しいMicrosoft Entraのスキルを搭載し、IDとセキュリティインシデントの解決を支援する。マイクロソフトはプロンプトの実例も公開した。

Appleの生成AI「MM1」は何ができるの？ 他のLLMを凌駕する性能とは：CIO Dive

ついに明らかになった「MM1」 他のLLMを上回る性能とは？

iPhoneにGeminiやChatGPTが搭載される？

関連記事

Appleの生成AI「MM1」は何ができるの？　他のLLMを凌駕する性能とは：CIO Dive

ついに明らかになった「MM1」他のLLMを上回る性能とは？