Meta、視覚で世界を理解する新AI「Muse Spark」発表 「Llama」より高効率でAIメガネにも統合へ
米Metaは4月8日(現地時間)、Superintelligence Labs立ち上げ後初のAIモデル「Muse Spark」を発表した。「Meta AI」アプリおよびWeb版(meta.ai)を通じて一般ユーザーへの提供を開始した。今後数週間以内に、「WhatsApp」「Instagram」「Facebook」「Messenger」などのMeta製アプリに順次ロールアウトされる予定だ。
「Muse Spark」は、視覚情報の統合やツールの利用、マルチエージェントの連携をサポートするためにゼロから構築されたネイティブなマルチモーダル推論モデル。初期モデルとして小型かつ高速に設計されているのが特徴で、モデルのアーキテクチャ、最適化、データキュレーションを改善した結果、以前の同社のモデル「Llama 4 Maverick」と比較して「1桁以上少ない計算量で同等の能力に到達できる」としている。
テキストによる指示だけでなく、ユーザーが見ている世界を視覚的に理解できるのが大きな特徴だ。例えば、スマートフォンのカメラで撮影したスナック菓子をタンパク質量の多い順にランク付けしたり、製品をスキャンして代替品と比較したりすることができる。
「Ray-Ban Meta」シリーズなどの同社のAIメガネにも統合する。モデルの高度な視覚認識機能がAIメガネに搭載されることで、アシスタントがユーザーの周囲の環境をより正確に見て理解できるようになる。
また、1000人以上の医師と協力して学習データがキュレーションされており、健康に関する複雑な質問に対しても画像やグラフを用いて詳細に回答できるという。
さらに、プロンプトからWebサイトやミニゲームを作成する視覚的コーディング機能や、複数のAIエージェントが並行して推論を行って複雑な問題に対処する「Contemplating(熟考)モード」も搭載している。
マーク・ザッカーバーグCEOはFacebookへの投稿で「9カ月前に超知能(superintelligence)をあらゆる人の手に届けることを目指してMeta Superintelligence Labsを設立した」と振り返り、その最初のマイルストーンとしてMuse Sparkを発表したと語った。将来の展望については、「今後は新しいオープンソースモデルを含め、知能の限界を押し広げる、より高度なモデルをリリースしていく計画だ。単に質問に答えるだけでなく、あなたのために行動するエージェントとなる製品を構築している」という。
なお、本モデルはMeta製品専用というわけではなく、選ばれた一部のパートナー企業向けにはAPIを通じたプライベートプレビューとしても提供される。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
2
孫正義は「知能の石油」を独占するか? ソフトバンクグループが挑む日米データセンター構想
-
3
フジクラ社長「データセンター市場、10年は堅調に伸びる」 生産拡大で「3000億円投資」に踏み切ったワケ
-
4
「Google AI Pro」ユーザーはYouTube広告ほぼ非表示 「Premium Lite」無料付与
-
5
OpenAIの内部モデルが数学の未解決問題を証明──OpenAIは「重要な転換点」、フィールズ賞受賞数学者は「画期的な成果」と評価
-
6
「Gemini」「Claude Code」「Codex」 全社展開・本番実装に役立つ5つのポイント
-
7
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
8
AIがコードを書く時代に、言語を選ぶ意味はあるのか?:880th Lap
-
9
「Google Antigravity」利用上限緩和 ただし2.0アップデート手順に要注意
-
10
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR