Meta、視覚で世界を理解する新AI「Muse Spark」発表 「Llama」より高効率でAIメガネにも統合へ
米Metaは4月8日(現地時間)、Superintelligence Labs立ち上げ後初のAIモデル「Muse Spark」を発表した。「Meta AI」アプリおよびWeb版(meta.ai)を通じて一般ユーザーへの提供を開始した。今後数週間以内に、「WhatsApp」「Instagram」「Facebook」「Messenger」などのMeta製アプリに順次ロールアウトされる予定だ。
「Muse Spark」は、視覚情報の統合やツールの利用、マルチエージェントの連携をサポートするためにゼロから構築されたネイティブなマルチモーダル推論モデル。初期モデルとして小型かつ高速に設計されているのが特徴で、モデルのアーキテクチャ、最適化、データキュレーションを改善した結果、以前の同社のモデル「Llama 4 Maverick」と比較して「1桁以上少ない計算量で同等の能力に到達できる」としている。
テキストによる指示だけでなく、ユーザーが見ている世界を視覚的に理解できるのが大きな特徴だ。例えば、スマートフォンのカメラで撮影したスナック菓子をタンパク質量の多い順にランク付けしたり、製品をスキャンして代替品と比較したりすることができる。
「Ray-Ban Meta」シリーズなどの同社のAIメガネにも統合する。モデルの高度な視覚認識機能がAIメガネに搭載されることで、アシスタントがユーザーの周囲の環境をより正確に見て理解できるようになる。
また、1000人以上の医師と協力して学習データがキュレーションされており、健康に関する複雑な質問に対しても画像やグラフを用いて詳細に回答できるという。
さらに、プロンプトからWebサイトやミニゲームを作成する視覚的コーディング機能や、複数のAIエージェントが並行して推論を行って複雑な問題に対処する「Contemplating(熟考)モード」も搭載している。
マーク・ザッカーバーグCEOはFacebookへの投稿で「9カ月前に超知能(superintelligence)をあらゆる人の手に届けることを目指してMeta Superintelligence Labsを設立した」と振り返り、その最初のマイルストーンとしてMuse Sparkを発表したと語った。将来の展望については、「今後は新しいオープンソースモデルを含め、知能の限界を押し広げる、より高度なモデルをリリースしていく計画だ。単に質問に答えるだけでなく、あなたのために行動するエージェントとなる製品を構築している」という。
なお、本モデルはMeta製品専用というわけではなく、選ばれた一部のパートナー企業向けにはAPIを通じたプライベートプレビューとしても提供される。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
2
GPT-5.5は最高性能ではないのに、なぜエンジニアが熱狂? カギは“最後まで自走する力”
-
3
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
4
「Gemini 3.5」登場 軽量モデルは一部3.1 Pro超え、高性能モデルは6月公開予定
-
5
GoogleのAIサブスク、最上位プランを値下げ 月額1万4500円の新プランも
-
6
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
7
人型ロボが働く様子を生配信中 荷物の仕分けを11時間超、Xでの表示回数は196万を突破 米企業
-
8
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
9
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
10
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR