米MetaのAI部門であるMeta AIは4月5日(現地時間)、画像内から個々のオブジェクトを選択できるAIモデル「SAM(Segment Anything Model)」(なんでもセグメントするモデル)をオープンライセンス(Apache 2.0)で公開したと発表した。
このモデルと共に、SAMのトレーニングに使われる大規模画像データセット「SA-1B」も公開した。このデータセットは、大手写真企業からの約1100万枚のライセンス画像と、そのセグメンテーションモデルで生成された11億枚以上のプライバシー保護された画像に基づくセグメンテーションマスクが含まれる。このマスク数は既存のセグメンテーションデータセットの400倍に相当するという。
セグメンテーションは、AIモデルが特定の画像内のオブジェクトを認識できるようにするコンピュータビジョンのタスク。正確なセグメンテーションには、強力なAIトレーニングインフラと膨大な量の注釈付きデータが必要だ。
SAMは、オブジェクトが何かという一般的な概念は既に学習済みで、学習していないオブジェクトに対してもマスクを生成できるという。Metaは、SAMには十分な汎用性があり、追加のトレーニングをしなくても、あらゆる種類の画像ですぐに使えるとしている。
「将来的には、あらゆる画像からあらゆるオブジェクトを見つけ出し、セグメント化する必要がある多くの領域のアプリを支援するために使用される可能性がある。SAMは、より一般的なマルチモーダルな世界理解のための大規模なAIシステムの構成要素になる可能性がある」
Metaは使用例として、以下のケースを挙げた。同社が注力するメタバースでも活用できそうだ。
MetaはこれらをGitHubで公開し、無料のインタラクティブなデモも公開した。
このデモは商業目的での使用は禁止している。デモにアップロードしたユーザーの画像と派生データはデモのためだけに使われ、セッション後に削除するとしている。
Meta AIは、2月に設立された「生成AIにフォーカスするトップレベルのチーム」(マーク・ザッカーバーグCEOの説明)。ザッカーバーグ氏は、短期的にはInstagramやFacebookに生成AI採用の「楽しい体験を組み込んでい」き、長期的には「様々なな方法で人間を支援するAIペルソナの開発に注力する」と語った。
Meta、ジェネレーティブAIのチーム結成を発表 AIペルソナ開発目指し
Meta、独自大規模言語モデル(LLM)の「LLaMA」を限定リリース
Metaは減収、リストラコスト42億ドルなどで大幅減益 「2023年は効率化の年」とCEO
Meta、動画生成AI「Make-A-Video」を発表 「肖像画を描くテディベア」などの作品公開Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR