速報
Meta、テキスト→3Dモデル高速(1分以内)生成AI「3D Gen」の論文発表
Metaは、テキストプロンプトから3Dモデルを高速生成するAI技術「Meta 3D Gen」を発表した。1分以内に生成できるとしている。また、PBRマテリアルを備え、3Dオブジェクトの再ライティングが可能だ。
米Metaは7月2日(現地時間)、テキストから3Dモデルを高速生成するAI技術「Meta 3D Gen」を発表した。
Metaによると、3D Genは従来の3Dモデリング手法と比較して3倍から60倍高速にモデルを生成できるという。また、高解像度のテクスチャと物理ベースレンダリング(PBR)マテリアルを備えており、視覚的に優れたモデルを生成できるとしている。PBRマテリアルを備えることで、3Dオブジェクトの再ライティングが可能になる。
3D Genは、MetaのEmuファミリーのテキスト画像生成モデルをベースに、「Meta 3D AssetGen」と「Meta 3D TextureGen」という2つのコンポーネントで構成されている。前者はテキストプロンプトを受けて約30秒で3Dメッシュ、テクスチャ、PBRマテリアルを生成する。後者は、約20秒でAssetGenが生成したモデルのテクスチャを最適化したり、任意の3Dメッシュに対して新たなテキスト入力でテクスチャを作成する。
リリースの予定については触れていないが、ゲーム開発から工業デザイン、建築まで、さまざまな業界に変革をもたらす可能性があるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Meta、コード最適化のためのAIモデル「LLM Compiler」を商用ライセンスで公開
Metaは、コードサイズを大幅に削減したり、プログラムの実行速度を向上させるためのLLMモデル「Meta LLM Compiler」を発表した。商用ライセンスでリリースした。
Meta、自社開発AIチップ「MTIA」の第2世代を発表 先代の3倍性能
Metaは自社開発のAIチップ「MTIA」の第2世代を発表した。4つの主要モデルで先代と比較して性能が3倍向上したとしている。Facebookなどでの広告レコメンデーション機能の強化などに活用する計画。
Meta、独自の動画生成AI「Emu Video」と編集AI「Emu Edit」を紹介
Metaは、9月に発表した独自の画像生成基盤モデル「Emu」に基づく2つのモデルを発表した。4秒のリアルな動画を生成できる「Emu Video」とプロンプトで画像を編集する「Emu Edit」だ。
呪文で高精細な3Dアバターを生成するAI「Rodin」 Microsoftが開発
Microsoft Researchに所属する研究者らは、人物の静止画像やテキストプロンプトから高品質な3Dアバターを生成する拡散モデルを提案した研究報告を発表した。
OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース
OpenAIは、テキストから3Dモデルを生成するAI「Point-E」をオープンソース化した。3Dモデルを単体GPUでも1〜2分で生成できるとしている。GitHubでMITライセンスで公開した。

