米AI研究企業OpenAIの研究者らは12月19日(現地時間)、テキストプロンプトから3Dオブジェクトを生成するAIシステム「Point-E」をオープンソース化したと発表した。
同様のシステムとしては米Googleの「DreamFusion」などがあるが、発表論文によると、Point-Eは例えば単体のGPU(米NVIDIAの「V100」)でも3Dモデルを1〜2分で生成できるという。
Point-Eは、点群(point cloud)で3Dオブジェクトを生成する。名称の「E」は点群を効率的(Efficiently)に生成することに由来するという。
3D生成は2段階で行われる。まずプロンプトを入力すると、レンダリングされた合成ビューが生成され、次に点群拡散スタックがこの画像を条件付けして3DのRGB点群を生成する。
「この方法は、最先端の他の類似技術よりも性能は劣る」が、DreamFusionのようなマルチビュー最適化ベースの方法よりも短時間でサンプルが生成できるので、実用的になる可能性があるとしている。3Dモデルが短時間で容易に生成できるようになれば、ゲームや映画などの制作に役立ちそうだ。
Point-EはGitHubでMITライセンス下で公開された。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR