OpenAI、テキストから3Dモデルを高速生成するAI「Point-E」をリリース

OpenAIは、テキストから3Dモデルを生成するAI「Point-E」をオープンソース化した。3Dモデルを単体GPUでも1～2分で生成できるとしている。GitHubでMITライセンスで公開した。

[ITmedia] PC用表示関連情報

LINE

Hatena

　米AI研究企業OpenAIの研究者らは12月19日（現地時間）、テキストプロンプトから3Dオブジェクトを生成するAIシステム「Point-E」をオープンソース化したと発表した。

　同様のシステムとしては米Googleの「DreamFusion」などがあるが、発表論文によると、Point-Eは例えば単体のGPU（米NVIDIAの「V100」）でも3Dモデルを1～2分で生成できるという。

　Point-Eは、点群（point cloud）で3Dオブジェクトを生成する。名称の「E」は点群を効率的（Efficiently）に生成することに由来するという。

　3D生成は2段階で行われる。まずプロンプトを入力すると、レンダリングされた合成ビューが生成され、次に点群拡散スタックがこの画像を条件付けして3DのRGB点群を生成する。

Poine-Eでの3D生成の概念図（論文より）

　「この方法は、最先端の他の類似技術よりも性能は劣る」が、DreamFusionのようなマルチビュー最適化ベースの方法よりも短時間でサンプルが生成できるので、実用的になる可能性があるとしている。3Dモデルが短時間で容易に生成できるようになれば、ゲームや映画などの制作に役立ちそうだ。

　Point-EはGitHubでMITライセンス下で公開された。