二日で10万枚撮影された画像のうち代表的なもの2000枚弱に付けたタグは、同時刻に撮られたほかのサブカメラの写真にも有効である。つまり、たかだか2000枚の写真にタグ付けするだけで、10万枚のキャプション付き画像データが得られるのである。
このAI素材集では、モデルとAI専用の契約をかわし、最初からAIで学習されることを意識して撮影された、おそらく世界最初の写真集である。また、同時に、AIに直接入力するImg2Img用の素材としての許諾も得ているため、必要なポーズがあらかじめポーズ集の中にあれば、極めて手軽にAI素材を使うことができる。
また、素材集の代わりに使う場合でも、「InstructPix2Pix」を使えば「金髪にする」「男性にする」などの操作を言葉で加えることで通常の素材集よりも柔軟な使い方ができる。
現在、AIポーズ素材集はMemeplexのユーザーレベル5以上向けにα版として開放している。いずれ、サブスクリプションユーザー(ユーザーレベル3以上)全体が使えるように開放していく。
近日中に画像枚数を3000枚程度まで拡張し、モデル撮影されたものだけでなく、筆者が独自に撮影したさまざまな写真なども順次追加していく予定だ。
最終的には、以前この連載で指摘したような既存の画像生成AIの弱点である「日本的なものに弱い」という欠点を克服したオリジナルの画像生成AI「Zelpm Diffusion」を開発するつもりである。そのためにはもっとデータを集めなくてはならないので、引き続きモデルを使ったポーズ集の開発も進めていくつもりだ。
結局、AI開発とは、どれだけ質の高いデータを開発できるかということなので、クリエイターの出番というのは増えることはあっても減ることはない。
AI開発は部屋の中で涼しい顔をしてやっているというイメージをもたれることが多いが、実際には地を這うような泥臭い仕事の連続なのである。
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR