検索
連載

AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた清水亮の「世界を変えるAI」(4/4 ページ)

最初にAIで漫画を描くときのハードルは、「同じキャラクターが出せない」というものだったが、これはDreambooth(Memeplexではカスタムモデル学習)を使うことで解決できた。次のハードルは、「欲しいポーズが出せない」というものである。

Share
Tweet
LINE
Hatena
前のページへ |       

AIには言葉でなかなか伝えられないアングルとポーズ、表情もポーズ集をもとにすれば簡単に

 二日で10万枚撮影された画像のうち代表的なもの2000枚弱に付けたタグは、同時刻に撮られたほかのサブカメラの写真にも有効である。つまり、たかだか2000枚の写真にタグ付けするだけで、10万枚のキャプション付き画像データが得られるのである。

 このAI素材集では、モデルとAI専用の契約をかわし、最初からAIで学習されることを意識して撮影された、おそらく世界最初の写真集である。また、同時に、AIに直接入力するImg2Img用の素材としての許諾も得ているため、必要なポーズがあらかじめポーズ集の中にあれば、極めて手軽にAI素材を使うことができる。


AIには言葉でなかなか伝えられないアングルとポーズ、表情もポーズ集をもとにすれば簡単に作れる

 また、素材集の代わりに使う場合でも、「InstructPix2Pix」を使えば「金髪にする」「男性にする」などの操作を言葉で加えることで通常の素材集よりも柔軟な使い方ができる。


InstructionPix2Pixによって画像を操作することで素早くイメージ通りの画像を作れる

 現在、AIポーズ素材集はMemeplexのユーザーレベル5以上向けにα版として開放している。いずれ、サブスクリプションユーザー(ユーザーレベル3以上)全体が使えるように開放していく。

 近日中に画像枚数を3000枚程度まで拡張し、モデル撮影されたものだけでなく、筆者が独自に撮影したさまざまな写真なども順次追加していく予定だ。

 最終的には、以前この連載で指摘したような既存の画像生成AIの弱点である「日本的なものに弱い」という欠点を克服したオリジナルの画像生成AI「Zelpm Diffusion」を開発するつもりである。そのためにはもっとデータを集めなくてはならないので、引き続きモデルを使ったポーズ集の開発も進めていくつもりだ。

 結局、AI開発とは、どれだけ質の高いデータを開発できるかということなので、クリエイターの出番というのは増えることはあっても減ることはない。

 AI開発は部屋の中で涼しい顔をしてやっているというイメージをもたれることが多いが、実際には地を這うような泥臭い仕事の連続なのである。

筆者プロフィール:清水 亮

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。


前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る