ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた清水亮の「世界を変えるAI」(2/4 ページ)

» 2023年02月27日 12時20分 公開
[清水亮ITmedia]

モデル、役者を雇い10万枚のポーズ写真を撮影

 幸い、筆者の周りには事務所に所属していないフリーの役者さんや、事務所を辞めた元モデルさんというのが何人かいる。筆者の通う新宿ゴールデン街というのはそういう人たちが集まる街でもあるのだ。

 そこでまずは知人のモデル経験者・役者を雇い、スタジオを借りて撮影することにした。筆者はカメラを一通りは使えるのでカメラマンは雇わず、スタイリストとヘアメイクを手配して撮影に挑んだ。

 AIが学習に使うデータの収集も兼ねているため、カメラは「α7」を5台用意し、さまざまなアングルから自動的にシャッターを切り続ける設定とした。

自動的に撮影された10万枚の画像の一部

 メインのカメラは素材集用なのでカメラマンである筆者が撮影し、サブのカメラはとにかくひたすらいろんなアングルからポーズを撮り続けるということを続けた。

 この結果、二日で10万枚程度の画像素材を得ることができた。ここから意味のあるポーズを抜き出してみても、2000枚くらいになった。

 この2000枚に対して、AIの元絵となるようにレタッチしてトリミングするわけだが、これが全部手作業なわけだ。

 自動的にトリミングするAIの開発も考えたが、今回はそのAIの開発と手作業でトリミングすることのどっちが時間がかかりそうか考えると、手作業でやったほうが早いと考えたので手作業にした。

 よく意外に思われるのだが、筆者はこの手の単純作業が全く苦にならない。原稿を書くより楽なほどである。これはもともと越後の農家として育った清水家のDNAに脈々と受け継がれている資質だろう。

 さらに、レタッチしてトリミングした素材に、タグを付けていく。このタグ付けをやっていて始めて分かったのは、LAIONプロジェクトが集めている50億枚の画像素材とそのタグは、全くダメだということだ。

※LAION(Large-scale Artificial Intelligence Open Network)プロジェクトとは、ドイツの非営利団体LAIONが進めている大規模な機械学習モデルやデータセット、関連コードなどの一般公開を目指す取り組み。50億枚以上の画像にタグ付けしたデータセット「LAION-5B」はStable Difusionが利用している。


Copyright © ITmedia, Inc. All Rights Reserved.