AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた:清水亮の「世界を変えるAI」(2/4 ページ)
最初にAIで漫画を描くときのハードルは、「同じキャラクターが出せない」というものだったが、これはDreambooth(Memeplexではカスタムモデル学習)を使うことで解決できた。次のハードルは、「欲しいポーズが出せない」というものである。
モデル、役者を雇い10万枚のポーズ写真を撮影
幸い、筆者の周りには事務所に所属していないフリーの役者さんや、事務所を辞めた元モデルさんというのが何人かいる。筆者の通う新宿ゴールデン街というのはそういう人たちが集まる街でもあるのだ。
そこでまずは知人のモデル経験者・役者を雇い、スタジオを借りて撮影することにした。筆者はカメラを一通りは使えるのでカメラマンは雇わず、スタイリストとヘアメイクを手配して撮影に挑んだ。
AIが学習に使うデータの収集も兼ねているため、カメラは「α7」を5台用意し、さまざまなアングルから自動的にシャッターを切り続ける設定とした。
メインのカメラは素材集用なのでカメラマンである筆者が撮影し、サブのカメラはとにかくひたすらいろんなアングルからポーズを撮り続けるということを続けた。
この結果、二日で10万枚程度の画像素材を得ることができた。ここから意味のあるポーズを抜き出してみても、2000枚くらいになった。
この2000枚に対して、AIの元絵となるようにレタッチしてトリミングするわけだが、これが全部手作業なわけだ。
自動的にトリミングするAIの開発も考えたが、今回はそのAIの開発と手作業でトリミングすることのどっちが時間がかかりそうか考えると、手作業でやったほうが早いと考えたので手作業にした。
よく意外に思われるのだが、筆者はこの手の単純作業が全く苦にならない。原稿を書くより楽なほどである。これはもともと越後の農家として育った清水家のDNAに脈々と受け継がれている資質だろう。
さらに、レタッチしてトリミングした素材に、タグを付けていく。このタグ付けをやっていて始めて分かったのは、LAIONプロジェクトが集めている50億枚の画像素材とそのタグは、全くダメだということだ。
※LAION(Large-scale Artificial Intelligence Open Network)プロジェクトとは、ドイツの非営利団体LAIONが進めている大規模な機械学習モデルやデータセット、関連コードなどの一般公開を目指す取り組み。50億枚以上の画像にタグ付けしたデータセット「LAION-5B」はStable Difusionが利用している。
関連記事
- なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方
OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたチャットボットを投入し、巻き返しを図る。 - 日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に
AIで漫画を書こうとするとひとつ不便なことがある。StableDiffusionの元になっている学習データは「全世界」の画像を使っているので、日本人がイメージするような「郵便局」とはまったく異なるイメージになってしまう。そこで街のあちこちの景色を写真に撮った。これをAIに学習させて、独自の日本的な画像生成AIを作ろうというのだ。 - AIでどこまでできる? 絵心のないプログラマーが「ChatGPT」と「作画AI」でマンガを描いてみた
クリスタにAI作画機能搭載が見送られたと聞いて、なるほどなあと思いつつ、では絵が全く描けない筆者が、AIを使って漫画を書くことはできるのか、実際にやってみることにした。 - AIは日本のテレビから何を学ぶか?
前回、身の回りにある「日本的な風景」を学習させてみた。その結果、郵便局がより日本的なものになったり、自動販売機や駐車場がよりそれっぽいものになることが確認できた。今回はそれを一歩進めて、AIに日本のテレビ番組を学習させてみることにする。 - まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
Copyright © ITmedia, Inc. All Rights Reserved.