AIで好きなポーズを出すために、モデルを10万枚撮影して手動でタグ付けしてみた:清水亮の「世界を変えるAI」(4/4 ページ)
最初にAIで漫画を描くときのハードルは、「同じキャラクターが出せない」というものだったが、これはDreambooth(Memeplexではカスタムモデル学習)を使うことで解決できた。次のハードルは、「欲しいポーズが出せない」というものである。
AIには言葉でなかなか伝えられないアングルとポーズ、表情もポーズ集をもとにすれば簡単に
二日で10万枚撮影された画像のうち代表的なもの2000枚弱に付けたタグは、同時刻に撮られたほかのサブカメラの写真にも有効である。つまり、たかだか2000枚の写真にタグ付けするだけで、10万枚のキャプション付き画像データが得られるのである。
このAI素材集では、モデルとAI専用の契約をかわし、最初からAIで学習されることを意識して撮影された、おそらく世界最初の写真集である。また、同時に、AIに直接入力するImg2Img用の素材としての許諾も得ているため、必要なポーズがあらかじめポーズ集の中にあれば、極めて手軽にAI素材を使うことができる。
また、素材集の代わりに使う場合でも、「InstructPix2Pix」を使えば「金髪にする」「男性にする」などの操作を言葉で加えることで通常の素材集よりも柔軟な使い方ができる。
現在、AIポーズ素材集はMemeplexのユーザーレベル5以上向けにα版として開放している。いずれ、サブスクリプションユーザー(ユーザーレベル3以上)全体が使えるように開放していく。
近日中に画像枚数を3000枚程度まで拡張し、モデル撮影されたものだけでなく、筆者が独自に撮影したさまざまな写真なども順次追加していく予定だ。
最終的には、以前この連載で指摘したような既存の画像生成AIの弱点である「日本的なものに弱い」という欠点を克服したオリジナルの画像生成AI「Zelpm Diffusion」を開発するつもりである。そのためにはもっとデータを集めなくてはならないので、引き続きモデルを使ったポーズ集の開発も進めていくつもりだ。
結局、AI開発とは、どれだけ質の高いデータを開発できるかということなので、クリエイターの出番というのは増えることはあっても減ることはない。
AI開発は部屋の中で涼しい顔をしてやっているというイメージをもたれることが多いが、実際には地を這うような泥臭い仕事の連続なのである。
筆者プロフィール:清水 亮
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。
関連記事
- なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方
OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたチャットボットを投入し、巻き返しを図る。 - 日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に
AIで漫画を書こうとするとひとつ不便なことがある。StableDiffusionの元になっている学習データは「全世界」の画像を使っているので、日本人がイメージするような「郵便局」とはまったく異なるイメージになってしまう。そこで街のあちこちの景色を写真に撮った。これをAIに学習させて、独自の日本的な画像生成AIを作ろうというのだ。 - AIでどこまでできる? 絵心のないプログラマーが「ChatGPT」と「作画AI」でマンガを描いてみた
クリスタにAI作画機能搭載が見送られたと聞いて、なるほどなあと思いつつ、では絵が全く描けない筆者が、AIを使って漫画を書くことはできるのか、実際にやってみることにした。 - AIは日本のテレビから何を学ぶか?
前回、身の回りにある「日本的な風景」を学習させてみた。その結果、郵便局がより日本的なものになったり、自動販売機や駐車場がよりそれっぽいものになることが確認できた。今回はそれを一歩進めて、AIに日本のテレビ番組を学習させてみることにする。 - まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
Copyright © ITmedia, Inc. All Rights Reserved.