日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に:清水亮の「世界を変えるAI」(2/3 ページ)
AIで漫画を書こうとするとひとつ不便なことがある。StableDiffusionの元になっている学習データは「全世界」の画像を使っているので、日本人がイメージするような「郵便局」とはまったく異なるイメージになってしまう。そこで街のあちこちの景色を写真に撮った。これをAIに学習させて、独自の日本的な画像生成AIを作ろうというのだ。
いざ「AIに見せる写真」として捉え、カメラを持って街に出てみると、実は日本にしかない景色というのは相当数ある。仲間で手分けして撮影に挑み、夢中でシャッターを押していると、一週間ほどで数千枚の画像が集まった。AIでありながら、欲しい結果を得るためには街にでなければならないという錯誤が面白いところだ。
これをNVIDIAの「A100チップ」搭載VGAボードを8枚搭載したコンピュータに学習させるわけだが、そのままではうまく学習できない。
まず、学習に先立って、全ての画像に対してBLIPというアルゴリズムでキャプションを自動生成する必要がある。これに独自のアルゴリズムを加えて効率的なキャプションを生成していく。
キャプションの自動生成に数時間かかり、生成されたキャプションに基づいてStableDiffusionを微調整(ファインチューニング)するのにさらに一日半ほどかけた結果、「救急車」でこのような画像が生成できるようになった。
これだと正直、まだ海外の救急車のイメージに引っ張られている。日本の救急車は基本的には「ハイエース」のような丸みを帯びたものだ。画像は、カラーリングは日本の白と赤の救急車に近づいているが、形は海外の角ばった救急車だ。
郵便局も、アメリカ式の青いイメージから赤いイメージへの転換に成功した。
自動販売機はかなりうまく行った。
駐車場もちゃんと日本風にコンバートできた。
ただ、このデータも筆者が在住する東京23区の中心部、特に千代田区と新宿区に偏っているという欠点がある。大阪でデータを撮ればおそらく大阪っぽい色が出るはずだ。例えば筆者の出身地である長岡市では、郵便局はビルではなく単独の建物だった。
AIはこのように学習したデータによるバイアスを非常に強く受ける傾向がある。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIでどこまでできる? 絵心のないプログラマーが「ChatGPT」と「作画AI」でマンガを描いてみた
クリスタにAI作画機能搭載が見送られたと聞いて、なるほどなあと思いつつ、では絵が全く描けない筆者が、AIを使って漫画を書くことはできるのか、実際にやってみることにした。
動画も音楽もゲームも 広がるAIエンターテインメントの可能性
Stable Deffusionのオープンソース公開以後、画像生成にとどまらず、AIを使ったさまざまなユースケースが登場している。動画制作や音楽制作のみならず、ゲームや新しいタイプの遊びなどへの発展も。
まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
AIスゴっ! 下手な漫画が秒で“プロ並み”に 「ネームだけで原稿完成」の時代に?
AIイラストメーカーを使うと、平面っぽい雑な絵が、立体的で表情も動きのある、描き込まれた美しいイラストに変わった。イラストAIが、「絵を描く」の意味を変えつつある。
お絵かきAI、育児で活躍 “無限塗り絵”に4歳も夢中
塗り絵好きな子どもがいる家庭では、「子どもが好きな塗り絵をどう用意するか」がしばしば課題になる。そこで活躍するのが、お絵かきAIだ。






