検索
連載

まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?新連載 清水亮の「世界を変えるAI」(4/5 ページ)

2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。

Share
Tweet
LINE
Hatena

 これに飛びついた人たちの中で、腕に覚えのある人はすぐにWebサービスを開発し、アプリを開発し、競うように新しい機能を追加していった。

 日本でも、LINEから日本語で作画指示を行える「AIばりぐっどくん」や、「AIピカソ」というアプリなどが登場し、作文支援AIの「AIのべりすと」もAI画像生成サービスへの対応を表明。日本のアニメ風の表現が得意な「Waifu Diffusion」や「Trinart」といったStable Diffusionの改造版がオープンソースで公開された。


Waifu Diffusion

Trinart

 この頃、Stable Diffusionは、下手な絵から上手な画像を導き出す「img2img」や、画像の一部分だけを修正する「inpaint」などの機能が矢継ぎ早に発表されていき、さまざまなサービスに取りこまれていった。


下手な絵から上手な画像を導き出す「img2img」の流れ。この絵をもとに、

こんな絵や、

こんな絵が生成される

 Stable Diffusionは、一般に個人の写真や特定の人物を出すのが苦手だが、自分のペットや友人の写真をわずかな枚数から学習させる「Dreambooth」という技術が開発され、これも話題を呼んだ。


わずかな写真枚数から学習させるDreambooth技術によって、自分の顔を学習させた

 ただし、Dreamboothでは、巨大なGPUメモリが必要になり、個人ユーザーが趣味の範囲で買えるGPUでは事実上実行不可能なのがネックとされていた。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る