ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

美少女イラストが上手なAIはどれだ! AIお絵描き選手権(2/3 ページ)

» 2022年09月30日 14時00分 公開
[吉川大貴ITmedia]

もっと筆者好みなキャラを描かせてみる

 今度は、よりキーワードを詳細にしてみる。いわゆる“呪文”だ。筆者は髪に白の差し色が入ったキャラクターが好きなので「streaked white hair」、服はAIが出力しやすそうな制服にしたいので「School uniform」を追加。

 ついでに、入力するだけでクオリティーが上がるという呪文「beautiful kawaii fluffy moe」も、Twitter で見かけたので入れてみる。「fluffy」は「ふわふわした」といった意味。つまりワードは「Kawaii Anime Girl,streaked white hair,School uniform,beautiful kawaii fluffy moe」になる。

 まずはMidjourneyから。左が通常のもの。右が通常通り出力した画像のうち、良いと感じた絵をbeta upscale redoで再出力した画像だ。fluffyの影響が強すぎたのか、ちょっと動物っぽさが混じったが、これはこれでかわいい。

Midjourneyでの出力結果。右は「beta upscale redo」を使ったもの(いずれもキーワードを詳細化)

 他の指示もだいたい反映されている。再出力したバージョンも、絵のタッチは日本っぽくはないが、キャラクターデザインはなかなかかわいいと感じる。

 次にStable Diffusion。こちらは若干指示を聞いてくれなかった。髪色は青が入り、目も以前と同じであまり整わないまま。クオリティーを上げるにはもう少し指示に工夫が必要かもしれない。

Stable Diffusionでの出力結果(いずれもキーワードを詳細化)

 次はERNIE-ViLG。画風は変わらずアニメ調を選択したが、このキーワードでは出力できなかった。話題になった当時から「天安門などと入力すると画像が出ない」といった問題点を指摘する意見もあったので、何らかのNGワードに引っ掛かったのかもしれない。筆者が試した時点では「fluffy」を外すと出力できたので、どうやらこの言葉がダメなようだ。

photo ERNIE-ViLGでの出力結果(キーワードからfluffyを除去)

 最後はDALL・E2だ。これは個人的にかなり上手に感じる。特に右端・左端がかなり日本のアニメ・ラノベっぽい。ただ、どれも差し色ではなく完全に白い髪色になっており、毛先の表現がやや荒く感じる。ラフ画でも参考にしているのかもしれない。

photo DALL・E2での出力結果(キーワードを詳細化)

 一通り結果を見た上で、個人的な優劣をつけるとしたら(1)DALL・E2、(2)ERNIE-ViLG(出力できた場合)、(3)Midjourney、(4)Stable Diffusion──という順位だろうか。もちろん呪文の質や長さによって得られる結果は変わるはずなので、一概によし悪しは決まらない。

 とはいえ、雑なワード選びでどれだけのクオリティーのイラストが手に入るかという参考にはなった。SNSなどでも散々話題になったが、画像生成AIは人に比べて絵を手に入れるハードルが低い。ゆえに描き手(サービス)ごとの比較検討が人のイラストより簡単な点も、画像生成AIの強みといえるだろう。後発のサービスやそのバリエーションも増えているので、今後のこの強みはさらに大きくなるかもしれない。 

Copyright © ITmedia, Inc. All Rights Reserved.