2月17日、「AIコスプレイヤー」というワードがTwitterトレンドに入った。話題のAIイラスト生成技術で作られた実在しないコスプレイヤーのイラストをインフルエンサーが拡散。写実的な画風やセクシーさも相まって「もう人間はいらないのでは」「コスプレと関係ない」などと賛否両論の声が出ている。
実際に画像を見てみると、確かにセクシーかつ、一瞬写真と見間違えるようなクオリティーだ。よく見るとおかしな点はあるが、ぱっと見はよくあるグラビアアイドルやモデルの写真とそっくりに感じる。
果たして、どうやって作ったんだろう──そう思って作り方を調べてみたところ、記者のような文系・非ITエンジニアでも似たようなものが生成できそうなことが分かった。一方で、その生成過程にはインモラルな“無規制地帯”が関わっていることも見えてきた。
そもそも話題のAIコスプレイヤーはどのように生成しているのか。制作者がYouTubeに掲載している動画を確認したところ、「stable diffusion+chilloutmix+koreadolllike+Cheshire model of RISC_V」という記載があった。
このうち「stable diffusion」はすでに有名だ。Stability AIが開発したオープンソースの画像生成AIのことで間違いないだろう。
続く「chilloutmix」は、生成の参考にする学習済みモデルのようだ。SNSやコミュニティーなどの声によれば、アジア人っぽい実写風画像を生成するのに向いているといい、コミュニティーサイト「HuggingFace」で配布されているのを確認した。
実はネット上では、chilloutmixのように特定の用途に特化した学習済みモデルが出回っている。アニメっぽいイラストを生成できるモデル、実写風の画像を生成できるモデル──といった具体だ。中には「Instagramにアップされているコスプレイヤーの写真を学習しているのでクオリティーが高い」といった評判のあるモデルもあった。
3つ目の「koreadolllike」は、「LoRA」(Low-Rank Adaptation of Large Language Models)というものらしい。ざっくり説明すると、LoRAは少量の画像をAIに追加で学習させ、生成結果をある程度コントロールするために使う。
koreadolllikeは、「Civitai」というサービスで配布されていた。Civitaiは学習済みモデルやLoRAを配布・共有するサービスだ。他にもさまざまな学習済みモデルやLoRAがあったが、koreadolllikeはその名の通り、人形のような見た目の韓国人女性っぽい容姿を実現するLoRAらしい。
もう1つのCheshire model of RISC_Vも、Civitai上で共有されているLoRAだった。説明によれば、ゲーム「アズールレーン」のキャラクター「チェシャー」のような画像を実現するという。「RISC_V」はアーキテクチャではなく配布しているユーザー名だ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR