大ウケした「Midjourney」と炎上した「mimic」の大きな違い “イラスト生成AI”はどこに向かう?:小寺信良のIT大作戦(2/2 ページ)
8月29日に登場した「mimic」がSNS上で議論を巻き起こした。画像生成AIは「Midjourney」や「Stable Diffusion」などに一躍注目が集まっているが、こうした各種画像生成AIとmimicとの違いは何か。
なぜmimicは叩かれたのか
Midjourneyの大ウケ具合と、mimicの全力殴打の差は何か。将来のAIサービスにも関わる話なので、今のうちに考えておく必要があるだろう。
両者の違いを列挙してみると、以下のようになる。
- Midjourneyはすでに学習済みAI、mimicはユーザーが学習させるところから始めるAI
- Midjourneyは文章入力で描画させる、mimicはアップロードしたら自動的に生成
- Midjourneyは利用者を特に想定せず、mimicはクリエイターが自分で使うツールとして提供
- Midjourneyの作風はなんとなく一定、mimicは作風そのものを学習する
- Midjourneyの生成画像の権利は利用者に帰属、mimicは元イラストの権利者に帰属
- Midjourneyでは学習ソースの利用に対し「フェアユースで戦える」と主張、mimicは学習ソースに権利侵害があった場合は生成画像の権利は元ソースの権利者に帰属
こうして見ると、Midjourneyはすでに学習済みであり、文章を投げると絵を投げ返すという、インプットとアウトプットが違うサービスである。一方mimicはある意味エンジンむき出しのAIであり、ユーザーが学習ソースを与えるところから始めて作風を学習させるという、インプットとアウトプットがほぼ等しくなるサービスである。同じAIイラスト生成サービスでも、発想や利用方法が全然違う事が分かる。
mimicに懸念を表明した人が本能的に感じ取ったのは、2022年2月に起こった「トレパク騒動」と似たような構造になるのではないか、という懸念ではないだろうか。特に「画風」や「作風」は、クリエイターにとっては時間をかけて習得した生命線である。トレースはそれを難なくゲットできる手法であり、それが手動でも自動でも関係ない。
つまり、誰かのものを借りてきて新しそうなコンテンツを作るのはクリエイターと言わないという目線が第一にあり、盗作・贋作に厳しい社会性の表れがそこにある。mimicは、その厳しい目線にすっぽりハマった。特にクリエイター向けツールという点が、余計に虎の尾を踏んだ格好になったのではないだろうか。
もう1つの視点として、「このAIを使う事はクリエイターの利益になるのか」というところも考えておきたい。自分が描かなくてもAIが描いてくれることで、「これで楽になった!」とか「よーしバンバン作るぞー」といったモチベーションになるものだろうか。
例えばコンペなどで、「今日中にキャラクター15案」とか言われた場合には役に立つかもしれないが、そういう地獄が日常茶飯事というクリエイターは、その会社とのお付き合いを見直すほうが先だろう。逆に「描くのが好きでやってる」「手を動かしているときにどんどんアイデアが出る」タイプの人には、無用なのではないか。
またクリエイターに無断で勝手に学習させて出力された結果の権利は、元のクリエイターに帰属するとはいえ、「画風」を見ただけでこれは誰の絵といったように指摘できるものだろうか。よほど個性的ならともかく、さらに別の第三者が現われてこれは自分の画風であると主張した場合はどうなるのか。そうなると、入力した画像はどれなのか、今度は事業者が証明しなければならなくなり、情報開示請求の対応など、とても自動化とは程遠い手作業に巻き込まれる可能性がある。
mimicの難点は、こうした悪用される場合の具体的なパターンがいくつも思い浮かべることができるというところである。一方で中国からは、二次元キャラに強いAI「ERNIE-ViLG」が登場している。コマンドに「pixiv」と入力すると完成度が上がる事から、日本のイラストコミュニケーションサービス「pixiv」の画像を大量学習させているのではないかという疑いが持たれている。ただ、業態としてはMidjourneyに近い事から、悪用うんぬんの話にはなっていないようだ。
「どうなってるか分からない」サービスが上手くいって、「どうなってるか分かりやすい」サービスはツッコまれまくるというのは、考えてみれば不幸な話である。作風を学習するという技術は素晴らしいものがあり、利用価値はあるはずだ。むしろ一般公開ではなく、契約したプロダクション等しか使えないような、ブロ用ツールとして特化していった方がいいのかもしれない。
新しい技術は、まだ起こっていない全ての問題に対して対応しようとすれば、発展や利用は大幅に停滞する。ある程度走ってみて、実際に問題も出てきて、議論して揉んでから細かいところを詰めていくぐらいのスピード感がなければ、競争力のあるサービスにはならないだろう。
単に芽を摘むだけでなく、どういう風にすれば使えるといったアイデアが出せることこそ、AIが敵わない部分であり、人間が人間たる意味がある部分であろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIが描いた絵の著作権は、誰が持つのか Midjourney画像の扱いを考える
呪文を入れると完成度の高い絵を生成してくれる、AIベースのサービス「Midjourney」が人気だ。このMidjourneyと著作権の関係について考えてみた。
イラストレーターの個性を学んで絵を“無限生成”するAIサービス 15枚のイラストから学習
クリエイティブ関連のAIサービスを手掛けるラディウス・ファイブが、AIイラストメーカー「mimic」(ミミック)β版の提供を開始した。同じイラストレーターが描いた15枚程度のイラストをもとに、絵の個性を反映したイラストを無限に生成できるとうたう。
画像生成AI「Stable Diffusion」がオープンソース化 商用利用もOK
AIスタートアップ企業の英Stability AIは、画像生成AI「Stable Diffusion」をオープンソース化した。AI技術者向けコミュニティサイト「HuggingFace」でコードやドキュメントを公開した他、同AIを試せるデモサイトなども公開している。
AIイラスト生成「mimic」、β版の全機能を停止 不正利用などの課題を改善次第、正式版をリリース
絵の個性を反映したイラストを無限に生成できるAIサービスとして話題を集めている「mimic」(ミミック)がβ版の全機能を停止する。運営会社のラディウス・ファイブが発表した。不正利用に関わる課題を改善できた場合、mimicの正式版をリリースするという。
中国産の画像AI「ERNIE-ViLG」が“二次元キャラ”に強いと話題 新しいデモページ公開
中国Baiduが、画像AI「ERNIE-ViLG」を試せるデモ機能を公開した。Twitterでは日本のユーザー間で「二次元キャラの生成に強い」などと話題に。一方で、画像生成AIの分野で中国にビジネス的なアドバンテージを取られるのではと懸念する声も見られる。
