メディア
ITmedia AI+ >

画像の“権利”をしっかり守る? うわさの「ピュアモデルAI」の仕組みは 開発会社に聞いてみた(1/2 ページ)

» 2024年04月30日 12時00分 公開
[松浦立樹ITmedia]

 4月上旬、“漫画家の著作権を守るAI”と打ち出された「ピュアモデルAI」という生成AI技術がネットで話題になった。発起人は、Webtoonなどを手掛けるエンドルフィン(東京都港区)と、AI技術の開発を行う韓国・SUPERNGINEの2社。著作者である漫画家のデータだけを学習したAIモデルであり、作家の“権利”を守ることができるという。

“漫画家の著作権を守るAI”こと「ピュアモデルAI」を開発した2社

 発表があった当初は「数枚の画像を追加学習することでAI生成画像を特定の絵柄に寄せる『LoRA』を使っているのでは」と指摘する声があった。LoRAを巡っては、ネット上に出回っている作品を著作権者の許可なしに追加学習させるケースも見受けられる。また、この場合は、ネット上のさまざまな画像データを学習に使った「Stable Diffusion」などの汎用AIモデルが基本的に使われる。

 これらのようなAIモデルの開発・利用を巡っては「画像の著作権者にことわりなく無断で学習に使っているのは著作権を侵害しているのでは」と指摘する声もある。このため、世界各国でAI利用・開発時のガイドラインや関連法の模索・整備が進んでいる。

 一方、2社は「ピュアモデルAIは汎用モデルを活用した生成AIとは一線を画している」とし、それらの使用を否定。では一体どのような技術なのかについて、同社らはプレスリリースなどで声明を発表していたが「特許出願中のため、現時点でこれ以上の詳細を伝えることはできない」としていた。

ピュアモデルAIの出力例(1/3)

 そこでITmedia AI+では取材を試みたところ、ピュアモデルAIについてエンドルフィンとSUPERNGINEから返答を得ることができた。両社が話すピュアモデルAIの仕組みについて、一問一答形式で紹介する。話し手は、SUPERNGINEの代表取締役であるキム・ドンジュンさんと、エンドルフィンの代表取締役であるチャン・ヒョンスさん。

 なお、一問一答の中で「著作権」という言葉が出てくるが、ITmedia NEWSがそれを著作権と認めているわけではなく、取材時の表現をそのまま記載している。

ピュアモデルAI開発会社に一問一答

──「ピュアモデルAI」とは、一体何か?

キム・ドンジュンさん(以下敬称略) 著作権者が描いた画像データから作風スタイルや、カラーリング、特徴を学習して、その著作権者が描こうとしている結果物を純粋に出力する方法、これを私たちは「ピュアモデルAI」と呼んでいます。ピュアモデルAIは、汎用的な生成AIモデルとその活用の目的と使い方が全く異なります。

 汎用モデルのように、どんなキーワードを入力してもうまく画像が生成されるわけではなく、学習データにない指示を受けた場合、何を生成すべきかは分かっていながらも、それを表現する材料がないため、なんとか類似した異様な画像を生成したりはしますが、学習されてないイメージを任意にうまく生成したり、他の作家の絵柄を再現したりすることはありません。

 例えば汎用モデルの場合、有名な作家が描いた特定の作品やキャラクターを学習していれば、関連するキーワードを入力するとそれらをまねた画像が出力できると思います。しかし、ピュアモデルAIではそれらの例は全く再現することができず、デタラメなモノを生成するのです。学習データをしっかり統制した生成AIだからこそ、このような現象が起こります。

 そのため、学習データ元である作家が“実際に書いたことのあるものしか出てこない”というある意味失敗したモデルではあるかもしれません。しかし、このような現象が起こることこそが著作権をしっかり守っている証拠にもつながっていると思っています。学習していない、別の作家の絵柄をまねて出力するものではなく、学習させた作家の絵柄だけを生成するのです。

ピュアモデルAIの出力例(2/3)
ピュアモデルAIの出力例(3/3)

──ピュアモデルAIの学習フローは汎用モデルと何が違うのか?

キム 現在のピュアモデルAIは最低50枚の画像データがあれば、作家の絵柄を再現可能なモデルを作れる段階にあります。これは私たちが望む画像データがぴったりそろえていれば実現できる必要最低限のデータの数で、基本的には200枚以上の画像データが必要になる場合が多いです。

 SUPERNGINEでは2022年下半期からAI開発に取り組んでおり、当初は約500枚の画像データが必要でした。契約した作家別に一つ一つ制作されるピュアモデルAIは、それぞれが作る作品の最終の完成原稿を再び学習させることで当該作家の絵柄がだんだん高度化していきます。現在(4月13日時点)当社と契約している、ある作家の場合、ピュアモデルAIのバージョンは4.1であり、毎週バージョンアップされています。

 数十億件のデータセットで学習させ、さまざまなタスクに対応できる汎用の基盤モデルにわずかなデータを追加学習させ、特定の目的に合わせてファインチューニングしていくという方式が最近ほとんどの生成AIの会社で駆使しているやり方だと思います。しかし、私たちが現在特許を申請している技術を使うことで、少ない画像枚数でも作家の絵柄を再現できると同時に、他の作家さんの絵柄は現れないAIモデルを作成することに成功しました。

 画像生成AIを開発する際によく見られるのが、Hugging Faceなどで公開されている汎用モデルや、LoRAなどをダウンロードし、それらをミックス・調整して使ったりするケースだと思います。しかし、これらの方法で作ったAIモデルは画像生成時に著作権の問題を抱えている学習元のデータに影響されるので、絶対に使ってはいけないと考えております

 ではなぜ著作権の問題を抱えながらも、このような手法でAIモデルの開発が活発に行われているのかというと、それがやり方として一番楽で簡単だからです。また、技術力の問題で少ないデータセットで作家の絵柄を再現できない、という場合もあると思います。

 一方、当社では作家の画像データだけで作ったAIモデルと、それに対する作家の画像データのみを使ったファインチューニングのみで、出力した生成物を高度化させることに成功しています。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.