ITmedia NEWS > 企業・業界動向 >
ITmedia AI+ AI活用のいまが分かる

話題の画像生成AI「Stable Diffusion」、ビジネスモデルは? 企業の利用状況は? 日本法人代表にいろいろ聞いてみた(3/3 ページ)

» 2023年04月13日 14時00分 公開
[石井徹, 井上輝一ITmedia]
前のページへ 1|2|3       

―― こういう画像をもっと作ってほしいという、希望はあるか。

ジェリー 絵のスタイル1つとっても、山水画や印象派、サイバーパンクなど、多様な描き方がありますよね。Stable Diffusionを使えば、フォレストパンクのような、過去あまり注目されていなかったようなスタイルを発明することもできますし、全く新しい画風を創造することもできます。例えば、「宇宙空間に存在する都市」のような、実写では存在しえないような絵も手軽に制作できます。

“生成イラストのポーズ指定”技術にはStability AIも驚き

―― 新しいアイデアを誰かが披露して、それに触発された人たちがさらに新たなアイデアを加えるという、アイデアの連鎖が起こりやすいプラットフォームだと思う。ほぼ毎週のように新しいアイデアが発明されて「ControlNet」や「LoRA」のような技術も次々と登場している。Stable Diffusionのモデルを開発した企業として、この制御の仕方は予想していなかったなと驚かされた機能はあるか。

ジェリー 正直、こんなに早く関連技術が開発されて、うまくワークするとは、社内外で誰も予想していなかったと思います。例えば、ポーズや構図を指定できる「ControlNet」がここまでうまく動作するとは思ってもいませんでした。

 Stable Diffusionを活用した研究の進展の速さにも驚かされます。22年8月に発表された「Dream Booth」という画像最適化技術があるのですが、2月に発表された最近の論文では、たった1枚の画像と10秒ほどの訓練時間で画風を学習させるというさらに高速なアプローチが発表されています。22年時点でも生成AIはすでに注目を集めていましたが、アルゴリズムの改善と新たな発明が各所で起こっています。

企業は“こっそり”使っている

―― Stability AIに問い合わせた上で、Stable Diffusionを商業利用している企業は日本で何社くらいあるか。

ジェリー 検討中という企業が多く、実際に利用されている企業はそこまで多くはない状況です。あとは、“こっそり”使われている企業さんもいますが、表立って公表するのは避ける傾向もあります。

―― どのような用途で使われている?

ジェリー やはり、画像を扱う業界で使われることが多いですね。出版、広告、メタバース、バーチャル系。

―― こっそり使っている企業は、なぜ公表を避けたがる?

ジェリー 多くの企業は、コミュニティーからの反感を買わないか、炎上しないかを懸念しているようですね。著作権についての問い合わせもありますが、日本の著作権法上は、著作物をAIの訓練に使うことは合法となっています。

 とはいえ、「合法でも嫌だ」と感じている方もいます。その意味でも、コミュニティーと親和性を保ちつつ、生成モデルを改善させていくことは、Stability AIのビジネスとして成立させていく上での大きな課題だと考えています。パブリックドメインの画像などを用いた、クリーンなデータセットを作成する作業などにも、注力している状況です。

クリーンなモデルの課題 “気持ちのグレーゾーン”のどこに線を引くか

―― パブリックドメインや許諾取得済みの画像だけで学習させたクリーンなデータセットは、許諾無しで大規模に学習させたデータセットと比べると、出力の精度が落ちるという課題はないか。

ジェリー もちろん、精度で不利になってしまう側面はあります。それでも、多くの方に安心して画像生成AIを使っていただくためには、クリーンなデータセットを活用する意味はあると考えています。

 ただし、“クリーン”という概念も主観的な判断によるところもあるのも難しい部分です。例えば、漫画家とイラストレーターそれぞれのコミュニティーでも受け取られ方は違うようです。現実的には、各企業がStable Diffusionを使う時に、用途やコミュニティーに受け入れやすいデータセットを選んで訓練していく形になるかもしれません。

 クリーンなデータを集める具体的な方法としては、パブリックドメインや著作者からのライセンス取得が標準的な方法ですが、例えば3次元のキャラクターからポーズや角度の違う2次元の画像を大量に制作して学習に使う方法など、違ったアプローチもあります。生成AIに共感していただいたアーティストから画像データを寄付してもらい学習に用いている企業もありますね。

 法的にはセーフでも、“気持ちのグレーゾーン”の幅は広く、受け止められる方それぞれで異なります。生成AIを使う企業にとっても、主観的な判断で線引きを決めていくことになると思っています。

(執筆:石井徹、編集:井上輝一)

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.