画像生成AIの開発を手掛けるAIベンチャー・AI Picasso(東京都港区)は9月9日、学習に対する透明性が高い画像生成AI「CommonArt β」を公開した。学習には、改変などの許可がある画像データのみを使用。著作権への配慮を徹底したという。日本語に対応しており、商用利用もできる。
学習に使ったのは、「改変が許されるライセンスを持つ」「改変しても商用利用可能である」「ライセンスを変更しても良い」の3つの条件を満たす画像。この条件を満たすクリエイティブ・コモンズライセンス「CC BY 4.0」と「CC0 1.0」の画像を原則として学習用データに使い、CommonArt βに学習させた。これにより、著作物を勝手に改変したり、改変したものを勝手に販売したりすることがないようにしたという。
学習用の画像には、複数の学習用テキストを付けるなどして、学習した画像をそのまま表示しないように対応。著作権侵害が起きるリスクを減らしたという。
テキストの入力は英語だけでなく、日本語にも対応している。入力テキストの処理部分にはサイバーエージェントの日本語対応大規模言語モデル(LLM)「CALM2-7B」を採用。例えば「夕日が沈む海岸。海岸には波が打ち寄せている。海岸はオレンジ色でほのかに明るい。海岸は芝生でできている」と日本語の文章を入力するだけで、指示した内容の画像が出力できる。
モデルのラインセンスには、オープンソースソフトウェアでよく使われる「Apache-2.0 License」を採用。商用利用や再配布、改変などが可能だ。
なお計算力不足や日本の知識の少なさ、アニメ画像の生成ができないなどの弱点もある。同社は、フィードバックを生かしながら、より良いサービス提供を目指すとしている。
Copyright © ITmedia, Inc. All Rights Reserved.