ITmedia NEWS > STUDIO >
連載
» 2017年11月28日 08時00分 公開

萌えキャラ生成AI、学習データを“ネットの海”からゲッチュするのはアリか?「STORIA法律事務所」ブログ(3/5 ページ)

[柿沼太一ITmedia]

 MakeGirls.moeのように、Web上に公開されているデータを自ら収集してくるケースの場合にはあまり表面化しない論点なのですが、「モデル生成事業者が、特定の第三者が保有しているデータを、当該第三者との間の契約に基づいて提供を受けてモデル生成をした場合」には、この「生成された学習済モデルは誰のものか」は非常にシビアな問題となります(当事務所でもよく相談を受ける点です)。

 例えば、あるモデル生成事業者が医療用の病変画像発見AIを生成する際には大量の医療画像が必要となりますが、そのような医療画像は現時点では医療機関から提供を受けるしかありません(「現時点では」と書いたのは次世代医療基盤整備法が施行されれば状況が変わる可能性があるからですが、ここでは省略します)。

 つまり、医療機関からデータ提供を受けてモデル生成をした場合、そのモデルは医療機関が保有するのか、モデル生成事業者が保有するのか、あるいは共有なのか、ということです。

 データ提供者からすれば「データがなければ学習はできないはず、なのでモデルはデータ提供者が保有している」と主張しますし、モデル生成事業者からすれば「生データそのままでは学習ができないので必要なデータ処理をしなければならないし、データのどこに着目して学習するかなどの点に高度なノウハウがあります。さらに実際に生成作業をしているのだから、モデル生成事業者がモデルを保有している」と主張したいところです。

 もっとも、「データ提供者とモデル生成者が異なった場合に、どちらがモデルに関する権利を保有するか」という点については決まったルールなどはなく、結局のところ契約交渉によって解決するしかないのではないかと考えています。

 ここでは、そのような契約交渉におけるポイントだけご紹介します。

1、モデルに関する権利をどちらに帰属させるか

(1) データ提供者 

(2) モデル開発者

(3) 共有

2、双方がモデルについてどのような利用(マネタイズ)ができるか

(1) 自己使用

(2) 第三者にライセンスしてロイヤリティー徴収

(3) 譲渡

3、相手方当事者に対する対価支払いの方法・有無

(1) 単発支払

(2) 継続支払

(3) 対価支払いなし

 上記の3点です。契約交渉により上記1、2、3を適宜組み合わせたスキームを構築していくイメージです。結果的には、例えば以下のようなパターンのスキームが考えられます。

パターン1 データ提供者のみに権利帰属・独占利用、モデル制作時にのみモデル開発者に対価を支払う(データ提供者によるモデルの買い切り)

パターン2 データ提供者とモデル開発者がモデルを共有。データ提供者はモデル利用不可。モデル開発者のみがモデルを独占利用できるが、モデル開発者はデータ提供者に継続的な対価を支払う

パターン3 モデルを両者で共有して利益をシェアする

パターン4 モデルを両者で共有して両者それぞれがビジネスを展開し、対価の支払いは行わない

Copyright © ITmedia, Inc. All Rights Reserved.