ITmedia NEWS > STUDIO >

萌えキャラ生成AI、学習データを“ネットの海”からゲッチュするのはアリか?「STORIA法律事務所」ブログ(2/5 ページ)

» 2017年11月28日 08時00分 公開
[柿沼太一ITmedia]

モデル生成の際に行う作業

 生データ収集からモデル生成の一連の流れを図にするとこのようになります。

photo

 上の図で言う「作業」とは、具体的にはデータのコピーだったり、整形だったり、データセットを用いた機械学習や深層学習ということになりますが、これらの行為を適法に行うにはどうしたらよいのでしょうか。

著作権侵害行為になるようにも思える

 具体的には、これらの作業1〜3で行っている行為が著作権法上の「複製」や「翻案(ほんあん)」に該当するかどうかです。仮に複製や翻案に該当すると、著作権者の許可なしに行った場合、原則として著作権侵害行為となります。

 まず作業1、2のところです。この作業においては、生データのダウンロードや整形などを行います。今回の例でいうと、対象サイト上の画像データをダウンロードする行為ですし、あるいは買ってきた漫画をスキャンしてデジタルデータ化するなどの行為です。この作業1、2においては、明らかに生データの「複製」や「翻案」を行っていることになります。

 作業3はどうでしょうか。作業3における機械学習や深層学習行為自体は、データセットの複製でも翻案でもありません。

 複製とは「印刷、写真、複写、録音、録画その他の方法により有形的に再製すること」(著作権法2条1項15号)、翻案とは簡単にいうと「ある著作物の表現上の本質的な特徴の同一性を維持しつつ,具体的表現に修正,増減,変更等を加える行為」(最高裁江差追分事件)ですが、通常は、生成された学習済みモデルの中には生データや学習用データセットの痕跡は全く残ってないからです(ちなみに、データセットのデータ構造がほぼそのままモデルの中に残るモデル生成方法もあるようです。そのような場合には別途検討が必要です)ただ、学習過程で「複製」や「翻案」が行われることはあります。

 とすると、結局作業1〜3においては、著作権者の同意なく複製や翻案を行っていることになり、著作権侵害となるように思われます。

日本の機械学習の救世主「著作権法47条の7」

 しかし、そこでさっそうと現れるのが著作権法47条の7です。著作権法47条の7は学習済みモデル生成に際しては非常に重要な条文ですのでぜひ覚えておいてください。

条文は以下の通りです。

第四十七条の七  著作物は、電子計算機による情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。

 簡単に言うと「情報解析」のためであれば、必要な範囲で、著作権者の承諾なく著作物の記録や翻案ができる、というものです(ただし一部例外あり)。

 従って「情報解析」に「機械学習・深層学習」が含まれるとすれば、「機械学習・深層学習」のためであれば著作物について著作権者の承諾なく自由に記録や翻案ができる、ということになります。

 そして、この点については、私が知る限りでは、「情報解析」に「機械学習・深層学習」は含まれる、すなわち「機械学習・深層学習」に著作権法47条の7は適用されるという意見が多数を占めていると思います。

 そのような見解に立つと、たとえ他人の著作物であっても、機械学習・深層学習のためであれば著作権法47条の7により無許諾で自由に利用できる、ということになります。さらに、この条文の最大のポイントは、「非営利目的の利用」に限定されていないことです。

 つまり営利目的(販売・有償提供目的)の学習済みモデル生成のためにもこの条文は適用されますので、営利目的であっても著作物の「記録・翻案」が可能なのです。

 ちなみに諸外国でも日本著作権法47条の7と同趣旨の規定はあるのですが、いずれも非営利目的のみ許容されていますので、営利目的の場合でも適用がある日本著作権法47条の7は、世界的に見ても特異的であり、端的に言うと「著作権法47条の7は日本の機械学習の宝」であり「機械学習するなら日本においで」ということになります。

結論

 このように、仮にMakeGirls.moeが、著作権者の許諾を得ないでGetchu掲載のキャラをモデル生成に利用していたとしても、著作権法47条の7により著作権侵害にはならない、ということになります。

 実は、これ以外にも「Getchuのライセンス上、著作権法47条の7による利用も禁じる旨規定されていた場合にはどうなるのか」という問題があります。もっとも、この点については、Getchuにおいて利用ユーザーが当該ライセンスに同意したことになるのかが若干疑問なので、ここでは割愛します。

生成された学習済モデルは誰のものか

 このように、生データを利用して学習済モデルを生成した場合、その学習済みモデルに関する権利を誰が持つのか、ということが次に問題になります。

Copyright © ITmedia, Inc. All Rights Reserved.