ITmedia NEWS > 社会とIT >

AI開発にまつわる紛争や訴訟リスクを減らすには? 弁護士が解説「STORIA法律事務所」ブログ(3/5 ページ)

» 2019年11月08日 07時00分 公開
[柿沼太一ITmedia]

原告主張の根拠と被告の反論及びコメント

 原告の請求は大きく分けて「引き渡し請求」と「損害賠償請求」に分かれますが、各争点に関する原告の主張と被告の反論、柿沼のコメントは以下の通りです。

 なお、コメント部分は模擬裁判やパネルディスカッションでの議論を踏まえての、柿沼の個人的な意見です。

1 引渡請求

(1) 学習用データセットの引渡請求

 原告は契約上の2つの条項を手掛かりに、2つの異なる根拠で学習用データセットの引き渡し請求をしました。

 学習用データセットは「納入物」に含まれる

 【原告の主張】

 学習用データセットは個別契約書の「納入物」に定められている「ソースプログラム」に含まれるため、引き渡しを求める。

 【被告の主張】

 学習用データセットは中間成果物に過ぎず、納入物(=ソースプログラム)には含まれない。

 コメント:

 学習用データセットは生データを加工したデータベースの一種なので、「『納入物』として定められているソースプログラムに含まれる」という原告の主張は成り立たないと思われます。模擬裁判でもこの点に関する原告の主張は成り立たない可能性が高いとの意見が大半でした。

 学習用データセットは「秘密情報」の「改変物」に含まれる

 【原告の主張】

 ・X 社が提供した生データ(=製品のサンプル画像1万枚)は、第41条第1項の「秘密情報」である。

 ・秘密情報の返却に関しては、第41条第5項で第39条が準用されている。

 ・第39 条第5項では、「甲から提供を受けた資料等 次条第 2 項による複製物及び改変物を含む。 」の返還が定められている。

 ・本件学習用データセットは、 X 社が提供した生データ(=製品のサンプル画像1万枚)を加工して作成されたものであるから、当該生データの「改変物」である。

 【被告の主張】

 元データをベンダーのノウハウにより大幅に加工してデータベース化しており、全く別物の情報に変更されているため、元データの「改変物」に当たらない。

コメント

 これは(ア)より原告の主張の筋が良いように思います。

 まず、原告が被告に提供した生データ自体が「秘密情報」に該当することには争いがありません。したがって「学習用データセット」が「秘密情報」を「改変」したものなのかが争点となり、「改変」がどのような意味なのかが問題となります。

 模擬裁判では、裁判長は、まずその点に関する契約書以外の資料がないか、を確認しました(ちなみに、今回の模擬裁判では契約書の文言の解釈だけが問題となりましたが、実際の案件においては契約書だけが作成されているということはほとんどなく、提案書等の資料の授受やメールのやり取り、議事録などがありますので、それらの記載が非常に重要となります。実務的には契約書の記載だけが問題となるわけではない、という意味で重要な視点です。)。

 次に裁判長は、著作権法上の「改変」(著作権法第20条)という文言が解釈の手掛かりになるのではないかと指摘をしました。

 この点については、学習用データセットについては「改変」に該当する場合があるのではないかと思われます(学習用プログラム、ハイパーパラメータ、学習済みモデルについては生データ(秘密情報)と何らかの意味で類似性や同一性があるとはいいがたいと思いますが)。

 つまり、学習用データセット=生データ+加工(クレンジングやアノテーション)+データベース化(学習に適したデータの取捨選択)により生成されます。

 したがって、その加工の程度によっては、(著作権法上の「改変」や)本契約書上の「改変」に該当し、原告の請求が成り立つ可能性があるのではないかと思われます。

 模擬裁判でも、ベンダがどの程度生データに加工して学習用データセットを生成したかについて裁判所が被告に説明を求めていました。

(2) 学習用プログラム及びハイパーパラメータの引渡請求

 原告は、(2)についても、学習用データセットと同様、契約上の2つの条項を手掛かりに、2つの異なる根拠で学習用プログラム及びハイパーパラメータの引き渡し請求をしました。

 学習用プログラム・ハイパーパラメータは「納入物」に含まれる

 【原告の主張】

 学習用プログラム・ハイパーパラメータは個別契約書「納入物」に定められている「ソースプログラム」に含まれるため、引き渡しを求める。

 【被告の主張】

 学習用プログラム・ハイパーパラメータは被告がもともと保有しているプログラムやノウハウであり、「納入物」としての「ソースプログラム」に含まれない。

コメント:

 学習用プログラム・ハイパーパラメータは、被告の主張する通り被告がもともと保有しているプログラムやノウハウですので、「『納入物』として定められているソースプログラムに含まれる」という原告の主張は成り立たないと思われます。

 学習用プログラム・ハイパーパラメータは「秘密情報」の「改変物」に含まれる

 【原告の主張】

 学習用データセットと同様「秘密情報」の「改変物」に含まれ、被告に返却義務がある。

 【被告の主張】

 提供された元データとは無関係に、被告が自己のノウハウに基づき作成・設定したものであり、元データの「改変物」に当たらない。

コメント

 ここも生データが「秘密情報」に該当することは争いがありませんが、学習用データセットと異なり、学習用プログラム及びハイパーパラメータが「改変物」に該当するということはあり得ませんので、原告の請求は成り立たないと思われます。

(3) 学習済みモデルのソースコード引渡請求

 さあ、最も熱い論点です。

 原告からすれば、学習済みモデルのソースコードを引き渡してもらえれば、別のベンダーにそれを渡して精度向上や保守が可能になる一方で、ベンダーとしてはノウハウの塊であるソースコードの引き渡しは何としても避けたいところです。

 原告は、(3)についても、契約上の2つの条項を手掛かりに、2つの異なる根拠で学習済みモデルのソースコードの引き渡しを請求しました。

 学習済みモデルのソースコードは「納入物」に含まれる

 【原告の主張】

 学習済みモデルのソースコードは個別契約書「納入物」に定められている「ソースプログラム」に含まれるため、引き渡しを求める。

 【被告の主張】

 ソースコードは開発の源泉であり、開示してしまうとノウハウや営業秘密が漏れてしまうばかりか、簡単に複製や改変が可能となってしまう。そのため、取引通念上ソースコードは非開示にして納品するものである。したがって、ソースプログラムとは、あくまで完成品としてのプログラムを指すにすぎず、ソースコードは含まれない。

 コメント:

 通常「ソースコード」と「ソースプログラム」は通常は同義と解釈されていると思います。

 したがって、この点については、契約書の文言だけを見る限りでは、原告の請求が成り立つ可能性が高いのではないかと思われます。模擬裁判での被告の主張も「ソースプログラム」という言葉については、担当者が契約書のひな形をそのまま利用してしまった、などかなり苦しいものでした。

 もっとも、ユーザは当初バイナリコードしか納品を受けておらず、その点について特に不満等を言わなかったにもかかわらず、後日態度を翻してソースコードの引き渡し請求をしてきたことについてどのように考えるか、という問題はあります(ちなみに、納品後どの程度の期間文句を言わずに使っていたか、という事情は明らかではありません)。

 模擬裁判においては、その点がかなり重視され、裁判長からは「納品時に文句を言わなかったのに、なぜ一定期間が経過してからソースコードの引き渡しをしてほしいと言い出したのか」という点について、原告に説明するよう要請がありました。

 模擬裁判では結論まで出しませんでしたが、この点については、「契約書には「ソースプログラム」と記載されているが、当事者間の合理的な意思解釈として、それはバイナリコードの意味だった」ということが成り立つかどうかだと思います。

 契約書に明確に「ソースプログラム」と記載がある以上、私はそのような解釈が成り立つ可能性は乏しいのではないかと思います。

 ただし、実際の裁判では、周辺事情、具体的には、納品後原告が異議を述べていなかった期間の長短や、契約締結前にどのようなやり取りがなされたのか(例えば、原告自身での改変や保守が想定されているなど、ソースコードを開示することが前提となっているようなやりとりがあったか)などによって結論は変わってくると思われます。

 学習済みモデルのソースコードは「秘密情報」の「改変物」に含まれる

 【原告の主張】

 学習用データセットと同様「秘密情報」の「改変物」に含まれ、被告に返却義務あり

 【被告の主張】

 元データを改変してもソースコードにはならない。ソースコードはベンダのノウハウにより制作されたものであるから、元データの「改変物」に当たらない。

コメント

 ここも生データが「秘密情報」に該当することは争いがありませんが、学習済みモデルがその「改変物」に該当するということはあり得ませんので、原告の請求は成り立たないと思われます。

Copyright © ITmedia, Inc. All Rights Reserved.