メディア
ITmedia AI+ >

TikTok運営企業のインターン生、内部からAI学習業務を妨害 「奪ったリソースで研究し学会で受賞」との匿名告発も

» 2024年12月13日 10時27分 公開
[ITmedia]

 TikTokを運営する中国ByteDanceが、元インターン生に対し訴訟を起こしていると英BBCなど複数メディアが報じている。ByteDanceによると、元インターン生は研究プロジェクトのモデル学習タスクに悪意を持って干渉したという。一方、当のインターン生が干渉により得た計算リソースを自身の研究に優先的に割り振っていたと告発する匿名文書もGitHubに公開されている。さらにその研究が著名な学会で最優秀賞を受賞したこともあり、関係者の注目を集めている。

 元インターン生は北京大学の大学院生で、英BBCや米Reutersなどの報道によれば、ByteDanceが持つ大規模言語モデルのトレーニング用インフラを攻撃したという。BBCの報道によれば、攻撃による損失額が数百万ドルに及ぶとのうわさもあったが、同社は「誇張されている」と否定している。同社は8月にこのインターンを懲戒解雇した。

 本件を巡って、何者かがGitHubで告発文書とみられる資料を公開しており、その内容が日本のXなどで話題になっている。文書は当のインターン生が、不正アクセスしたByteDanceの計算資源を、自分が所属する同社内の研究チームに優先的に割り振っていたと主張するもの。さらに、研究結果をまとめた論文が学会で賞を取ったとして、倫理的な懸念を表明している。

photo 告発文書とみられる資料(一部抜粋)

 投稿者の素性は不明。アカウント名は「var-integrity-report」で、他の投稿などは見られない。VARは論文が扱っている技術「視覚的自己回帰モデリング」(VAR)を指すとみられる。integrityは誠実さを指す語。総じて、匿名の告発用アカウントとも捉えられる。

 var-integrity-reportの投稿によれば、元インターン生は5カ月にわたってByteDanceの計算資源に不正アクセスし、他の研究プロジェクトを妨害していたという。攻撃の詳細にも触れており、(1)他の研究者が利用するGPUクラスタ環境のソースコードを変更、(2)GPUでの実験を意図的に停止、(3)トレーニングを中断するためのバックドアを作成、(4)デバッグに関するミーティングに参加し、そこで得た情報を攻撃用コードの改良に活用、(5)他の研究者が訓練していたモデルの重み付けを変更し、実験結果を再現不可能にする──といった妨害を行っていたとしている。

photo 攻撃の詳細(文書から一部抜粋)

 そしてvar-integrity-reportはAIの世界的な学会「NeurIPS」で2024年に最優秀論文賞を取った論文が、一連の行為により、他の研究プロジェクトを妨害して作られたものと主張。技術的な価値は認める一方で、学術的な誠実さやNeurIPSの理念に反しているとして、研究コミュニティーに対し、表彰の再考を求めている。

 さらに、ByteDanceに対して論文の取り下げも求めている。論文はByteDanceと北京大学に所属する研究者の共著であることから、同社に所属する他の研究者の不公平感をぬぐうためにも、NeurIPSの主催者と協力して行動するべきだと主張している。

 なお元インターン生に対しては、10月時点でも「Justice Fighter」というGitHubのアカウントが、同様の告発を行っていたことを確認した。Justice FighterはGPUリソースへの攻撃手法についてvar-integrity-reportと似た指摘を行っていた他、元インターン生に対する追及の様子を収めた音声をYouTubeで公開している。var-integrity-reportも、音声の一部を資料として文書で紹介している。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ