米Googleは9月5日(現地時間)、自社サービスの強化に使っている「differential privacy library」(差分プライバシーライブラリ)のオープンソース版をGitHubで公開した。
差分プライバシーを使うデータ分析は、個人データが識別されないようにしながら大規模なデータセットから学習できるようにするアプローチ。分析の結果から個人データを再識別することもできないよう保護できる。例えばヘルスケア分野で、様々な病院の患者の入院平均時間を比較したい場合、患者を個人として特定できない状態でデータを利用できる。
ライブラリはほとんどの一般的なデータサイエンス操作をサポートし、プライバシー保護を確実にするための「確率的差分プライバシーモデルチェッカーライブラリ」を含み、集約機能、プライバシー予算管理などの拡張用モジュールもある。
Googleは、例えばGoogleマップで検索したレストランの情報に混雑時間や人気メニューを表示する機能に、差分プライバシーを使っている。
広告が主な収入源であるGoogleは、ユーザーのプライバシー意識が高まる中、データを集めずに機械学習する「Federated Learning」などの技術に取り組んでいる。
また、機械学習用データを匿名化する「TensorFlow Privacy」やMPCツール「Private Join and Compute」などをオープンソース化している。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR