復号せずに複数の暗号化データの関連性を解析、NICTらが医療データ解析で実証医療ビッグデータを安全に活用

NICTと筑波大学は、医療データを暗号化されたまま解析する技術「まぜるな危険準同型暗号」を利用して、医療データを復号せずに、解析対象のデータかどうかを判別できることを実証した。個人の遺伝情報と病気の罹患情報との統計的な関連性を、各個人の病気の有無や遺伝情報を知ることなく安全に解析できるため、医療ビッグデータを安全に活用しやすくなる。

» 2018年07月19日 08時00分 公開
[@IT]

 情報通信研究機構(NICT)のセキュリティ基盤研究室と筑波大学は2018年7月18日、三重大学で教授を務める山田芳司氏の協力の下、医療データを暗号化したまま解析する技術「まぜるな危険準同型暗号」を用い、同暗号方式の性能を実証したと発表した。暗号化した医療データを復号せずに、解析対象データかどうかを判別できる。例えば個人の遺伝情報と病気の罹患(りかん)情報との統計的な関連性を、データを暗号化したまま安全に解析できといった利点があるという。

医療データだけを管理する病院が、遺伝情報だけを管理する検査機関から暗号化データを受け取り、データを暗号化したまま情報の関連性を判定できる

 個人のプライバシーを保護した上で医療データを新たな治療法の開発などに活用しようとした場合、プライバシー保護の手段としては暗号化が有効だ。暗号化したデータに対して加算や乗算が可能な準同型暗号技術を利用したデータ解析技術の開発が進んでいる。

 ただしデータを暗号化すると、そのままでは解析対象のデータかどうかを判別できなかった。判別するには復号する必要があり、プライバシー上の懸念がある。そのため従来は、解析対象外のデータの混入を検出できないまま解析を進めてしまい、誤った統計値が出力される恐れがあった。

 NICTらが2016年に開発したまぜるな危険準同型暗号は、誤データ混入防止機能を持つ準同型暗号方式。データとは別に暗号化したキーワードを用い、同じキーワードに関連した暗号文に対してのみ準同型演算を許す。暗号文が同じキーワードに関連しているか否かを、キーワードそのものを知ることなく判定できる。

 異なるキーワードに関連した暗号文に対して準同型演算を行った場合は警告を発し、警告を無視して準同型演算を行っても、復号時にそれを判定する機能を備えている。

 暗号技術の実証実験として、今回、病気の罹患情報と遺伝情報を解析対象データとして、「ある病気に罹患していること」と「ある遺伝的特徴を持つこと」の統計的な関連性を解析した。解析値として「遺伝的特徴を持ち、かつ、病気に罹患している人の数の暗号文」を計算した結果、4500人程度のデータから、病気の罹患情報と個人の遺伝情報との統計的な関連性を1分弱で得た。さらに異なる病気の医療データの暗号文が混在した場合、数ミリ秒程度で検出できることを確認した。

 NICTと筑波大学によれば「同技術によって、対象外のデータが混入していないことを暗号理論的に証明した上で、収集した医療データを、プライバシーを保護したまま解析できる。これにより新たな診断方法や治療法の早期かつ効率的な発見につながることが期待される」という。

 なお、暗号化データ解析手法の研究開発は、NICTと筑波大学が共同で行った。NICTは暗号化データ解析ツールの開発を、筑波大学は医療データ検定方法の検討を担当した。実証実験には、三重大学がデータベース化した臨床情報と遺伝情報のデータを用いた。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ