検索
ニュース

NICT、音声コーパス誤公開で個人情報漏えい 話者の呼称など

本来非公開のボイスチェック用音声ファイル115人分が含まていた。

Share
Tweet
LINE
Hatena

 情報通信研究機構(NICT)は、研究用に公開した音声コーパスについて、本来非公開のボイスチェック用音声ファイル115人分が含まれており、氏名など人の呼称が漏えいしたと発表した。住所や連絡先、生年月日などは漏えいしていないという。

画像
ニュースリリースより

 音声コーパスとは、音声ファイル群と、それに対応する書き起こしなどの付加情報から成るパッケージ。音声認識や音声合成、翻訳、話者認識などのサービス開発・評価に活用される。

 NICTは3月12日午後3時ごろ、音声合成用の音声コーパス「音声合成用日本語複数話者音声コーパス」を研究用に公開した。翌13日午後9時ごろ、公開対象外であるボイスチェック用音声ファイル115人分が、誤って公開用データに含まれていたことが、外部の研究者からの指摘で判明した。

 このため、14日午前9時ごろにコーパスの公開を停止。新たなアクセスやダウンロードができない状態にした。現時点で、ファイルがネット上に流布・二次利用された情報はないという。

 公開期間中に最大12件のアクセスがあった可能性を確認しており、公開時の周知先にデータの利用停止と削除を要請。連絡可能だった相手からはすでに削除済みの回答を得た。

 誤って公開された音声の話者には、個別に事実関係の説明と謝罪を進めている。今回の事態を受けNICTは、ファイルの公開手続きや確認体制の見直しを含む再発防止策を講じる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る