news063.jpg

自動的に検知:三菱電機が機密文書を発見する新技術、情報漏えい対策に期待

三菱電機は、ドキュメントファイルや電子メールの中から機密文書が含まれるデータを自動検出する新技術を開発した。2009年4月以降の商品化を目指す。


 三菱電機は3月25日、ドキュメントファイルや電子メールに含まれる機密文書データを自動的に検出する技術を開発したと発表した。情報漏えい対策などに利用でき、4月以降の商品化を計画する。

melco01.jpg 検出の仕組み

 開発した技術は、管理者などが機密文書として指定するキーワードでの検出と自己学習型フィルターと呼ばれるテキストデータの抽出・分析技術を組み合わせたもの。自己学習型フィルターは、事前にサンプルとなる機密文書データを登録しておくことで、機密文書に含まれる特徴を記憶し、検出対象データと記憶したデータと照合することで、機密文書を抽出する。

 新技術と正規表現を参照する従来型のフィルタ技術による検出精度を、約1万4000件のサンプルファイルで比較したところ、機密ファイルを正しく「機密」として検出した割合は新技術で99.9%、従来技術で89.7%だった。また、機密ではないファイルを機密として誤って検出した割合は、新技術で1.3%、従来技術が3.6%だった。この実験では、自己学習型フィルターに1万3000件の機密文書をサンプルとして登録した。

 情報技術総合研究所ビジネスデータ基盤技術チームの郡光則リーダーは、「機密文書と機密ではない文書をそれぞれ500件程度サンプル登録することで、実験とほぼ同様の精度を得られる」と説明。機密文書と機密ではない文書を比較することで、検出精度が高まるという。

 実際に運用する場合、利用者によって機密とする条件や内容が異なるため、部署やグループなどの小人数環境での利用に適している。なお、複数の自己学習型フィルターを階層的に構築すれば、大企業が全社規模で運用する場合にも対応できるとしている。

 情報漏えいを防止するための文書検出技術では、登録されている機密文書のハッシュ値を活用するフィンガープリントや、管理者が事前に設定した「社外秘」などのキーワードを利用するのが一般的。だが、フィンガープリントでは登録文書と検査する文書の内容が完全一致もしくは大部分が一致しなければ、機密文書を正しく判定できない。

 キーワード検索では、キーワード設定する管理者が業務内容に精通していることが求められ、特定の人物に作業負荷が集中する課題があった。新技術は自己学習型フィルターでキーワードの追加登録・管理などの手間を解消できるとしている。

melco02.jpg まずキーワード検索を行い、自己学習型フィルターによる検索で補うことで検出精度を高めた

 情報技術総合研究所情報技術部門の中川路哲男部門長は、「フィンガープリントは厳重管理された文書、キーワード検索はローカル上や電子メールの文書の検出にそれぞれ適しているが、新技術はその両方をカバーするもので、国内ではほかに例が無いと見ている。4月からの2009年度中にぜひ事業化させたい」と意欲を示した。

過去のセキュリティニュース一覧はこちら

Copyright© 2010 ITmedia, Inc. All Rights Reserved.




キャリアアップ



エンタープライズ・ピックアップ

news004.jpg 世界で勝つ 強い日本企業のつくり方:利用契約の検討――グローバルクラウドで失敗しないために(前編)
2010年以降、クラウドサービスの利用がさらに加速する。サービスを利用する企業はプロバイダーのデータセンターに預けた自社情報を保護するために、法的な要素を理解しておかなければならない。企業が注意を払うべき法的な検討事項を整理する。

news001.jpg IT投資の新方程式:「Twitter使ってます」――現役MS社員が“社員力”を語る(前編)
マイクロソフトが掲げるプロモーションメッセージ「社員にチカラを。ITで企業力を。(以下、BIEB)」からは、ITで社員の生産性を向上することが業績の拡大につながる、といったニュアンスを感じる。そこで気になるのが「じゃあ、マイクロソフトの社員自身はどうなのよ?」ということ。3人の現役MS社員により実態が明らかになる……?

news010.jpg 産業構造を変えるか:「住宅クラウド」の衝撃
住宅都市工学研究所が進める「住宅クラウド」は、クラウドが企業のIT領域にとどまらず、ビジネスのやり方自体を変える可能性を示している。

news010.jpg オルタナティブな生き方 栗原進さん:ネットでリアルを楽しくしたい
SE出身の企業広報マンでありながら、趣味は落語で憧れの人はインディ・ジョーンズとアナログ全開の栗原さんに、ブログを書く理由やネットからはじまるコミュニケーションについて伺った。

news001.jpg 最強最速アルゴリズマー養成講座:トップクラスだけが知る「このアルゴリズムがすごい」――「探索」基礎最速マスター
プログラミングにおける重要な概念である「探索」を最速でマスターするために、今回は少し応用となる探索手法などを紹介しながら、その実践力を育成します。問題をグラフとして表現し、効率よく探索する方法をぜひ日常に生かしてみましょう。