AI名寄せ、秘匿情報の自動検知機能を持つデータカタログ整備ツールを発表 インサイトテクノロジー

全社を挙げてのデータ活用を推進する前に、自社保有データのカタログ整備や秘匿情報の適切な管理、セキュリティ面の対策をどう実現するかはIT管理者らの大きな課題だ。

» 2023年02月21日 12時00分 公開
[原田美穂ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 インサイトテクノロジーは2023年2月8日、「Insight Governor」を発表した。Insight Governorは企業内に散在するデータの可視化と管理、重要データの保護や権限管理を一元化する機能を提供する。同社はこれを「DXインフラ整備ソリューション」と説明する。Insight Governorには次の機能が含まれる。

機能名 概要
Insight Catalog マルチデータベース、非構造化データを含むマルチデータストアのデータをカタログとして一覧・可視化する機能。クリック操作のみでデータソースの登録が可能で、登録されたオブジェクトやカラム、メタデータに対して高速な検索が可能
Insight Master Data Management 対象のテーブルやカラムに対して、日本語AIが自動的に表記ゆれを分析して、名寄せ候補を推奨する
Insight Audit データストアのアクセスログから不正な操作を発見するデータアクセスの監査機能
Insight Masking データに含まれる個人情報などの機密情報を日本語AIで自動抽出して機密情報を秘匿化する
Insight Migration データベース製品の変更やバージョンアップに際して、事前にSQLの互換性を評価するツール

 初版リリースとなるバージョン1はInsight Catalog、Insight Master Data Management、Insight Auditを盛り込む。Insight MaskingとInsight Migrationは今後のバージョンアップで提供する。

データ活用を阻害するデータ分析ツール乱立の弊害を解消する

 データカタログ機能は多用なデータベースやデータストアに対応しており、日本語に対応したAIによるメタデータ付与の半自動化によるデータカタログ整備効率化の他、データカタログに作成者の意図やクエリ作成例などを付与するデータポータルを持つ点が特徴だ。

 同社は製品リリースの背景として、データ活用基盤構築が困難になりつつある点を挙げる。データ取扱量が増える中で、いかにデータを適切に管理、活用できるかがデータ活用の焦点になってきた。しかし、部門ごとに管理されるデータは、部門の中で閉じて利用されており、ブラックボックス化しやすい点が課題となっている。データ管理に当たってはデータガバナンス製品の導入も考えられるが、現在流通するデータガバナンス関連製品の多くは海外製であり、「日本語の対応が不十分なケースもある」と同社は指摘する。

個人情報検知のデモ(出典:インサイトテクノロジーの投影資料)

 これらの問題に加えてデータセキュリティ強化も課題となっており、顧客情報や個人情報保護法に対応した形でデータを活用するには、生成されるデータ全てに対して匿名化や秘匿化などにも対応する必要がある。現在、多くの企業がデータドリブンな意思決定を目指し、従業員のデジタルスキル向上やデータ分析人材へのスキル転換を急ぐが、データ活用を民主化するにはこれらの問題を解決しなければならない。

 同社CTOの宮地敬史氏は「企業の中にはデータ分析ツールが乱立しており、部門や事業ごとにサイロ化している状況がある。これらのデータを効果的に活用するにはデータベース同士の名寄せが課題だ。一方でデータ活用そのものに向けると、必要なデータセットはその都度変化する。われわれはAIやデータ活用ではなく、その手前のプラットフォームの整備に着目してInsight Governerを開発した。プラットフォームさえ整備できれば、従業員がデータを活用する機会が倍になり、データドリブン経営実現につながるだろう。データベース管理者の負荷も90%から30%に下げられると見込んでいる」と製品開発の意図を説明した。

日本語対応AIで名寄せや個人情報の検知を簡略化

 Insight Catalogは企業の中にあるさまざまなデータにメタ情報を付与して管理する仕組みを持つ。各部門が保有するデータソースをGUI経由で特殊なスキルがなくても登録でき、企業全体が持つデータをデータカタログとして可視化しやすくする機能を持つ。同製品の大きな特徴は日本語AIを搭載しており、半自動的にメタデータを付与する点だ。

 「Insight Asirという日本語に対応したAIエンジンを利用する。ルールエンジンベースの検知ツールと比べて制度が高く、このエンジンを使うことでデータベース同士の名寄せも98%程度は自動化できる」(同社プロダクト開発本部 本部長の高橋則行氏)

 このAIエンジンはInsight Master Data ManagementやInsight Maskingでも使われる。

Insight Asirの個人情報検出精度の比較(インサイトテクノロジーによる評価、出典:インサイトテクノロジーのプレゼンテーション資料)
AIを使った段階的な名寄せで人の作業は10%程度まで削減可能と試算(出典:インサイトテクノロジーのプレゼンテーション資料)

 高橋氏が実務上の課題を解決する機能として「気に入っている」と説明したのがInsight Catalogにおけるポータル機能だ。

 「データテーブルやファイルの作成意図を伝えるポータルを中に含んでおり、テーブル情報にクエリの使い方などのヒントも記入できる。誰かが作ったデータベースを他の人が正確に意図やデータの出どころを理解して再利用することは意外と難しい。作成者にタスクが集中したり、データカタログがあっても似たようなデータが乱立したりする要因の一つだ。情報ポータルがあるだけでこうした問題を解消できる」(高橋氏)

データ作成者の意図や操作例をコメントで記述できる(出典:インサイトテクノロジーのプレゼンテーション資料)

 同製品発表に当たっては日本データマネジメント・コンソーシアム発起人でNTTデータ バリュー・エンジニア社長の大西浩史氏がゲストとして登壇した。

 大西氏は企業のデータ活用の課題を見てきた自身の経験から「やみくもにデータ基盤を整備した結果、データ活用が進まないケースが多い」と、企業におけるデータ活用が目的なしに取り組まれている問題を指摘した。

 目的のないデータ基盤整備は一過性のものになりやすくデータドリブンな組織づくりに結び付きにくいため、データ活用にはまず文化の醸成が必要とした。「あるべき状態は、個々人が自分のビジネス課題の解決を目的にデータを作り、それを皆が作成者の意図を理解して活用する状態だ。そのためには源流となるデータがきちんと整っており、継続的に利用できる環境を整えることが重要だ」と、データ基盤の継続的な整備の重要性を語った。

写真左から、インサイトテクノロジーCTOの宮地敬史氏、同社社長兼CEOの森田俊哉氏、同社プロダクト開発本部本部長 高橋則行氏と、当日ゲスト登壇したNTTデータ バリュー・エンジニア社長で日本データマネジメント・コンソーシアム 発起人の大西浩史氏

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ