AI名寄せ、秘匿情報の自動検知機能を持つデータカタログ整備ツールを発表 インサイトテクノロジー
全社を挙げてのデータ活用を推進する前に、自社保有データのカタログ整備や秘匿情報の適切な管理、セキュリティ面の対策をどう実現するかはIT管理者らの大きな課題だ。
インサイトテクノロジーは2023年2月8日、「Insight Governor」を発表した。Insight Governorは企業内に散在するデータの可視化と管理、重要データの保護や権限管理を一元化する機能を提供する。同社はこれを「DXインフラ整備ソリューション」と説明する。Insight Governorには次の機能が含まれる。
機能名 | 概要 |
---|---|
Insight Catalog | マルチデータベース、非構造化データを含むマルチデータストアのデータをカタログとして一覧・可視化する機能。クリック操作のみでデータソースの登録が可能で、登録されたオブジェクトやカラム、メタデータに対して高速な検索が可能 |
Insight Master Data Management | 対象のテーブルやカラムに対して、日本語AIが自動的に表記ゆれを分析して、名寄せ候補を推奨する |
Insight Audit | データストアのアクセスログから不正な操作を発見するデータアクセスの監査機能 |
Insight Masking | データに含まれる個人情報などの機密情報を日本語AIで自動抽出して機密情報を秘匿化する |
Insight Migration | データベース製品の変更やバージョンアップに際して、事前にSQLの互換性を評価するツール |
初版リリースとなるバージョン1はInsight Catalog、Insight Master Data Management、Insight Auditを盛り込む。Insight MaskingとInsight Migrationは今後のバージョンアップで提供する。
データ活用を阻害するデータ分析ツール乱立の弊害を解消する
データカタログ機能は多用なデータベースやデータストアに対応しており、日本語に対応したAIによるメタデータ付与の半自動化によるデータカタログ整備効率化の他、データカタログに作成者の意図やクエリ作成例などを付与するデータポータルを持つ点が特徴だ。
同社は製品リリースの背景として、データ活用基盤構築が困難になりつつある点を挙げる。データ取扱量が増える中で、いかにデータを適切に管理、活用できるかがデータ活用の焦点になってきた。しかし、部門ごとに管理されるデータは、部門の中で閉じて利用されており、ブラックボックス化しやすい点が課題となっている。データ管理に当たってはデータガバナンス製品の導入も考えられるが、現在流通するデータガバナンス関連製品の多くは海外製であり、「日本語の対応が不十分なケースもある」と同社は指摘する。
これらの問題に加えてデータセキュリティ強化も課題となっており、顧客情報や個人情報保護法に対応した形でデータを活用するには、生成されるデータ全てに対して匿名化や秘匿化などにも対応する必要がある。現在、多くの企業がデータドリブンな意思決定を目指し、従業員のデジタルスキル向上やデータ分析人材へのスキル転換を急ぐが、データ活用を民主化するにはこれらの問題を解決しなければならない。
同社CTOの宮地敬史氏は「企業の中にはデータ分析ツールが乱立しており、部門や事業ごとにサイロ化している状況がある。これらのデータを効果的に活用するにはデータベース同士の名寄せが課題だ。一方でデータ活用そのものに向けると、必要なデータセットはその都度変化する。われわれはAIやデータ活用ではなく、その手前のプラットフォームの整備に着目してInsight Governerを開発した。プラットフォームさえ整備できれば、従業員がデータを活用する機会が倍になり、データドリブン経営実現につながるだろう。データベース管理者の負荷も90%から30%に下げられると見込んでいる」と製品開発の意図を説明した。
日本語対応AIで名寄せや個人情報の検知を簡略化
Insight Catalogは企業の中にあるさまざまなデータにメタ情報を付与して管理する仕組みを持つ。各部門が保有するデータソースをGUI経由で特殊なスキルがなくても登録でき、企業全体が持つデータをデータカタログとして可視化しやすくする機能を持つ。同製品の大きな特徴は日本語AIを搭載しており、半自動的にメタデータを付与する点だ。
「Insight Asirという日本語に対応したAIエンジンを利用する。ルールエンジンベースの検知ツールと比べて制度が高く、このエンジンを使うことでデータベース同士の名寄せも98%程度は自動化できる」(同社プロダクト開発本部 本部長の高橋則行氏)
このAIエンジンはInsight Master Data ManagementやInsight Maskingでも使われる。
高橋氏が実務上の課題を解決する機能として「気に入っている」と説明したのがInsight Catalogにおけるポータル機能だ。
「データテーブルやファイルの作成意図を伝えるポータルを中に含んでおり、テーブル情報にクエリの使い方などのヒントも記入できる。誰かが作ったデータベースを他の人が正確に意図やデータの出どころを理解して再利用することは意外と難しい。作成者にタスクが集中したり、データカタログがあっても似たようなデータが乱立したりする要因の一つだ。情報ポータルがあるだけでこうした問題を解消できる」(高橋氏)
同製品発表に当たっては日本データマネジメント・コンソーシアム発起人でNTTデータ バリュー・エンジニア社長の大西浩史氏がゲストとして登壇した。
大西氏は企業のデータ活用の課題を見てきた自身の経験から「やみくもにデータ基盤を整備した結果、データ活用が進まないケースが多い」と、企業におけるデータ活用が目的なしに取り組まれている問題を指摘した。
目的のないデータ基盤整備は一過性のものになりやすくデータドリブンな組織づくりに結び付きにくいため、データ活用にはまず文化の醸成が必要とした。「あるべき状態は、個々人が自分のビジネス課題の解決を目的にデータを作り、それを皆が作成者の意図を理解して活用する状態だ。そのためには源流となるデータがきちんと整っており、継続的に利用できる環境を整えることが重要だ」と、データ基盤の継続的な整備の重要性を語った。
関連記事
- 信頼される企業になるデータ活用の“勘所” 適切なガバナンスを考える
“データを活用する”にはデータを適切に管理する「データガバナンス」が必要不可欠です。どのように構築すればいいのでしょうか。ポイントを紹介します。 - 「ニアリアルタイム」データを全従業員で回すためにデータ基盤エンジニアは何をすべきか
11年連続2桁成長を維持する間接材通販大手のモノタロウ。事業成長を継続できる秘密は、繰り返し改善と改良続けてきたデータ基盤の強さと、それを使いこなす体制整備の優秀さにあったようだ。同社のデータ基盤が今まで何をしてきたかを「中の人」に解説してもらった。 - さまざまなデータを仮想的に統合 アシストが「TIBCO Data Virtualization」を販売開始
アシストは、多様なデータソースを一つの論理的なデータ層として統合するデータ仮想化ツール「TIBCO Data Virtualization」の販売を開始する。アシストのデータ活用基盤構築ソリューションに同ツールを取り込み、企業のデータ活用を支援する。 - データが保険の売り方を変えた DX生かした新商品が好調、三井住友海上を支えるクラウド戦略
「データ分析導入でROIが取れるのか」。かつて高額なデータ分析の仕組み導入で辛酸をなめ、社内でもこんな言葉を投げかけられた担当者は、失敗を糧にした「無駄のないクラウド基盤戦略」で大規模なデータ分析を可能にし、販売手法の変革やヒット商品につなげた。その方法とは。 - 大規模データ分析、実行も運用もテレワークで LIXILの基盤を支えるクラウド戦略
大規模な製品データを従業員が柔軟かつ迅速に抽出、分析できるようにしたい。そんな思いから新たに構築されたLIXILのデータ分析基盤は、クラウドの強みを生かし、極限まで運用を効率化した。現在400人が使い、今後も拡張する同基盤を支える戦略とは。 - データ活用を導入したのに定着しない――社内の壁を破る「伴走型サービス」の使い方
BIツールを導入し、データ活用基盤を構築したのに、1〜2年してプロジェクトのふたを開けてみれば全く進んでおらず、社内にも定着していない――。こんな「もったいない」事態を引き起こす企業には何が足りないのか。伴走型でデータ活用を支援する企業に成功のポイントを聞いた。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.