現在多くの企業で、活用されないまま眠っている「死蔵データ」をいかにビジネス価値へ転換するかが大きな課題となっている。日本TCSのトンプソン・ジョエル博士に、死蔵データの実態と活用への道筋について話を聞いた。
この記事は会員限定です。会員登録すると全てご覧いただけます。
企業が保有するデータの多くが、実際には活用されないまま眠っている。DXが叫ばれて久しいが、この「死蔵データ」をいかにビジネス価値へ転換するかが、依然として多くの企業で喫緊の課題となっている。
膨大なデータを蓄積していながらも、その大部分を活用できずに放置している現状は、企業にとって大きな機会損失といえるだろう。今回、日本タタ・コンサルタンシー・サービシズ(以下、日本TCS)で世界各地で30年以上にわたりAIやロボティクス分野を支援してきたトンプソン・ジョエル博士(AIセンターオブエクセレンス本部ヘッド)に、死蔵データの実態と活用への道筋について話を聞いた。
ジョエル博士がさまざまな業界の企業と向き合う中で、多くの企業がデータ活用において根本的な課題を抱えているという厳しい現実を目の当たりにしてきた。博士は次のように指摘する。
「なぜ企業がデータを大規模に活用できていないのか。基本的な問題はデータの可用性と品質にあります。AI技術は確かに進化していますが、多くの企業では、この二つの課題が、AIを大規模にビジネス活用することを妨げています。データは存在していても、使える形になっていないのです」
ジョエル博士によれば、活用されていないデータは大きく分けて3つのカテゴリーに分類できるという。
第1のカテゴリーは、デジタル化されていない書類やPDFなどのドキュメント類だ。紙の書類、スキャンしただけのPDF、Excelファイル、PowerPointの資料などが該当する。これらは約70%以上が有効活用されていないと推測される。文字情報としてデータベース化されていないため、検索もできなければ分析にも使えない状態で放置されているのが実情だという。長年にわたって蓄積してきた技術文書や過去のプロジェクト資料が、資料室やファイルサーバの奥深くで誰にも参照されることなく存在し続けている。
第2のカテゴリーは、事業部門ごとに分かれてサイロ化したデータベースだ。組織が事業部門中心の構造になっているため、データベースがそれぞれ独立して存在している。それらの約50%は特定の機能でしか使われておらず、部門を横断した活用ができていない。営業部門のデータと製造部門のデータを組み合わせれば新たな洞察が得られるはずだが、多くの企業はそうした分析を実行していない。
第3のカテゴリーは、クラウドに保存されているデータだ。DXに取り組む多くの企業がクラウドストレージやデータウェアハウスを導入しているが、その中でも約30〜40%のデータが眠ったままになっている。クラウドに移行したことで「データ活用の準備は整った」と安心してしまい、実際の活用フェーズに進めていない企業が少なくない。
これらの数字はあくまでも長年日本TCSが企業を支援してきた中で得られた推定値だが、現実に多くの日本企業が似たような状況にあるという。
近年では、これらの死蔵データを活用する手段として、AI、とりわけ生成AIやLLM(大規模言語モデル)が注目されている。ただしジョエル博士は「AIが唯一の方法ではない」と強調する。
AIを利用しない従来型のBIも依然として有効な手段だ。BIはデータを見える化し、分析やレポーティングを可能にする。経営判断に必要な情報を提供するという点で、ビジネスにとって極めて有効なインプットとなる。ダッシュボードを通じて売上推移や顧客動向をリアルタイムで把握できるようになるだけでも、経営の質の大幅な向上が見込めるからだ。
とはいえ、AIが強力な選択肢になることは間違いない。とくに非構造化データの処理や、大量のドキュメントからの情報抽出においては、AIの力なくしては実現が困難なケースが多い。
「重要なのは、どのデータを何のために使うのか、という目的を明確にすることです。その上で、AIを使うのか、従来型のBIで十分なのかを判断すべきです。AIは強力なツールですが、万能薬ではなく、あくまでも選択肢の一つです」
死蔵データがもたらす最大の問題は、過去の知見や経験がビジネスに生かされないことだ。とりわけ、長年事業を続けてきた企業ほど、設計資料や報告書、ノウハウが膨大に蓄積されている。しかしそれらを検索できず、担当者の記憶や属人的な知識に頼っている状態では、新しい価値は生まれにくい。そればかりか、蓄積コストを削減するために、データを捨ててしまうケースも少なくないという。
残念ながら、企業におけるデータ活用において、日本は世界に比べて約5年遅れているのが現状だとジョエル博士は言う。
「日本が遅れている背景には、組織構造とITガバナンスの違いがあります。欧米では15〜20年前から組織のフラット化に取り組み、標準化を推進するための強力なIT部門を構築してきました。そのような組織は、CIO(最高情報責任者)がリーダーシップを発揮し、全社的なデータ戦略を推進できる体制が整っています。日本企業がCIO主導のIT体制を整え始めたのは約10年前からであり、現在でも、各事業部門が独自のシステムを持ち、データの一元化が進まない構造が残っています。意思決定においても、特定の部門でなければ判断できないケースが多く、部門横断的なデータ活用への移行を妨げる要因となっています」
ではこのような課題はどうすれば解決できるのか。ジョエル博士は過去の事例を基に説明した。
50年以上の歴史を持つ建設会社であるA社は、過去の設計図面、作業計画、各種ドキュメントなど膨大なデータを保有していた。しかし、これらはPDF、Excel、PowerPointなどさまざまな形式で社内の共有フォルダに保管されているだけで、整理も加工もされていなかった。
この状態の問題点は、例えばベテラン技術者の知見を活用しようとしても、どこに何の資料があるのか分からないことだ。50年分の資料の中から、自分が今取り組んでいるプロジェクトに関連する過去の事例を探し出すことは、事実上不可能に近い。そうしているうちに、ベテラン技術者の頭の中にある暗黙知が、組織として継承されないまま失われていってしまう。
日本TCSのアプローチは、まずデータ活用の目的を明確化することから始まった。「全てのデータを抽出して活用しようとすると、非常に大きなコストがかかってしまい、ROIを証明することも難しくなります。そこで、新たな建設設計に役立てるという目的に絞り、必要なデータのみを選択的に抽出する戦略を採用した」とジョエル博士は説明する。
データ活用の方針が決まったら、次にOCR技術などを利用して必要な文書を読み取り、それらを一元管理できる標準的なデータベースに格納し、LLMを活用して柔軟に検索できる環境を構築した。その結果、ユーザーは単一の画面から特定のプロジェクトや設計に関する過去の事例を容易に検索できるようになった。これによって、ベテラン技術者の知見を、組織として継承できる仕組みが実現した。
ジョエル博士はデータ活用を成功させるためのポイントとして3つの要素を挙げた。
第1に、データ活用のビジョンを明確に定義すること。どのようにデータを活用し、どのような価値を生み出すのかを組織として共有することが出発点となる。「何のためにデータを活用するのか」という問いに、経営層から現場まで一貫した答えを持てることが重要だ。
第2に、新しいテクノロジーを積極的に活用すること。データスペース、MCP(Model Context Protocol)、マルチエージェントといった新しい概念やツールが次々と登場している。これらを取り入れることで、従来のデータウェアハウス構築よりも迅速かつ低コストでデータを抽出・活用できる。
第3に、全てのデータを一度に抽出しようとしないこと。目的に応じて必要なデータを選択的に抽出することで、コストを抑えながら着実に成果を出すことが可能となる。
データは企業にとって重要な資産だが、活用されなければ価値を生まない。死蔵データを宝の山に変えるためには、まず自社のデータがどのような状態にあるかを把握し、活用の目的を明確にすることから始めるべきだろう。日本企業は欧米諸国に後れを取っているというが、今からでも決して遅くはない。
「今後数年の間に、オンデマンドでのデータ抽出などももっと進化してくるはずです。それらの新しいテクノロジーを積極的に導入することで、企業が直面している死蔵データの問題は解決に向かうと考えています」とジョエル博士は展望を語る。
「データは、それ自体に価値があるわけではありません。使われて初めて価値になります。眠っているデータを、どう目覚めさせるか。その一歩を踏み出すことが重要です」
Copyright © ITmedia, Inc. All Rights Reserved.