膨大な企業取引データから見えたもの 帝国データバンクがビッグデータ分析に本腰

企業の信用調査データなどを提供する帝国データバンクが新たな情報分析基盤を構築。ビッグデータを活用して顧客に対するサービスの強化を図った。

» 2014年01月22日 08時15分 公開
[伏見学,ITmedia]

 企業信用調査や信用リスク管理サービスなどを手掛ける帝国データバンクは、1900年の創業以来、100年以上にわたって信用情報をはじめとするさまざまな企業情報を顧客に提供してきた。2014年1月現在、72万社・470万期の企業単独財務ファイル、144万社の企業概要ファイル、160万社の信用調査報告書ファイルのほか、1社1コードで設定する独自の「TDB企業コード」に基づく430万社の経営情報を保有する。

帝国データバンク 産業調査部 産業調査第1課 統計士の後藤隼人氏 帝国データバンク 産業調査部 産業調査第1課 統計士の後藤隼人氏

  これらの情報は、企業財務データベース「COSMOS1」、企業概要データベース「COSMOS2」、企業信用調査データベース「CCR」、連結企業データベース「C-tree」といったデータベースに分類、格納されている。以前は各データベースが別々のシステムで管理されていたため、それぞれの情報を統合して分析するには一定の労力を要した。また、データベース内の企業ごとの取引先や関連会社などの項目においては、TDB企業コードを付番していなかったため、項目内の企業において事業所移転などがあった場合のメンテナンスにも課題を抱えていた。そうした背景から、2008年ごろにデータベースを整備。データベース内の項目に登録する企業にもTDB企業コードを付番したことに加えて、情報を統合的に管理できるシステムを構築した。

 一方で、同社が所有する企業情報だけでは不十分な側面も浮かび上がってきた。COSMOS1やCOSMOS2の情報は基本的に年に1度の更新となる。マーケティングで活用する顧客は即時性の高い情報が必要なはずだ。だからこそ企業のホームページなどWeb上で発信される情報、例えば、新製品・サービスや人事などの情報を随時データベースに取り込むなど、精度を高める余地があった。「帝国データバンクが長年にわたって蓄積してきた企業情報は、その企業が信用できるかどうかという観点を重視して調査されたもの。マーケットの評価など即時性の高い情報を加えることは、TDB企業情報をマーケティングに活用する顧客に対して非常に重要だった」と、同社 産業調査部 産業調査第1課 統計士の後藤隼人氏は振り返る。

 しかしながら、大量のWebデータを処理するには、既存の情報分析基盤では難しく、スピードも遅かったというシステム上の課題があった。同社 企総部 システム統括課の澤山健吾氏は「産業調査部からのニーズに応えるには、Web上のデータをクローリングして、分析するようなシステムが不可欠だった」と話す。

数日かかったデータ処理が数時間に短縮

 こうした状況に対応すべく同社が構築したのが、ビッグデータ分析ソフトウェア「IBM InfoSphere BigInsights」を活用した新たな情報分析基盤だ。

帝国データバンク 企総部 システム統括課の澤山健吾氏 帝国データバンク 企総部 システム統括課の澤山健吾氏

 導入製品の前提条件として、大規模データ分散処理システム「Hadoop」を利用した分散処理環境を作るのが最も効率的だという考えの下、ベンダー各社にHadoopソリューションの提案を打診した。「その中でBigInsightsを選んだのは、日本IBMの技術的なサポートが充実していた点にある。我々にとってHadoopの利用は初めての経験だったので重要だった」と澤山氏は強調する。

 ビッグデータに対応した情報分析基盤の構築プロジェクトは2011年11月にスタート。2012年5月には社内で検証を実施し、同年11月から企業情報のリストアップサービスを開始した。短期間でプロジェクトを完遂した理由について、澤山氏は「社内でも注目を集めていたプロジェクトだったため、早く形にしてビジネス貢献につなげていきたかった」と述べる。

 新システムによる具体的な効果は何か。1つはデータ処理スピードの大幅な向上である。クロールされたWeb上のさまざまなデータの処理時間に関して、以前は数日から数十日かかっていたのが、数時間で完了できるようになったという。例えば、データの種類によっては数十億件をわずか30分で処理できるほどの速さだ。「この高速化によって、データ分析における試行錯誤ができるようになった。さまざまな切り口で繰り返し分析しながら、より質の高い分析データを顧客に提供することが可能になった」と後藤氏は力を込める。

企業と企業を結ぶネットワークに着目

 新しい切り口を提供したものとしては、「コネクターハブ」企業がある。地域経済における震災復興の担い手は誰なのかについて、これを同社が持つ企業取引データを基に、東日本大震災の被災地企業の取引先、さらにその取引先といった取引ネットワークを分析したところ、複数の企業の取引において中核となる「コネクターハブ」企業の存在が浮き彫りになったという。

 例えば、東北地域の場合、農林水産や自動車、電機などの産業がネットワークを形成し、全国の企業やマーケットにつながっているため、このネットワークのハブとなる企業を中心に据えて、復興の担い手として活用することで、被災地産業の振興を加速させることが期待されている。

 「企業のネットワークを分析することで、その産業構造の中で何が起きているかを知る手掛かりとなる。こうした分析は、例えば、国や自治体などの政策立案において役立つものだと考えている」(後藤氏)

 まさにビッグデータを武器に、新たな価値創造に乗り出した帝国データバンク。日本最大級の企業情報データベースという名にたがわぬよう、データドリブンの質の高いサービスを今後も顧客に提供していく。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ