家村さんたちがまず取り組んだのは、「高速なビッグデータ処理」基盤の導入だ。みずほ銀行では今まで、データベース管理システム(DBMS)製品を使っていたが、ディスクのI/Oが分析のボトルネックになっていることが分かり、DWHを検討しはじめたという。
「データ分析のスピードで問題になっていたのは、大容量データの定型分析と、細かく要素を入れ替えてPDCAを回す非定形分析でした。大容量データの分析に関しては、I/Oがパフォーマンスのボトルネックになっていることが分かり、並列分散処理やハッシュ分散に対応しているDWHアプライアンスの導入を決めました。新システムはまず一部の部署で先行導入し、成果を確認したのち全社展開を行っています」(家村さん)
2013年にDWHを本格導入したのち、家村さんたちはデータ分析における「便利さと正確さの強化」に手を付け始めた。データを整理するため、ユーザー部門が使っているデータプログラムの種類を数えたところ、なんと50万件もあり、そのうち45万件については使われていないことが分かったそうだ。
「データプログラムの棚卸しをしたところ、使われているデータプログラムは50万件のうちわずか10%である5万件しかありませんでした。そのうち利用頻度が高いものは、さらに減って1万件。今回はその中でも、基本的にデータ要素の変更がなく、全社的に使うことが多い2000件のデータプログラムについて、優先的に整備することにしました」(家村さん)
こうして2000件のデータプログラムについて、要素の意味を定義するといった地道な作業を行う一方で、このデータプログラムを使うライトユーザー向けのBIツールも新たに導入した。社員から「分かりやすいUIのツールがほしい」とオーダーされていたことや、既に自主的に導入していた人がいたことから、GUIベースであるSAPのBusinessObjectsを選んだ。
「BusinessObjectsを使う人は、基本的に定型のリポーティングが中心ですね。ツールを置き換えたわけではなく、より高度な分析をする人には従来のBIツール(SAS)を使ってもらっています」(家村さん)
Copyright © ITmedia, Inc. All Rights Reserved.