みずほ銀行、2400万人の顧客データベース構築に挑んだ11年の歴史【特集】Transborder 〜デジタル変革の旗手たち〜(2/3 ページ)

» 2017年10月23日 08時00分 公開
[池田憲弘ITmedia]

データベースの「高度化」を10年以上続けてきた

 みずほ銀行が、顧客データの分析に本格的に取り組み出したのは2006年のこと。顧客の属性情報、アンケート回答、購買履歴といった、あらゆる情報をデータベース化し、顧客のニーズに合わせたターゲティングを行う、データベースマーケティングをミッションとするチームがスタートしたのだ。

 優良顧客との取引を深化させるだけではなく、積極的に顧客にアプローチして顧客満足度と生涯収益を高めていく。新しいマーケティング活動を行うためには、これまでのDBでは対応できない。吉澤さんたちの地道な活動が始まった。

 「銀行が保有するデータというのは、勘定系や情報系を始めとして、デビットカードやCAFISなどの外部接続系のデータ、各店舗での営業情報といったオフラインのデータなどさまざまなものがあります。しかし、当時はSASを使った分析が一般的だったこともあり、これらのデータはデータベースという形ではなく、テキストデータ(固定長やCSV、TSVなどのフラットファイル)で格納されていたのです。

 そのデータはシステムや処理目的別にバラバラで存在しており、当時でも1000種類くらいありました。しかもそのデータは、そのままではPDCAサイクルを高速で回すような分析には使えないのです。その時にちょうどTeradataのシステムを導入したこともあり、頻度高く、高速な活用が必要な情報をベースにRDBを作りました。自分たちはITにそれほど詳しくなかったので、テラデータの担当者に教わりながら、半年くらいかけて、1つひとつ地道に構築していったわけです」(吉澤さん)

photo 勘定系や情報系を始めとして、さまざまなデータがバラバラにフラットファイルとして存在していたが、その中から高速活用が必要なデータをベースにRDBを構築したという(資料提供:みずほ銀行)

 当時はSAS用データの保管や提供をIT部門が、分析はマーケティングチームが行う体制だったため、業務部門だけでプロジェクトを進めていったという。分析のためのインフラも購入し、マシン室の空調整備、バッチの運用・監視、障害対応なども全て自分たちで行った。「もはや半泣きでしたよ(笑)。テラデータの方々にも『ここまでユーザー部門が入るのは珍しい』と驚かれました」と吉澤さんは当時を振り返る。

 その後、SAS環境の更改時期が来たタイミングで、IT部門がTeradataのシステム運用を請け負うようになった。現在はSASとTeradata、そしてSPSSといった各種ツールが連携できる形になっており、「それぞれのツールのいいとこ取りをしています」(吉澤さん)という。

 システムの運用が手離れしたことで、中身の充実、つまりデータベースの高度化は一層進んでいった。「みずほDNA」を作るために1000、2000とある項目を作成し、0-1のフラグが付くようにしていく。これをみずほ銀行の利用者である(のべ)2400万人について、分かる限りのものを全部作っているというから驚きだ。現在は「7割方埋まっている状態」で、そのデータをクラスタリングなどの処理をしながら、共通する価値観を探っているそうだ。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ