次にコカ・コーラ ボトラーズジャパンが進めたのがデータ提供戦略、つまりどのツールでデータを提供し、分析するかだ。ベキアレス氏はこのツール選定が非常に重要だと考え、データ提供にはクラウドDWH「Snowflake」を採用した。
「分析専用のツールをユーザーに用意するのはコストがかかりすぎ、ユーザー側としても使いこなすハードルが高いと言えます。そのためやはり日頃から親しんでいるExcelをツールとして使うのが最適だという結論になりました」(ベキアレス氏)。
ただ、Excelをデータ分析に使用するとなるとデータボリュームの問題が残る。そこでベキアレス氏は2段階でデータを取得する仕組みを考案した。第1段階の画面で、分析用途に合わせたデータ項目だけを選び、取得ボタンを押すと新しくExcelファイルが開き、そこに直接ODBC(Open Database Connectivity)経由でデータが格納される。そして空のピボットテーブルも自動生成される。これならユーザーの負担がほとんどない。
ピボットテーブルに慣れていないユーザーに向けては、あらかじめ幾つかの分析事例を作っておき、マニュアル代わりとした。そしてこれらの分析事例に沿って、2回にわたって1時間の研修会を開催した。ベキアレス氏によると、これは非常に好評を博したという。その後はヘルプデスクを「Microsoft Teams」に設けていつでも質問できるようにした。当初は質問が寄せられたものの約1週間でなくなった。ベキアレス氏は、今は問題なく利用できている状態だと考えている。
同社は、データ処理戦略でどのような方策を講じたのか。まずCSV形式のボリュームある生データは、一度「Amazon Simple Storage Service」(Amazon S3)にアップロードしてからSnowflakeに取り込んだ。この方法であれば、シンプルな定義でAmazon S3にアップロードでき、簡単に取得できる。
また、調査会社から提供されているデータは回答者一人当たり一行で、列が数千列にも及ぶものになっている。それではデータ処理が実行しにくいため、行と列を変換する必要がある。この方法をSnowflakeに相談したところ、推奨されたのがExcelの配列関数だった。
「配列関数を活用したことで数千万行を8秒で処理できました。処理コストもほとんどゼロに近いので、何度も開発段階で繰り返しても、そのコストと時間についてあんまり考えなくてもいい。それは非常に良かったと思います」(ベキアレス氏)
ただ分析する際は、必要に応じて再び行と列を変換した方がいいが、DWHで事前に全てを入れ替えるのはコストの面に現実的ではない。ベキアレス氏は、これについてもSnowflakeに相談したところ、ストアドプロシージャの利用を勧められた。ストアドプロシージャとは複数のSQLを1つのプログラムにまとめ、リレーショナル・データベース管理システム(RDBMS)に保存することだ。これによって、ストレージコストおよび処理コストをほぼかけずに、Excelにデータを展開可能になった。
ベキアレス氏は、生データが活用できるようになって得られた効果として以下の3つを挙げた。
1つ目は静的レポートの結合というマニュアル作業から解放され、データ提供までの時短効果を得たことだ。静的レポートしか使っていなかった時代、レポートの種類が多すぎるため、切り口によってExcelにまとめるという作業が発生しており、これに3週間を要していた。
2つ目は全体のサマリーレポートの作業時間の短縮で、動的レポートから作ることで非常に作業効率が向上した。
ベキアレス氏にとって最も意味深いといえるのが3つ目の効果で、それは自由自在に分析でき、深掘りができるデータが8000項目生まれたことで、データ分析の文化が醸成されつつあることだ。ユーザーからも「作業効率が良くなったこと以上に、データが深掘りができるようになってうれしい」という声が寄せられている。
「一番印象深かったのは『いろいろな深堀りをして活用の幅が広がったので、作業時間が良い意味で増えました』というコメントです。組織全体でデータ活用スキル向上を達成しようという私のような立場の人間には、非常に心が温かくなる、うれしくなる言葉でした」とベキアレス氏は語り、セッションを締めくくった。
Copyright © ITmedia, Inc. All Rights Reserved.