“Excelでデータ分析を実現” コカ・コーラ ボトラーズジャパンは膨大なCSVとどう闘ったか?(2/2 ページ)

» 2023年03月23日 07時00分 公開
[吉田育代ITmedia]
前のページへ 1|2       

Excelでもデータ分析は実現できる

 次にコカ・コーラ ボトラーズジャパンが進めたのがデータ提供戦略、つまりどのツールでデータを提供し、分析するかだ。ベキアレス氏はこのツール選定が非常に重要だと考え、データ提供にはクラウドDWH「Snowflake」を採用した。

 「分析専用のツールをユーザーに用意するのはコストがかかりすぎ、ユーザー側としても使いこなすハードルが高いと言えます。そのためやはり日頃から親しんでいるExcelをツールとして使うのが最適だという結論になりました」(ベキアレス氏)。

 ただ、Excelをデータ分析に使用するとなるとデータボリュームの問題が残る。そこでベキアレス氏は2段階でデータを取得する仕組みを考案した。第1段階の画面で、分析用途に合わせたデータ項目だけを選び、取得ボタンを押すと新しくExcelファイルが開き、そこに直接ODBC(Open Database Connectivity)経由でデータが格納される。そして空のピボットテーブルも自動生成される。これならユーザーの負担がほとんどない。

左の画面データ項目を選び取得ボタンを押すと、右の画面のように新たにExcelファイルがデータが格納される(出典:コカ・コーラ ボトラーズジャパン発表資料)

 ピボットテーブルに慣れていないユーザーに向けては、あらかじめ幾つかの分析事例を作っておき、マニュアル代わりとした。そしてこれらの分析事例に沿って、2回にわたって1時間の研修会を開催した。ベキアレス氏によると、これは非常に好評を博したという。その後はヘルプデスクを「Microsoft Teams」に設けていつでも質問できるようにした。当初は質問が寄せられたものの約1週間でなくなった。ベキアレス氏は、今は問題なく利用できている状態だと考えている。

データ処理戦略ではコスト最適化を追求

 同社は、データ処理戦略でどのような方策を講じたのか。まずCSV形式のボリュームある生データは、一度「Amazon Simple Storage Service」(Amazon S3)にアップロードしてからSnowflakeに取り込んだ。この方法であれば、シンプルな定義でAmazon S3にアップロードでき、簡単に取得できる。

 また、調査会社から提供されているデータは回答者一人当たり一行で、列が数千列にも及ぶものになっている。それではデータ処理が実行しにくいため、行と列を変換する必要がある。この方法をSnowflakeに相談したところ、推奨されたのがExcelの配列関数だった。

配列関数の活用(出典:コカ・コーラ ボトラーズジャパン発表資料)

 「配列関数を活用したことで数千万行を8秒で処理できました。処理コストもほとんどゼロに近いので、何度も開発段階で繰り返しても、そのコストと時間についてあんまり考えなくてもいい。それは非常に良かったと思います」(ベキアレス氏)

 ただ分析する際は、必要に応じて再び行と列を変換した方がいいが、DWHで事前に全てを入れ替えるのはコストの面に現実的ではない。ベキアレス氏は、これについてもSnowflakeに相談したところ、ストアドプロシージャの利用を勧められた。ストアドプロシージャとは複数のSQLを1つのプログラムにまとめ、リレーショナル・データベース管理システム(RDBMS)に保存することだ。これによって、ストレージコストおよび処理コストをほぼかけずに、Excelにデータを展開可能になった。

ストアドプロシージャの活用(出典:コカ・コーラ ボトラーズジャパン発表資料)

作業負荷軽減、時短効果、分析充実、生データ活用効果は多大

 ベキアレス氏は、生データが活用できるようになって得られた効果として以下の3つを挙げた。

 1つ目は静的レポートの結合というマニュアル作業から解放され、データ提供までの時短効果を得たことだ。静的レポートしか使っていなかった時代、レポートの種類が多すぎるため、切り口によってExcelにまとめるという作業が発生しており、これに3週間を要していた。

 2つ目は全体のサマリーレポートの作業時間の短縮で、動的レポートから作ることで非常に作業効率が向上した。

 ベキアレス氏にとって最も意味深いといえるのが3つ目の効果で、それは自由自在に分析でき、深掘りができるデータが8000項目生まれたことで、データ分析の文化が醸成されつつあることだ。ユーザーからも「作業効率が良くなったこと以上に、データが深掘りができるようになってうれしい」という声が寄せられている。

 「一番印象深かったのは『いろいろな深堀りをして活用の幅が広がったので、作業時間が良い意味で増えました』というコメントです。組織全体でデータ活用スキル向上を達成しようという私のような立場の人間には、非常に心が温かくなる、うれしくなる言葉でした」とベキアレス氏は語り、セッションを締めくくった。

生データ活用で得られた効果(出典:コカ・コーラ ボトラーズジャパン発表資料)
前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ