データ分析の敵“汚いデータ” やらかす人への対策、どうすればいい?:CEDEC 2023(2/2 ページ)
データ分析が一般化した現在、その前提となるデータの記述や加工の段階で、データ処理初心者がやってしまいがちな落とし穴がある。ゲーム開発者向けカンファレンス「CEDEC 2023」では、データ記述やデータ加工の失敗例やその対策を伝授する講演が開かれた。
“えげつない”データ加工をする人への対策は
データ記述の“落とし穴”があれば、データ加工にも“やらかし”がある。戸崎さんは講演で、データ分析に初めて携わった人がしがちな「とんでもないデータ加工」のパターンも紹介した。
特にBIツールからデータ分析を始めた人は、「データ型設定」の誤りをしがちという。例えば、金銭の計算に浮動小数点型(0.01→1.0×10^-2など、小数を指数などで表現すること)を用いたり、浮動小数点型同士のテーブルを結合(Join)したりするのが典型だ。計算の誤差が生じ、正しく結合できないため、こうした処理では浮動小数点型は推奨されない。
また、日本語でフィールド名(項目名)を設定することも好ましくない。特に半角と全角のスペースが混在して、解析の支障となるという問題が生じるためだ。同様の理由で、半角マイナスではなく「_(アンダーバー)」を使用する、半角カナの使用も避けるといった配慮も必要となる。
では一体、とんでもないデータ加工をする人への対策はどうすればいいか。対策は至って明快で「やらかす本人にデータの基礎を学び直してもらう」ことだ。
「そもそも、やらかす人はデータを整える考え方自体が抜け落ちているので、それを直す以外にない。それを直さずに、いわゆるデータの民主化といって、データドリブンの環境に加わってもらっても、結局はその人が汚いデータを垂れ流して、データベース側がどんどん汚くなるだけだ」(戸崎さん)
そのうえで、データ分析初心者への教育が難しい場合には、外部業者の専門業者を挟むなどして、きれいなデータに修正した上で処理を行うという手段も候補になる。
ただし、どちらの手段を選ぶにしても、データ利用を必要とする部署に対して、人材教育か金銭的負担を強いることになる。全社でのデータ活用を推進していく中では、相応の戦略が必要となるだろう。
社内のデータ活用の味方につけるべき人は?
データ分析担当を任された人に対して、戸崎さんは社内での「味方づくり」を提案する。経理や財務、総務といった「データの正確性や清潔性が重要となる部署」のデータ分析を支援し、それを成功事例とすることで、社内でのデータ活用の機運が高まり、本丸の事業部へもスムーズに展開できるという。
また、社内でデータ活用を推進していく上で、“巻き込んではいけない人”も挙げられた。それは「経営層」だ。戸崎さんは「彼らは、最初に数字ありきで物事を考える人たちで、各部門に数字を割り当てるのが仕事。唯一データが介入できるのは“数字を決める前”であるため、割り当て時点でデータを並べても意味がない」と指摘。
「経営層が求めているのは経営判断に必要な材料で、これをそろえるのはトップ層の一つ下の人たち。経営層に報告を挙げるだろう社長室や経営企画部門をターゲットに、データ活用を働きかける方が効果的だ」(戸崎さん)
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
なぜ「ネ申エクセル」は生まれたのか 誕生を目撃した元市役所職員が語る“美しさ”の追求
役所や行政に提出する書類でこんな書類を見かけたことはあるだろうか。セル結合を多用し、方眼紙のマス目状となった1セルに対してそれぞれ1文字のみを入力するようなExcelファイルのことだ。一時期と比べるとだいぶ減ってきたものの、まだ見かけることも多い。なぜこうした独自のフォーマットが生まれたのか。元市役所職員がその背景を語った。
「ゲーム業界目指す最低限できていない」──社長のSNS投稿が議論呼んだサイバーコネクトツーが、実は抱えていた育成の課題
ゲーム業界を目指す学生に対する社長の投稿がSNSで議論を呼んだサイバーコネクトツー。実は、社内では新人育成・採用の課題を抱えていたという。同社が取り組む対策とは。
データ分析に時間かけすぎ? 「分析疲労」に要注意 BIツール提供元が語る、データ活用までつなげるコツ
ウイングアーク1stは、売上高100億円以上の企業の役職者530人を対象にしたデータ活用の実態調査の結果を発表した。半数以上の企業がデータ活用に注力していると答えた一方、一部では分析に時間をかけすぎてしまう「分析疲弊」に陥っていると答える声も上がった。
データ活用を社内に浸透させるには? 調剤薬局のクオールホールディングスが凝らした工夫とは
調剤薬局を運営するクオールホールディングスでは、データ分析のためにクラウドBIツール「Domo」を導入している。導入当初、社内で浸透させるには苦戦したが、ある工夫を凝らすことで解決を図ったという。
管理部門のデータ活用で営業部門も幸せに 西濃運輸の“現場主導”なBI導入が成功したワケ
データを活用した営業活動の強化を現場主導で進める西濃運輸のロジスティクス部。実はデータ活用のプロジェクトを立ち上げたのは営業部門ではなく、管理部門だったという。管理部門の取り組みがなぜ営業の強化につながったのか。プロジェクトの全容をキーパーソンに聞く。


