彼は、今手元にあるデータが「帰還した爆撃機のデータ」のみであり、「帰還しなかった爆撃機のデータ」が含まれていないことに気付いたのです。帰還した爆撃機のコックピットと尾翼に穴が開いていないのは、そこを撃たれたら帰還できないからではないか? 帰還した爆撃機の損傷場所は、撃たれても帰還できる部分なのではないか? というのがウォルドの洞察でした。
私たちはついつい目に見えているものだけを真実と錯覚し、判断してしまいます。しかしデータとは、現象を切り取った「断面」の数字にすぎないのです。従って、目の前の数字から仮説を作るより、頭の中の仮説を補う数字を探す方が、結果を出すためにははるかに現実的です。
これはあまり知られてはいませんが、「分析」という言葉の反対の意味を表す言葉は「総合」になります。
総合とは、別々のものを1つにまとめ上げることを表現します。その反対ですから、分析には分解する、鑑別するという意味があり、発展して「命題から条件をさかのぼる」という意味もあります。つまり、あるものごと(事象)をバラバラにして、なぜそうなっていたのかを考えることを「分析」と表すのです。
これを“料理”に例えて考えてみましょう。大根を金具ですりおろせば、水分と食物繊維に分かれた見事な大根おろしが完成します。しかし、一度バラバラになった大根おろしが、再び1本の大根に戻ることはなく、それ以外の料理に変わることもありません。大根おろしを作ってしまってから、おでんを食べたいと思ってももう遅い。新たな大根を買うしかありませんね。
当たり前の話だと思われるかもしれませんが、これがデータ分析の現場で起こり得る現実です。仮説を持つというのは、「今日食べたい料理は何か?」を考えることに似ています。それを決めずに材料を買い、調理を始めても、きっとその多くが使われず、腐って無駄になってしまうでしょう。それなのに、まだ新たな材料(データ)がほしいのでしょうか。
新たなインサイトを得るというのは、新たな料理を作り出すことに似ているかもしれません。しかし、何の予測や経験もなしに料理のレシピを生み出す人はいないはず。そして、材料を追加しなくても、調理の方法を変えるだけで新たな料理は生まれるものです。
冒頭で紹介した「データは重要だ!」という号令に対しては、それが「本当に私たちにとって必要なデータか?」と考えることが必要でしょう。無秩序にデータを増やし続ければ、それを支えるネットワークやストレージなど、ITインフラのコストもかさんでしまいます。
分析というのは、やってみなければ結果は出ませんが、行動を重視しているからこそ、ムダを減らすための準備――つまり“たたき台”が重要になるのです。とはいえ、このたたき台作りに熱中し、何の行動も起こさないのは本末転倒。この連載を読んでいる皆さんならば、それはよく理解していただけると思っています。
Copyright © ITmedia, Inc. All Rights Reserved.