金になる“重要なデータ”って、どこにあるんですか?DMP成功まで、あと1センチ(11)(2/3 ページ)

» 2017年03月24日 09時00分 公開
[松本健太郎ITmedia]

文脈があることで数字は“意味”を持ち、“データ”となる

 こういう言い方をすると元も子もないですが、どんな情報も言ってしまえば、ただの文字や数字です。その文字や数字を読み、意味のあるものにして初めて「データ」と呼ばれるようになります。

 宇宙の帝王と恐れられる宇宙人が「私の戦闘力は53万です」と言ったところで、比較対象がなければ、どれだけすごいのかは分かりません。53万というのはただの数字です。他のメンバーの戦闘力が出そろって初めて「53万」の凄さに絶望するのです。

 デミング賞の生みの親でもあるエドワード・デミングが師事した物理学者であり、統計学者でもあったウォルター・アンドルー・シューハートは、データを理解するための原則として以下の2点を挙げています。

  1. データはその文脈から切り離すと無意味である。
  2. データにはシグナルとノイズが含まれている。情報を得るにはデータ内のシグナルとノイズの分離が必須である。

 ここで述べている文脈とは、データを採取する目的、データを採取した環境、データの測り方、測った機器といった情報だと考えてください。こういった付随情報から切り離されたデータは「単なる文字や数字」でしかない、というわけです。

photo 数字はその意味を含めてはじめて「データ」となります

 これをDMPの運用に置き換えて考えてみましょう。無意味とはあまりに大げさな表現ですが、ビジネスにつながる知見を得るという観点で、3rdPartyデータは、1stや2ndに比べて不利な点があるのは事実。なぜなら、どのような場で採取されているか開示していない場合があるためです。また、入手経路が明かされていないケースもあるので、シグナルなのかノイズ(雑音)なのかが識別できません。結果として「精度は良いの? 悪いの?」という議論につながることもあります。

 一方で、先ほどの図で示したように、1stや2ndと比べて量を確保できるというメリットを持っています。他にも1stPartyとして取得できないデータ、例えば、(自社の顧客ではなく)これから顧客になりそうな層のデータという観点では、3rdPartyデータの活用は欠かせません。

 あなたが「どんな仮説を証明したいか」に応じて必要なデータが決まるため、これら3種類のデータを一律に扱うことは確かに間違っていると考えられます。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ