連載
» 2007年10月09日 18時52分 公開

ロサンゼルスMBA留学日記:「教会が多いと犯罪が増える」の謎と、Lurking Variable

「去年より今年はPVが増えた。来年はもっと増えるはずだ」……統計データを出して説得されると、誰でも簡単に納得しがち。しかし本当に2つの事象に因果関係はあるのか? 2つの例で考えてみよう。

[新崎幸夫,Business Media 誠]

 MBAでは、統計の授業というのもある。統計的分析……というのは、使いこなせれば経営の有効なツールとなるが、ひとたび使い方を間違うとわけの分からない事態を引き起こすので、注意する必要がある。

 ある統計データを分析していた研究者がこう言った。「私は実に驚くべき発見をした!」何が驚くべき発見なのか、とたずねる同僚に対し、その研究者は自信満々で答える。「このデータを見てくれ。教会の多い地域ほど、犯罪件数が多い。つまり、教会は犯罪を誘発する存在だったのだ!」

 同僚が見たところ、確かに教会が多い地域に限って犯罪の件数が多いようだった。では、研究者の主張は正しいのだろうか?

答え:当然、そんなことはない

 教会が犯罪を誘発する存在とは、パッと聞いただけでも「?」と思わせられる主張だ。研究者の何が間違っていたのか。実は彼は重大な見落としをしている。

 教会が多い地域は、総じて人口も多かった。というより、人口が多いからこそ教会の需要も高く、たくさんの大聖堂が建てられることとなった。また、人口が多い地域には教会への寄付に熱心な金持ちが多く住んでおり、このためどうしてもスリ/こそ泥が多く集まるという結果を招いていた。これが犯罪件数の増加につながっていたわけだ。

 この研究者の話をうのみにして、犯罪件数を減らすべく教会を取り壊したらどうなるだろうか。――犯罪は減るだろうか? 多分、減らないだろう。この場合、犯罪の原因となっているのは人口が多いこと、およびそれに関連して金持ちの住人が多いことだからだ。教会の数と、犯罪件数の数の間には、相関関係(正の相関)があったかもしれないが、“原因と結果”の関係はなかった。

 これは統計の落とし穴だ。人は相関関係を見ると、ついついそれを原因と結果の関係として見てしまう。しかし実際は、隠れた「第3の要因」があって、それこそが2つの変数を動かす「本当の原因」だったということがある。この隠れた第3の要因のことを、Lurking Variableといったりする。

あるWebページ運営会社の場合――時間がたてばPVは伸びる?

 もうの例を見てみよう。あるWebページを運営する企業の社長が、各チャンネル(=ジャンル)ごとのPV(ページビュー)を時系列でプロットしたデータを作った。そして社員を集め、まじめな顔をして以下のようにハッパをかけた。

 「このチャンネルは2005年から2006年にかけてこんな割合でPVが伸びている。だから2007年にはPVはこのぐらいになるはずだ」。同時に、このデータを編集部で実際に働いている各編集者に伝え、「07年のPVは『統計的に見て』このぐらいになるはずだし、それを上回る実績を出すように頑張るように」と伝えた。

 経営陣の主張は正しいだろうか?

 こちらの答えも、当然ながら全く正しくない。

 教会の例で見たように、2つのデータを比べて、なんとなく相関があるかないかというのは、実は誰でも調べられることだ。しかしあるチャンネルに関して、時間が経過するほどPVが伸びているという単純な相関を見つけて「時間がたつと、PVって伸びるんだ」と考えるのは、ちょっと短絡的にすぎる。時間がたつことと、PVが伸びることに、直接的な「因果関係」はないからだ。

 実際には、隠れた第3の要因――Lurking Variableが存在する可能性がある。つまり時間がたつと同時に編集部の記者の熟練度が上がっていたとか、関わるライターの数が増えていたとか、その編集部がカバーする業界が盛り上がっていったとか、その編集部が掲載する記事の内容が「ニュースリリースベース中心」から「レビュー中心」になって読み応えがあるものになったとか、そういう点だ。

 そうすると、時間がたてばPVは伸びるだろう……と考えるのでなく、「記者の熟練度を上げればPVが上がるのでは?」とか「ライターの数を増やすといいのではないか」とか、「レビュー記事の数をもっと増やすとPVはどうなるのだろう」とか、そういう方向で議論をすべきだということになる。そして、これらを試行錯誤した末に、原因と結果を突き止めていく、というのが比較的正しいプロセスだろう。

 しかし実際には得てして、その編集部がカバーする業界が盛り上がりに欠けるためにPVが下降し、「時間がたったのにPVが伸びていない、これは編集部の能力が低いためだ」というような結論を下されて、編集部員の給料が下がる、もしくは据え置きになる、というようなことが起こり得る。

大事なのは“何を読み取るか”というセンス

 今回挙げたケースは、2つとも架空の例だ。しかし、こういった“統計の使い方を間違えた例”は、現実世界にもごまんとある。

 統計というのは、なまじデータを分析するだけに「ほら見ろ、数字からも明らかだ」というような説得に使われることが多い。しかし、経営に必要なものは数字いじりではなく、その数字やデータから何を読み取るかというセンスである。あれこれ数字をいじりまわして、ある日突然「犯罪件数を下げるために教会を潰すぞ!」と言われたら、現場の人間にとっては悲劇以外の何物でもない。

 MBAの授業を受けていると、「分析ツールの使い方に習得しても、その使い方を間違っては何の意味もない」と思うことがよくある。自戒の意味をこめて、そうした間違いを犯さないように注意したい。

関連キーワード

経営


Copyright © ITmedia, Inc. All Rights Reserved.

アクセスランキング
  • 本日
  • 週間