ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

人工知能を“正しく”疑え データサイエンティストがNHK「AIに聞いてみた」の違和感を探る(3/3 ページ)

» 2018年10月19日 07時00分 公開
[松本健太郎ITmedia]
前のページへ 1|2|3       

 それを調べるために番組は、防犯ボランティア団体数全国1位で、犯罪認知件数が04年のピークから17年には3分の1まで減少した埼玉県(男性の健康寿命は13年12位から16年2位にジャンプアップ)に実地調査に向かいます。

 そこで、先ほどと同じように1つの県だけに目を向けるのではなく、全体に目を向けてみましょう。

 都道府県別に13年から16年にかけて延びた男性の健康寿命の割合と、13年から16年にかけて伸びた犯罪認知件数の割合(警察白書)で散布図を作成しました。結果は以下の通りです。

NHK 縦軸は2013年から2016年にかけての男性の健康寿命の延び、横軸は2013年から2016年にかけて犯罪認知件数の伸び(関連リンク

 相関係数は0.17と無相関です。そもそも犯罪認知件数は年を経て減少傾向にあり、07年から16年の10年間で全国的に47.82ポイント減っています。ちなみに埼玉県は45.07ポイントと全国平均以下、最も減少率が低いのは39.89%で山梨県でした。

 もしかしたら、治安の回復と共に多少のタイムラグがあって健康寿命に効き目が現れるのかもしれません。そこで、延びた健康寿命の割合はそのままに、10年から13年にかけて伸びた犯罪認知件数の割合も見てみました。結果、相関係数は−0.05と変わりませんでした。

 もちろん、先ほどと同じようにこれらの結果だけで「治安の改善とPPKは関係ない!」と言うつもりはありません。例えば犯罪認知件数は発生件数と同義ではないからです。通報されていない、認知されていない犯罪があって、何とはなしに「治安の悪さ」のようなものを感じている人が中にはいるかもしれません。

 しかし、番組が埼玉県に出向いて「治安がPPKルートに良い影響を及ぼしたのでは?」とまとめるのは、これらのデータをもとに否定されるべきかと思います。

検証、スタンスへの疑問 「残り4回」はどうなるか

 データサイエンスに詳しい東京大学の坂田一郎教授に「関連性のある多くの項目に双方向の関係性がある」とまで言わせた今回のテーマですが、じっくり検証してみると、そもそもの相関関係すら疑ってかかるべきではないかとすら思いました。きちんと検証するという点においては、みんなの持ち寄った仮説を検証するバラエティー番組「水曜日のダウンタウン」にすら負けているといえるかもしれません。

 「読書をすれば健康寿命が延びるのではなく、健康寿命が長い人は健康だから読書する元気もあるのだろう」という声もあるようです。

 ですがそれ以前に、まずはデータでせめて相関関係ぐらいは示してほしいと思います。今回の放送は、片方に起因してもう片方が影響を受けているように見せていることが問題なのではありません。

 そもそも相関すらないデータを持ち出して、「山梨で真実を見た!」「埼玉にヒントがある!」とも捉えられかねない論調になっていたことが問題なのです。制作陣は相関の意味を理解しているのかと考えると、ゾッとしました。

 41万人の標本で相関関係を示すだけでなく、彼らに影響を与えている可能性がある外部要因が何か、オープンデータなどを用いてもう少し客観性を持たせないと、「本人の主観では」というツッコミで議論が終わってしまいます。反証しようがありません。

 番組はそろそろ「AIが人間も思い浮かばなかった意外な提言!」というスタンスを止めた方が良いのではないでしょうか。「理由は分からないけどデータではそうなっている」では信ぴょう性に欠け、少なくともマツコさんが望むような国の指針には遠く及ばないでしょう。

 番組は全7回構成だという報道もあります。今からでも遅くありません。「『原因と結果』の経済学」を書かれた慶應義塾大学の中室牧子准教授や、「データ分析の力 因果関係に迫る思考法」を書かれたシカゴ大学の伊藤公一朗助教授など、因果推論を研究された学者さんの力を借りるべきと考えます。

 果たして「AIに聞いてみた どうすんのよ!? ニッポン」は、「※諸説あります」で片付けるバラエティー番組なのでしょうか。それとも事実の裏付けをトコトン行う教養番組なのでしょうか。私は後者だと信じています。

 だからこそちゃんとやってくれと思いますし、せめて「言っている内容は分かるけど、こういう反証をしたい!」という発展的な議論を繰り広げたいものです。そのためにも、「データサイエンス界隈は次回もしっかりウォッチしようではありませんか」と呼びかけたいと思います。

著者プロフィール:松本健太郎

株式会社デコム R&D部門マネージャー。 セイバーメトリクスなどのスポーツ分析は評判が高く、NHKに出演した経験もある。他にも政治、経済、文化などさまざまなデータをデジタル化し、分析・予測することを得意とする。 本業はインサイトを発見するためのデータアナリティクス手法を開発すること。

著者連絡先はこちら→kentaro.matsumoto@decom.org


著者より単行本発売のお知らせ

今最も注目を集めるデータサイエンティストの1人が、データの読み方に注目して「うそを見抜く技術」を解説します。世論調査の結果はなぜ各社異なるのか? アベノミクスによって景気は良くなったのか? 人手不足なのにどうして給料は増えないのか? 「最近の若者は……」論の誤り、本当に地球は温暖化しているのか? などなど。

新時代の教養「データサイエンス」の入門書として、数学が苦手な人、統計学に挫折した人にも分かりやすい一冊に仕上がりました。詳細はこちらから。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.