ITmedia NEWS > ネットの話題 >
ITmedia AI+ AI活用のいまが分かる

AIを使うには“疑う力”が欠かせない データサイエンティストがNHK「AIに聞いてみた」に望むこと(3/3 ページ)

» 2019年04月18日 07時00分 公開
[松本健太郎ITmedia]
前のページへ 1|2|3       

 パネル内容はこちらのURLに記載があり、20〜69歳の生活者3万人の2011年〜2018年までの定点データだと考えられます。「性・年代別・地域別インターネット利用人口の構成比に合わせて割り付けします」とありますから、標本数3万人と考えると十分すぎるデータだといえるでしょう。

 結婚ネットワークは、回答から1年後に結婚・破局した人が対象になります。仮に、この8年間回答者の変更が無いと仮定しましょう。厚労省の「平成30年(2018)人口動態統計の年間推計」を参考にすると、2012年以降の7年間で、のべ約885万人が結婚しています。20〜69歳の人口は7989万人ですから約10%だと考えられます。

 この比率を標本にあたる3万人にかけ合わせると約3000人が該当します。結婚ネットワークは男女に分かれるので約1500人。全国を網羅するには少ないような気がします。

 こういう場合、新たにデータを追加するなどの対策が求められます。その意味においては、番組後半で婚活先進国である愛媛県のデータ(公式サイトによると「約200問に回答した4万人のお見合いデータ」)を用いて分かった「カップル成立を最も左右する要素は、趣味がファッションにならない」という仮説を検証するために、データを1から計測するという実験は非常に良い試みだと感じました。

 具体的には街コンに参加したメンバーに、来ている服装が分からないように全身を覆い隠す黒いマントを着てもらい、ファッション要素が影響を与えないようにするという実験です。

 番組では、これまでのマッチング率の平均29%に対して、全員の服装を隠して街コンをした結果、マッチング率が14人中6人(43%)という結果が出ました。1組減ったら28%だからほぼ誤差の範囲内じゃないかとも思いましたが、それでも検証と実験に取り組むこと自体に意義があると感じました。

AIをご神託で終わらせないために

 「説Aを立証したいときに、説Aに反するデータを見つけ出す」というのが、データ分析でよくある思考法です。今回は番組前半の「不健康と婚姻率」に目を向け、沖縄県のような結果が該当しない都道府県がどれくらいあるのかを見てみました。

 番組は残り数回の放映が残されているようなので、今後はAIではなくデータ分析やロジカル・シンキングの専門家を増やすとよいのではないかと思いました。データサイエンティストから見て「相関と因果」について気になる点が残ってしまうのは、課題設定や仮説検証の方法に問題があるからではないでしょうか。

 恐らく「AIがこう言っているから、それに合うようなデータを探そう」というスタンスよりも「AIがこう言っているけど、それを反証するようなデータはないかな?」というスタンスの方が、検証の幅が広がるのではないでしょうか。

 もしAIが「人間も思いつかない数百万通りの仮説提言をしてくれる機械」なら、そうしたスタンスがAIをご神託にさせない有効な一手のような気がします。

著者プロフィール:松本健太郎

株式会社デコム R&D部門マネージャー。 セイバーメトリクスなどのスポーツ分析は評判が高く、NHKに出演した経験もある。他にも政治、経済、文化などさまざまなデータをデジタル化し、分析・予測することを得意とする。 本業はインサイトを発見するためのデータアナリティクス手法を開発すること。

著者連絡先はこちら→kentaro.matsumoto@decom.org


著者より単行本発売のお知らせ

今最も注目を集めるデータサイエンティストの1人が、データの読み方に注目して「うそを見抜く技術」を解説します。世論調査の結果はなぜ各社異なるのか? アベノミクスによって景気は良くなったのか? 人手不足なのにどうして給料は増えないのか? 「最近の若者は……」論の誤り、本当に地球は温暖化しているのか? などなど。

新時代の教養「データサイエンス」の入門書として、数学が苦手な人、統計学に挫折した人にも分かりやすい一冊に仕上がりました。詳細はこちらから。

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.