ITmedia NEWS > ネットの話題 >
ITmedia AI+ AI活用のいまが分かる

NHK「AIに聞いてみた」の違和感 これって本当にAI? データ分析の専門家が解説(2/3 ページ)

» 2018年03月07日 09時00分 公開
[松本健太郎ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

「表現のまずさ」 違和感の正体は

 既にTwitterでは、AIひろしの提言に対して「それは違う」というツッコミが一部で繰り広げられています。AIだからという前提に立ったとしても、経験3年目のデータサイエンティストが提出したレポートより質が悪い内容に、頭を抱えた人が多いようです。

 私からも3点指摘をさせてください。

そこに因果関係はあるのか

 1点目。恐らく決定木分析が使われているであろう、約21万人分の個人データを収集・分析した「ワーク・ライフ・ダイアグラム」で、「蛇口を閉めると仕事の満足度が上がる」など、断定的な口調で因果関係を示した点です。

AI 「ワーク・ライフ・ダイアグラム」(公式サイト

 そもそも決定木分析とは、説明変数をある基準(今回なら仕事の満足度)に従って分割していき、分類結果に影響を与えた要因を明らかにする手法です。有名なのはタイタニック分析です。約2200人が乗船したタイタニック号の生存・死亡データは沈没後に整理して公開されており、その内容はデータ投稿プラットフォーム「Kaggle」でも確認できます。

 決定木分析を行えば、説明変数の属性(年齢、性別、乗船クラスなど)による違いで、生存/死亡の傾向の違いが分かります。ちなみにタイタニックのデータを分析すると、まず性別によって、生存したか否かが分岐するのは有名です。

 今回新たにAIひろしに追加した、三菱総合研究所の「生活者市場予測システム」は、生活者3万人を対象としたデモグラフィック属性を含む膨大なパネルデータが含まれます。そのデモグラフィック属性を説明変数に、仕事の満足度が高い/低いグループに分割したと思われます。

新たなデータ AIが新たに学習したデータ(公式サイト

 しかし、このようなデモグラフィック属性を用いた手法はマーケティング界では「なるべく避ける」アプローチです。なぜなら、そのデモグラフィック属性自体が満足度向上に直接的に関係しているわけではないからです。

 最も激しく批判している1人が、著書「イノベーションのジレンマ」でおなじみのクレイトン・クリステンセン教授です。教授の最新刊「ジョブ理論」では、「新聞を買うという行動を私に選択させたのは、年齢、身長、靴のサイズ、居住地、乗っているクルマという特徴のせいではない」と述べた上で「相関はあっても因果はない、直接的な関係はない」「私がなぜある特定の商品を買うのかという因果関係を明らかにはしてくれない」と述べています。

 一方でAIひろしは「お金にゆとりがなくても、蛇口を小まめに閉めなければ仕事に満足できる!?」と、蛇口を閉めない癖が満足度に因果があるかのように提案しています。クリステンセン教授の声に、番組制作陣は真摯に向き合うべきではないでしょうか。

母数は何人?

 次に、N数が分からない点です。「仕事の効率」でロボットベンチャーのGROOVE Xが紹介された際には、おおよその社員数をナレーターが述べたので分かりましたが、ワーク・ライフ・ダイアグラムでは各分析における母数が何人か分からないので、「蛇口」提案がどれだけすごい発見なのかが分からないのです。

 「蛇口を小まめに閉めない人」全般にいえることなのでしょうか、それともお金にゆとりがなくて、結婚・出産祝は贈らなくて、諦めない性格で……という、11個のデモグラ属性に合致する人にいえることなのでしょうか。

仕事 「仕事満足率」に重要な8大要素(公式サイト

 もし後者ならば「お金にゆとりがなくても、蛇口を小まめに閉めなければ仕事に満足できる!?」という提案は、部分的事象を全体に広げて適用する、やってはいけない分析の典型例ではないでしょうか。

 満足度に関しても、Yes/Noの2項選択なのか、1〜10の10段階評価なのか、それによって仕事満足率81%の捉え方は異なります。分類されたグループに所属する81%の人間が仕事に満足しているのか、分類されたグループに所属する人は仕事に81%ぐらいの満足度があるのか、疑問は尽きません。

 もし私がこれらの情報を見逃しているのであれば申し訳ないのですが、番組の途中から混乱さえしてきました。

Copyright © ITmedia, Inc. All Rights Reserved.