Special
» 2021年12月15日 10時00分 公開

誰でも使えるデータサイエンスツールで“初めの一歩”を踏み出せ――「統計学が最強の学問である」著者が語るデータ活用のススメ方【後編】

データ活用を始めたいが考え方やツールが分からない――こんな悩みに、ベストセラー書籍「統計学が最強の学問である」の著者である西内啓氏が答えます。登場したのは、データサイエンティストの仕事の8割を自動化するツールでした。日本のDXについて語る特別対談の後編です。

[PR/ITmedia]
PR

 企業のDX(デジタルトランスフォーメーション)やデータ活用を推進することで、業績拡大や企業価値の向上を狙う動きが活発になっています。しかし、いざ取り組みを始めようとしたものの、「考え方が分からない」「どのツールを使えばいいのか分からない」――こんな悩みで“初めの一歩”が踏み出せない人も多いでしょう。

 そんな人に向けた特別対談を2回に分けてお届けしています。前編では、ベストセラーになったビジネス書「統計学が最強の学問である」の著者である西内啓氏と、企業のAI活用を支援する取り組みを進めるデル・テクノロジーズの執行役員を務める上原宏氏(データセンター・ソリューションズ事業統括 製品本部長)が日本のDX推進の現状について語りました。

 後編では、誰もがデータ分析できる社会を目指す西内氏自ら開発した専用ツール「dataDiver」(データダイバー)の紹介を通して、DXやデータ活用の考え方を深堀りしていきます。

photo
photo

西内啓(にしうち ひろむ)

データビークル 取締役副社長CPO

東京大学医学部を卒業。医療コミュニケーション学分野の助教授や大学病院医療情報ネットワーク研究センター副センター長などを経て、現在は多くの企業のデータ分析および分析人材の育成に携わる。著書「統計学が最強の学問である」はビジネス書大賞2014で大賞を受賞。他執筆多数。

photo

上原宏(うえはら ひろし)

デル・テクノロジーズ 執行役員 データセンター・ソリューションズ事業統括 製品本部長

同志社大学法学部を卒業。セイコーエプソンで欧州統括本社などに駐在。その後、コンパックコンピュータ、日本ヒューレット・パッカード、EMCジャパンなどでエンタープライズ製品関連のマーケティング統括などを歴任。2016年からデル・テクノロジーズにてサーバの製品本部を率いる。

データサイエンティストの仕事の8割を自動化 「dataDiver」の“強み”

上原 データサイエンティストの仕事の約8割を自動化してしまうデータビークルのデータ分析ツール「dataDiver」は「Dell de AIハンドブック」でも紹介されているソリューションです。dataDiverが企業にもたらす価値や、他のビジネスインテリジェンス(BI)ツールとの差別化ポイントはどういった点でしょうか?

西内 dataDiverの大きなアドバンテージは、「診断的分析」と「予測的分析」というデータ分析をデータサイエンティストがいなくても実行できるよう、分析に伴うさまざまなプロセスをツール上で自動化している点です。

 IT分野の調査や助言を行うガートナーはデータ分析の特徴に「記述的分析」「予測的分析」「診断的分析」といったものを挙げています。

 「記述的分析」は過去に何があったのか正確に把握しましょう、というものです。これはBIツールのすごく便利な点で、「昨日のことが今日分かる」「午前中のことが午後に分かる」といったことが普通にできるようになってきており、多くの企業はすでにこうしたBIツールの恩恵にあずかっています。

 「予測的分析」では機械学習技術を応用しようという技術も着々と世の中に普及してきました。この分野のツールは世界中でいろいろなところが提供していて、例えば故障の検知や、生産計画の予測を立てる場面で活用を進めています。

 「診断的分析」は、AIでなくまだまだ人間がやらなければならないと考えています。データから「なぜこうなったのか」を考えるのはややこしい話で、やはり機械任せでできるものではありません。人間が持っている背景知識をデータに対して適切に解釈する行為があって初めて「なぜこうなったのか」の理由が分かってくるのですが、それをやるのはかなり難しい仕事です。

 診断的分析を行うツールとしては、私が大学教員時代に教えていた「SAS」(Statistical Analysis System)などがあります。専門家にとっては便利なツールですが、一般的なビジネスマンが簡単に扱えるほど使いやすいものではありません。

 従来、診断的分析はSASのような専門家向けのツールと専門的なデータサイエンティストによって行われていました。一方でデータ分析の専門家が必ずしも組織の事業について深く理解しているわけではないため、コミュニケーションギャップがあると高額の投資をしたのにデータ活用プロジェクトが非効率な結果に陥ることはしばしばあります。

 このように従来は専門家が専門ツールを使って行わなければならなかった予測的分析と診断的分析の作業を自動化したことが、われわれのdataDiverの強みです。

photo データビークル副社長 CPO の西内啓氏

データサイエンティストが必要なくなる? 「拡張アナリティクス」とは?

西内 dataDiverの製品ジャンルは「拡張アナリティクス」といわれるものです。人間の認知機能を拡張してデータに対するアクセシビリティー(利用しやすさ)を上げていくための分析ツールを「拡張アナリティクス」とガートナーが言い出しました。ガートナーがその言葉を作る前から、拡張アナリティクスの機能を持つ製品を作っていたのは、おそらく世界中でもデータビークルだけです。

 拡張アナリティクスを実現するためには、3つの条件があります。

  1. 分析用にたまったデータを加工するフェーズを自動化する必要があります。
  2. 何がどれぐらい大事かを人に分かりやすく伝える部分のインタフェースがすごく大事になります。
  3. 加工したデータの状態や関係性をどう解釈すればいいのか具体的に示すグラフを自動で作成することです。

 実はデータビークルは2014年から取り組んでいて、おそらくこの分野では世界的に見てもほとんどライバルがいない状態です。

 ガートナーはもし拡張アナリティクスのようなものがあれば、多くの状況でデータサイエンティストは必要なくなると言っています。ここでいう「多くの状況」はちょっとしたマーケティングの分析やセールスの分析、製品の分析のことです。こうした状況では、データサイエンティストに多くのお金を払って拘束するよりは、現場の背景知識がある人に対して分かりやすい分析ツールを与えた方がいいという意味です。逆に、クリエイティブな思考や高い専門性が必要な状況についてはきちんとデータサイエンティストがやるべきです。これはわれわれの感覚としても、すごく合っています。

 今データサイエンティストが足りない状態なら、データサイエンティストに全てのデータ活用を任せるのではなく、会社の中で最も大きな収益源となっている領域や、これからすごく成長していくイノベーティブな部分にこそデータサイエンティストの貴重なリソースを集中させて、そうではない領域についてはツールを使って現場の社員や管理職がやるべきだと考えます。

 マーケティングやセールス、商品開発、オペレーション改善などさまざまな領域では、現場の社員や管理職がExcelの集計だけで何とか意思決定している状態でしょう。何億円も投資するデータ活用プロジェクトと、「ただのExcelの集計」の間には大きなホワイトスペース(空白)が広がっており、ここをいかに埋めてデータドリブンに意思決定ができるかどうかが、企業としての収益性や生産性を大きく左右しているポイントだと思います。

 そして、dataDiverはおそらく世界で唯一のレベルでそのホワイトスペースを埋める目的にきちんとマッチするとても使いやすいツールであり、大きなアドバンテージだと考えています。

上原 今のExcelと数億円のプロジェクトの話はとても分かりやすい説明ですね。西内さん自身が、起業してコマースの世界に入ってきた背景にもマッチします。こうした背景を聞けば聞くほど、dataDiverの一つの大きな“売り”である高度な専門スキルがなくても使える点や、他にはない分析ツールである点は大きな強みだと感じました。

photo dataDiverの概要(データビークル提供)(クリックで拡大)

dataDiverで「データサイエンスプロジェクトの全てをワンストップに完結」を目指す

上原 dataDiverはすでに洗練されていますが、次の一手はどのようなものでしょうか?

西内 現在のdataDiverは診断的分析と予測的分析の双方を自動的に行えるようなツールですが、どちらかといえば診断的分析に重きをおいて、人間が分析結果を見たときに解釈しやすいものであるよう最大限配慮してきました。

 ただ、予測的分析の観点からすると、最終的には解釈のしやすさを多少犠牲にして複雑なことをやってでも、予測精度を上げるアルゴリズムを実行したいというニーズは存在しています。

 もちろん、dataDiverは「データサイエンティストの面倒な作業を自動化する」というコンセプトに基づき、さまざまな説明変数あるいは特徴量と呼ばれるものをデータから自動で生成する特徴を持っているので、解釈のしやすさを犠牲にしなくてもすでに多くの機械学習ツールより高精度な結果を出しているケースがたくさんあります。

 しかし、より高い予測精度を求めるユーザーのニーズを満たすため、AutoMLと呼ばれる自動で複雑な機械学習手法を適用して高精度な予測モデルを作る機能のオプションを、次のバージョンアップで実装予定です。

 dataDiverはすでにAI構築自動化ソリューションのジャンルでは、国内ツールの中でトップクラスの地位にあります。今のままでもデータを自動で加工でき、ユーザーの専門知識が必要なく、海外製品と比較しても使いやすいツールです。次のバージョンアップを実施することで、最後のアルゴリズムの精度に関しても向上します。そしてデータサイエンスプロジェクトの全てをdataDiverでワンストップに完結できるようになるというのが、次の一手です。

「説明が可能なAI付きの業務システム」を展開するパートナーシップ強化

西内 パートナーシップの拡大にも注力したいです。今までわれわれは基本的に直販メインで製品を提供してきました。しかし、ここまでツールが分りやすくなると、例えば業務システムを提供している会社にわれわれのエンジンを組み込むことで、いわゆる「分かりやすく、かつ、説明が可能なAI付きの業務システム」を構築することも可能になりました。

 具体例を挙げると、日本国内で保健所のシステムを展開している日本コンピュータというパートナーがいます。保健所内の多くのデータは日本コンピュータのシステムの中に入っているので、最近はそのデータを使って児童虐待を減らす取り組みをしています。児童虐待はなんとしても減らしたいですが、現状では保健所の限られたリソースで全員を手厚くケアするわけにもいきません。できれば虐待を受けるリスクの高い人たちに重点的なケアができればいいですが、そのリスクが偏見で決まるのはよくないです。データを活用して、きちんと説明可能な予測モデルに基づいて児童虐待リスクの予測をすることができれば、限られたリソースで児童虐待を減らすことができます。

 すでに北海道札幌市のシステムにデータビークルのエンジンを組み込んでいます。定期的に何かが発覚するたびに予測モデルを更新し、追加で新しくデータがインプットされた時にその予測モデルに当てはめることで、虐待が起きるリスクが小さいごく初期の段階で「この家庭はできるだけ重点的に目を配っておいてください」というリストを抽出できます。もし「なぜその家庭が対象なのか」を説明する必要があったとしても、「それはAIが言っているのでよく分からない」ではなく、「これとこれが大事なポイントで、そこに当てはまっているからです」と明言できます。将来的には、行政の政策目標として何を重点的に解決すべきか「気付き」が得られるかもしれません。

 また、保健所であれば、それこそ札幌市の保健師にツールを使ってもらうことでデータも集まりますし、皆さまが慣れ親しんだユーザーインタフェースも今まで通り使えます。そういうところにデータビークルのツールを組み込んでいただくことで「何かを事前に察知したい」「何かの理由を知りたい」などの要望に応えることができます。そして今このようなパートナーとの協業が着々と広がっています。

上原 「児童虐待」のキーワードが出ましたが、まさにSDGsの17の項目の中に福祉の項目があります。企業や自治体は今後、持続可能性の観点で多岐にわたる活動を実行しなければなりませんが、dataDiverは地方自治体を含む行政側が対策を立てるためのツールになると考えます。行政の取り組みは決して早くはなさそうですが、この仕組みを取り入れることで一足飛びに持続可能性の達成に寄与できるようになるのは素晴らしいことだと思います。保健所の例もありましたが、データアナリティクスに無縁の人たちが、専門の知識がなくともデータアナリティクスを活用できるようになれば、dataDiverの裾野もますます広がりそうです。

photo デル・テクノロジーズ 執行役員の上原宏氏(データセンター・ソリューションズ事業統括 製品本部長)

西内氏は、データサイエンスを身近なものにしていく

上原 それでは最後に、今後の西内さんのビジョンをお聞かせください。

西内 拡張アナリティクスという言葉を紹介しましたが、これからさらに広い概念として「市民データサイエンス」が広がるとガートナーは言っています。これは専門家ではない人たちがデータサイエンスを使いこなして、自身の意思決定をより良いものにして生産性の向上を目指すものです。これを実現するためには誰でも使えるツールだけでなく、それを使いこなす「マインドセット」(考え方)がユーザー側にも必要になります。

 われわれは、プログラムを書くことなくデータサイエンティストの仕事ができるというマインドセットを育成するノウハウも培ってきたので、さまざまな企業の人にデータサイエンスを使いこなすマインドセットを浸透させていきたいです。そのため最近では短期間のオンライン講座で一気に「プログラミング以外のデータサイエンティストのスキル」を集中的に学べる機会も提供を始めていて、大きな反響があります。ぜひ読者の皆さまにも受講をご検討いただければと思います。

上原 「市民データサイエンス」の考え方はとても良いですね。統計学、データサイエンティストという言葉が持つちょっと難しそうなイメージを取り除き、ハードルを下げてもう少し身近なものにすることが西内さんのお考えだ、ということでしょうか?

西内 はい、その通りです。

上原 貴重なお話をありがとうございました。

Dell de AIハンドブック

ビジネスへのAI導入を阻むハードル、8社に学ぶ製品選定や運用改善の課題解決法

DXに伴いAI活用が進む一方、導入に当たっては企画から開発まで最適な製品やサービスを選定する必要があり、導入後も運用改善を定常的に実施せねばならず、ハードルは低くない。これらを解決する、先進AIパートナー企業8社の取り組みとは?


この記事はデル・テクノロジーズから提供された原稿を、ITmedia NEWS編集部で一部編集したものです。


関連リンク


関連記事

AI導入の“お悩み”解決へ デル・テクノロジーズの専門施設「AI Experience Zone」で体験してみませんか

経験や勘に頼るデータ分析、AIに任せてみては? 化粧品の開発現場で進む効率化――人は“頭を使う仕事”に専念

企業のDXはここから巻き返せ!――「統計学が最強の学問である」著者が語るデータ活用のススメ方【前編】

「紙の文書をPDF化」では不十分――AIで設計図面をデータ化 建設業界の先駆者が挑むデジタル化

これは、私が夢で見た「人間とAIの未来」の“ちょっと不思議”なお話


Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル・テクノロジーズ株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2022年1月10日

Dell de AIハンドブック

DXに伴いAI活用が進む一方、導入に当たっては企画から開発まで最適な製品やサービスを選定する必要があり、導入後も運用改善を定常的に実施せねばならず、ハードルは低くない。これらを解決する、先進AIパートナー企業8社の取り組みとは?

Dell de AIポータルサイト