データ分析にAIを使うメリットを解説 “データサイエンティストいらず”の専用ツールを活用事例と一緒に紹介

データ活用を始めたいが考え方やツールが分からない――こんな悩みに、ベストセラー書籍「統計学が最強の学問である」の著者である西内啓氏が答えます。登場したのは、データサイエンティストの仕事の8割を自動化するツールでした。日本のDXについて語る特別対談の後編です。

» 2021年12月15日 10時00分 公開
[PR/ITmedia]
PR

 企業のDX(デジタルトランスフォーメーション)やデータ活用を推進することで、業績拡大や企業価値の向上を狙う動きが活発になっています。しかし、いざ取り組みを始めようとしたものの、「考え方が分からない」「どのツールを使えばいいのか分からない」――こんな悩みで“初めの一歩”が踏み出せない人も多いでしょう。

 そんな人に向けた特別対談を2回に分けてお届けしています。前編では、ベストセラーになったビジネス書「統計学が最強の学問である」の著者である西内啓氏と、企業のAI活用を支援する取り組みを進めるデル・テクノロジーズの執行役員を務める上原宏氏(データセンター・ソリューションズ事業統括 製品本部長)が日本のDX推進の現状について語りました。

 後編では、誰もがデータ分析できる社会を目指す西内氏自ら開発した専用ツール「dataDiver」(データダイバー)の紹介を通して、DXやデータ活用の考え方を深堀りしていきます。

photo
photo

西内啓(にしうち ひろむ)

データビークル 取締役副社長CPO

東京大学医学部を卒業。医療コミュニケーション学分野の助教授や大学病院医療情報ネットワーク研究センター副センター長などを経て、現在は多くの企業のデータ分析および分析人材の育成に携わる。著書「統計学が最強の学問である」はビジネス書大賞2014で大賞を受賞。他執筆多数。

photo

上原宏(うえはら ひろし)

デル・テクノロジーズ 執行役員 データセンター・ソリューションズ事業統括 製品本部長

同志社大学法学部を卒業。セイコーエプソンで欧州統括本社などに駐在。その後、コンパックコンピュータ、日本ヒューレット・パッカード、EMCジャパンなどでエンタープライズ製品関連のマーケティング統括などを歴任。2016年からデル・テクノロジーズにてサーバの製品本部を率いる。

データ分析の「診断的分析」「予測的分析」を自動化
西内啓氏が開発した「dataDiver」の特長

上原 データサイエンティストの仕事の約8割を自動化してしまうデータビークルのデータ分析ツール「dataDiver」は「Dell de AIハンドブック」でも紹介されているソリューションです。dataDiverが企業にもたらす価値や、他のビジネスインテリジェンス(BI)ツールとの差別化ポイントはどういった点でしょうか?

西内 dataDiverの大きなアドバンテージは、「診断的分析」と「予測的分析」というデータ分析をデータサイエンティストがいなくても実行できるよう、分析に伴うさまざまなプロセスをツール上で自動化している点です。

 IT分野の調査や助言を行うガートナーはデータ分析の特徴に「記述的分析」「予測的分析」「診断的分析」といったものを挙げています。

 「記述的分析」は過去に何があったのか正確に把握しましょう、というものです。これはBIツールのすごく便利な点で、「昨日のことが今日分かる」「午前中のことが午後に分かる」といったことが普通にできるようになってきており、多くの企業はすでにこうしたBIツールの恩恵にあずかっています。

 「予測的分析」では機械学習技術を応用しようという技術も着々と世の中に普及してきました。この分野のツールは世界中でいろいろなところが提供していて、例えば故障の検知や、生産計画の予測を立てる場面で活用を進めています。

 「診断的分析」は、AIでなくまだまだ人間がやらなければならないと考えています。データから「なぜこうなったのか」を考えるのはややこしい話で、やはり機械任せでできるものではありません。人間が持っている背景知識をデータに対して適切に解釈する行為があって初めて「なぜこうなったのか」の理由が分かってくるのですが、それをやるのはかなり難しい仕事です。

 診断的分析を行うツールとしては、私が大学教員時代に教えていた「SAS」(Statistical Analysis System)などがあります。専門家にとっては便利なツールですが、一般的なビジネスマンが簡単に扱えるほど使いやすいものではありません。

 従来、診断的分析はSASのような専門家向けのツールと専門的なデータサイエンティストによって行われていました。一方でデータ分析の専門家が必ずしも組織の事業について深く理解しているわけではないため、コミュニケーションギャップがあると高額の投資をしたのにデータ活用プロジェクトが非効率な結果に陥ることはしばしばあります。

 このように従来は専門家が専門ツールを使って行わなければならなかった予測的分析と診断的分析の作業を自動化したことが、われわれのdataDiverの強みです。

photo データビークル副社長 CPO の西内啓氏

データサイエンティストが必要なくなる? 「拡張アナリティクス」とは?

西内 dataDiverの製品ジャンルは「拡張アナリティクス」といわれるものです。人間の認知機能を拡張してデータに対するアクセシビリティー(利用しやすさ)を上げていくための分析ツールを「拡張アナリティクス」とガートナーが言い出しました。ガートナーがその言葉を作る前から、拡張アナリティクスの機能を持つ製品を作っていたのは、おそらく世界中でもデータビークルだけです。

 拡張アナリティクスを実現するためには、3つの条件があります。

  1. 分析用にたまったデータを加工するフェーズを自動化する必要があります。
  2. 何がどれぐらい大事かを人に分かりやすく伝える部分のインタフェースがすごく大事になります。
  3. 加工したデータの状態や関係性をどう解釈すればいいのか具体的に示すグラフを自動で作成することです。

 実はデータビークルは2014年から取り組んでいて、おそらくこの分野では世界的に見てもほとんどライバルがいない状態です。

 ガートナーはもし拡張アナリティクスのようなものがあれば、多くの状況でデータサイエンティストは必要なくなると言っています。ここでいう「多くの状況」はちょっとしたマーケティングの分析やセールスの分析、製品の分析のことです。こうした状況では、データサイエンティストに多くのお金を払って拘束するよりは、現場の背景知識がある人に対して分かりやすい分析ツールを与えた方がいいという意味です。逆に、クリエイティブな思考や高い専門性が必要な状況についてはきちんとデータサイエンティストがやるべきです。これはわれわれの感覚としても、すごく合っています。

 今データサイエンティストが足りない状態なら、データサイエンティストに全てのデータ活用を任せるのではなく、会社の中で最も大きな収益源となっている領域や、これからすごく成長していくイノベーティブな部分にこそデータサイエンティストの貴重なリソースを集中させて、そうではない領域についてはツールを使って現場の社員や管理職がやるべきだと考えます。

 マーケティングやセールス、商品開発、オペレーション改善などさまざまな領域では、現場の社員や管理職がExcelの集計だけで何とか意思決定している状態でしょう。何億円も投資するデータ活用プロジェクトと、「ただのExcelの集計」の間には大きなホワイトスペース(空白)が広がっており、ここをいかに埋めてデータドリブンに意思決定ができるかどうかが、企業としての収益性や生産性を大きく左右しているポイントだと思います。

 そして、dataDiverはおそらく世界で唯一のレベルでそのホワイトスペースを埋める目的にきちんとマッチするとても使いやすいツールであり、大きなアドバンテージだと考えています。

上原 今のExcelと数億円のプロジェクトの話はとても分かりやすい説明ですね。西内さん自身が、起業してコマースの世界に入ってきた背景にもマッチします。こうした背景を聞けば聞くほど、dataDiverの一つの大きな“売り”である高度な専門スキルがなくても使える点や、他にはない分析ツールである点は大きな強みだと感じました。

photo dataDiverの概要(データビークル提供)(クリックで拡大)

AutoML実装、予測精度向上――dataDiverの次なる一手

上原 dataDiverはすでに洗練されていますが、次の一手はどのようなものでしょうか?

西内 現在のdataDiverは診断的分析と予測的分析の双方を自動的に行えるようなツールですが、どちらかといえば診断的分析に重きをおいて、人間が分析結果を見たときに解釈しやすいものであるよう最大限配慮してきました。

 ただ、予測的分析の観点からすると、最終的には解釈のしやすさを多少犠牲にして複雑なことをやってでも、予測精度を上げるアルゴリズムを実行したいというニーズは存在しています。

 もちろん、dataDiverは「データサイエンティストの面倒な作業を自動化する」というコンセプトに基づき、さまざまな説明変数あるいは特徴量と呼ばれるものをデータから自動で生成する特徴を持っているので、解釈のしやすさを犠牲にしなくてもすでに多くの機械学習ツールより高精度な結果を出しているケースがたくさんあります。

 しかし、より高い予測精度を求めるユーザーのニーズを満たすため、AutoMLと呼ばれる自動で複雑な機械学習手法を適用して高精度な予測モデルを作る機能のオプションを、次のバージョンアップで実装予定です。

 dataDiverはすでにAI構築自動化ソリューションのジャンルでは、国内ツールの中でトップクラスの地位にあります。今のままでもデータを自動で加工でき、ユーザーの専門知識が必要なく、海外製品と比較しても使いやすいツールです。次のバージョンアップを実施することで、最後のアルゴリズムの精度に関しても向上します。そしてデータサイエンスプロジェクトの全てをdataDiverでワンストップに完結できるようになるというのが、次の一手です。

「説明が可能なAI」を活用 地方自治体も導入

西内 パートナーシップの拡大にも注力したいです。今までわれわれは基本的に直販メインで製品を提供してきました。しかし、ここまでツールが分りやすくなると、例えば業務システムを提供している会社にわれわれのエンジンを組み込むことで、いわゆる「分かりやすく、かつ、説明が可能なAI付きの業務システム」を構築することも可能になりました。

 具体例を挙げると、日本国内で保健所のシステムを展開している日本コンピュータというパートナーがいます。保健所内の多くのデータは日本コンピュータのシステムの中に入っているので、最近はそのデータを使って児童虐待を減らす取り組みをしています。児童虐待はなんとしても減らしたいですが、現状では保健所の限られたリソースで全員を手厚くケアするわけにもいきません。できれば虐待を受けるリスクの高い人たちに重点的なケアができればいいですが、そのリスクが偏見で決まるのはよくないです。データを活用して、きちんと説明可能な予測モデルに基づいて児童虐待リスクの予測をすることができれば、限られたリソースで児童虐待を減らすことができます。

 すでに北海道札幌市のシステムにデータビークルのエンジンを組み込んでいます。定期的に何かが発覚するたびに予測モデルを更新し、追加で新しくデータがインプットされた時にその予測モデルに当てはめることで、虐待が起きるリスクが小さいごく初期の段階で「この家庭はできるだけ重点的に目を配っておいてください」というリストを抽出できます。もし「なぜその家庭が対象なのか」を説明する必要があったとしても、「それはAIが言っているのでよく分からない」ではなく、「これとこれが大事なポイントで、そこに当てはまっているからです」と明言できます。将来的には、行政の政策目標として何を重点的に解決すべきか「気付き」が得られるかもしれません。

 また、保健所であれば、それこそ札幌市の保健師にツールを使ってもらうことでデータも集まりますし、皆さまが慣れ親しんだユーザーインタフェースも今まで通り使えます。そういうところにデータビークルのツールを組み込んでいただくことで「何かを事前に察知したい」「何かの理由を知りたい」などの要望に応えることができます。そして今このようなパートナーとの協業が着々と広がっています。

上原 「児童虐待」のキーワードが出ましたが、まさにSDGsの17の項目の中に福祉の項目があります。企業や自治体は今後、持続可能性の観点で多岐にわたる活動を実行しなければなりませんが、dataDiverは地方自治体を含む行政側が対策を立てるためのツールになると考えます。行政の取り組みは決して早くはなさそうですが、この仕組みを取り入れることで一足飛びに持続可能性の達成に寄与できるようになるのは素晴らしいことだと思います。保健所の例もありましたが、データアナリティクスに無縁の人たちが、専門の知識がなくともデータアナリティクスを活用できるようになれば、dataDiverの裾野もますます広がりそうです。

photo デル・テクノロジーズ 執行役員の上原宏氏(データセンター・ソリューションズ事業統括 製品本部長)

拡張アナリティクスの先、「市民データサイエンス」を広めていく

上原 それでは最後に、今後の西内さんのビジョンをお聞かせください。

西内 拡張アナリティクスという言葉を紹介しましたが、これからさらに広い概念として「市民データサイエンス」が広がるとガートナーは言っています。これは専門家ではない人たちがデータサイエンスを使いこなして、自身の意思決定をより良いものにして生産性の向上を目指すものです。これを実現するためには誰でも使えるツールだけでなく、それを使いこなす「マインドセット」(考え方)がユーザー側にも必要になります。

 われわれは、プログラムを書くことなくデータサイエンティストの仕事ができるというマインドセットを育成するノウハウも培ってきたので、さまざまな企業の人にデータサイエンスを使いこなすマインドセットを浸透させていきたいです。そのため最近では短期間のオンライン講座で一気に「プログラミング以外のデータサイエンティストのスキル」を集中的に学べる機会も提供を始めていて、大きな反響があります。ぜひ読者の皆さまにも受講をご検討いただければと思います。

上原 「市民データサイエンス」の考え方はとても良いですね。統計学、データサイエンティストという言葉が持つちょっと難しそうなイメージを取り除き、ハードルを下げてもう少し身近なものにすることが西内さんのお考えだ、ということでしょうか?

西内 はい、その通りです。

上原 貴重なお話をありがとうございました。

■この記事はデル・テクノロジーズから提供された原稿を、ITmedia NEWS編集部で一部編集したものです。

■編集履歴:2022年3月7日午前10時00分 タイトルや本文見出しの記述を変更しました。


「Dell de AI(でるであい)」からのおすすめ記事一覧

Dell de AI(でるであい)とは──


dell-deai

「AIをビジネスで活用する」──そう言い表すのは簡単です。しかし、組織にとって本当に価値のあるアクションへ落とし込むには、考えるべきことがあまりに多すぎます。誰に相談すればいいのか、どうすれば成果を生み出せるのか。「Dell de AI “デル邂逅(であい)”」は、そんな悩みを持つ企業や組織にポジティブな出会いや思いもよらぬうれしい発見──「Serendipity(セレンディピティ)」が生まれることを目指した情報発信ポータルhttps://www.itmedia.co.jp/news/special/bz211007/です。


おすすめ(1)「統計学が最強の学問である」著者が語るデータ活用


【前編】
DX時代のデータ活用に役立つツール 「統計学が最強の学問である」著者が起業して開発に至った背景に迫る

【後編】
データ分析にAIを使うメリットを解説 “データサイエンティストいらず”の専用ツールを活用事例と一緒に紹介


おすすめ(2)AI導入時の課題を解決するには


AI活用をもっと身近に メリットを気軽に体験できる“専門施設”がある! デル・テクノロジーズが使い勝手を紹介


「AIを使えない企業は衰退する」――勝機はAI活用にアリ 明大教授が訴える“知っておくべきこと”とは?


AIの動作環境、「サーバ」採用が約30% 調査で見えた、GPUサーバが役立つ訳 導入・更改時の懸念を払うには?


AI活用のハードルを一気に下げる、AutoMLツール最前線


AIは“特別な投資”ではない 「知見も人材もない」企業が自社導入に成功するコツは? データサイエンティストに聞く


「AIでデータを英知に変える」 450超の施策でDX推進 大手IT企業のノウハウは? “AIスペシャリスト”が明かす


おすすめ(3)事例で知るAI活用の最新事情


8つのAI導入サービスを紹介 製造業向け、オフィス業務効率化、DX推進など ビジネス活用のメリットも併せて解説

AIやDXは事業サイクルを加速させる武器だ――松尾豊教授が語る 企業のAI活用を後押しするセミナーを徹底レポート

「乗り遅れると大変なことに」 AIの大変革期、一般企業はどうすればいい? AI活用のヒントを6社に学ぶ

DXにAIを生かすには? “AI基盤の鉄板構成”で手軽に成果を享受する方法

AIで心疾患を見つけ出せ――医療現場のAI活用、その現状を追う AIは「勉強熱心で優秀な研修医」になるのか

“人知を超えたAI”はビジネスに不適切 「説明可能なAI」が求められるワケ 機械学習の“グランドマスター”が解説

化粧品の商品開発にAI活用、データ分析を自動化 材料開発を加速する「マテリアルズ・インフォマティクス」を解説

建設業界向けAIサービス 図面のデジタル化で設計業務を効率化 構造計画研究所の専用ツールとは

「AIは即戦力だ」 人材不足の製造業、“職人の経験”頼りの現場をAIは救えるか 専門知識なしでAI開発する方法とは?

数分かかる検査作業を3秒以下に AI活用で工事現場の安全確認を迅速化 速さのカギは「仮想GPU基盤」にあり

1秒の遅延が損失に――クラウド中央処理の課題3つ 解決策は「エッジAI」 システム構築のポイントは?

勝率2.6倍――AIで“勝てる広告”を生むサイバーエージェント GPU基盤を“あえて自社開発” そのワケは?


おすすめ(4)人間とAIの未来を知るには


これは、私が夢で見た「人間とAIの未来」の“ちょっと不思議”なお話

AIの“カンブリア爆発期”? 2022年を編集長と振り返る この先、AIはどう進化するのか考えた


Copyright © ITmedia, Inc. All Rights Reserved.


提供:デル・テクノロジーズ株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2022年1月10日