ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

データ分析初心者は“童心に帰る”べき── 現役データサイエンティストが説く、失敗しないための心構え(2/2 ページ)

» 2022年10月07日 08時00分 公開
[松浦立樹ITmedia]
前のページへ 1|2       

データ分析にかけるべき時間は?

 新たにデータ分析を始める際、どのくらいの時間をかけて分析を行うべきなのだろうか。堅田さんはこの問いかけに対し、データ分析はただのコストであるとし「かけるべき時間は短ければ短いほどいい」と話す。

 データ分析の作業は主に2つに切り分けられるという。1つは、データから何が読み解けるかと考えること。もう1つは実際に手を動かし分析を行う作業だ。このうち、前者の考える作業に時間をかけるほど、アウトプットの質が良くなるという。そのため「手を動かす時間を短くできるかどうかが、データ分析の質を決める」と堅田さん。

 そこで重要になるのが、分析前のデータを前処理するフェーズだ。業務で使うデータは、必ずしも分析のために集められたデータではない場合もあるため、前処理はとても重要な作業になるという。例えばExcelのデータを分析に使う場合は前処理作業として、記述が抜け落ちている部分を埋める「欠損値の処理」がある。

 この際に手打ちで作業するのではなく、ショートカットキーやIF関数、VLOOKUP関数などのテクニックを駆使できるかで作業効率は変わっていく。堅田さんは「これらのテクニックが使えない人は結構いる」とし、「少ない量のデータならば手打ちでもどうにかなるかもしれないが、数千、数万となるとどうにもならない」と説明。データ分析を志す人ならば、ぜひ覚えてほしいと強く念を押す。

「データ分析の前にIF関数などを習得してほしい」と堅田さん

 続けて現役のデータサイエンティストほど、前処理をしっかりできる人は少ないとも指摘。スクールの卒業生などにExcelデータを渡し、特定のキーワードが入っている行数を尋ねてその正答率を集計したところ、そのスコアはすごく低くなったという。この原因には挙げられるのは、データ分析に慣れたことによる慢心だ。

 「自分のやった処理が正しいかを検証できるか。そのための“検算方法”を編み出せる人はすごくいい分析者で、そういう人ほどデータをしっかりと眺めている傾向にある。料理で言うならば味見をきちんとしているということ。前処理はまさしく味見に該当する部分であり、それを怠ってはいけない」(堅田さん)

分析に使うツールはExcelで十分? それともBIツール? AI?

 データミックスは9月、Excelでのデータ活用スキルを測る検定試験「データ分析実務スキル検定 シチズン・データサイエンティスト級」(CBAS Citizen級)の実施を発表している。分析の非専門家である現場のビジネスパーソンを対象にした同試験の実施背景について聞くと、堅田さんは「仮説さえよければ、実はExcelでのデータ分析は結構できる」と話す。

Excelでのデータ活用スキルを測る検定試験「データ分析実務スキル検定 シチズン・データサイエンティスト級」(CBAS Citizen級)

 堅田さんは「Excelでも簡単な最適化問題や重回帰分析までなら行える。データ分析にExcelを使うことのメリットは何よりも、誰もが持っているソフトであり、分析を始めやすい点にある」と説明する。

 「先ほどの話にもあるように、データ分析というのは結局は仮説の出し合いが重要になる。どれだけ高機能なツールを使おうとも、これができなければ意味がない。そのためデータ分析を始める取っ掛かりとして、Excelはおすすめできる」(堅田さん)

 Excelが向いているデータ分析事例にはアドホックなもの、つまり継続的な利用よりも一時的な状態を知るための手段に有効的としている。例えば、「前月の退職率」や「今の工場ラインの不良品率」など現状分析する場合だ。データ量が数千から数万のものであれば、Excelで十分な分析ができるという。

 一方、「1年後の転職率」など先の予測については、Pythonを使った分析やBIツールなどの専門ソフトが向くという。これらを使うメリットは他に、組織全体に共有しやすいことにある。「Excelでできるのはあくまで分析結果の共有まで。社内の人たちにデータを入れてもらってAPIとして出力などはできないためExcelで社内共有はやりにくいと思う」と堅田さん。

 「どんな仮説を設定するか、分析に適切なツールは変わってくる。またその結果をレポートにしたいのか、ダッシュボード化するのか、AIで自動化するのかなど、どのような用途で使うのも重要になる。いずれにしろ、まず自分がどんな課題を解決したいのか、言語化するところからデータ分析を始めてみては」

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.