データサイエンティストやデータアナリストなどに比べ、あまり目立たない「データ整備人」という仕事。フリーランスとして20年以上データ分析に携わってきたしんゆうさんは、データの抽出・集計を行うデータ整備の重要性をブログなどで発信しています。
しんゆうさんへのインタビューの前編では、「データ分析においてデータ整備人が重要な理由」「なぜ多くの組織でデータ整備が後回しにされるのか」「日本企業がデータ活用できないワケ」などを聞きました。
後編となる本記事では、日本のデータ分析の実態や、データ分析の本質にも切り込んでいます。
データアナリストを名乗っているけど、データアーキテクト(データ整備人)+アナリティクスディレクターもやる何でも屋。むしろ業界ウォッチャーとかに肩書を変えるべきなのか悩んでいる。ブログ「データ分析とインテリジェンス」管理人。 データ分析のためのSQLとその応用に特化したDI-SQLを正式公開。データ整備人をテーマにしたイベント「第2回 データアーキテクト(データ整備人)を”前向きに”考える会」の参加者を1月31日まで募集中。
いま話題のAI(人工知能)には何ができて、私たちの生活に一体どのような影響をもたらすのか。AI研究からビジネス活用まで、さまざまな分野の専門家たちにAIを取り巻く現状を聞いていく。
(編集:村上万純)
松本:しんゆうさんのブログのタイトルは「データ分析とインテリジェンス」となっています。データ分析とインテリジェンスはどういう関係があるのでしょうか。
しんゆう:インテリジェンスに関する書籍を何冊か読んで「これは重要だ」と痛感したんです。データ分析の意思決定って、要はインテリジェンスを作るためですよね。
松本:インテリジェンスという言葉が何を指すのか分からない方も多いと思います。データ分析とインテリジェンスの関係性について、もう少し詳しく伺えますか。
しんゆう:データをいじるのも、分析をするのも、全ては意思決定をするためです。意思決定をするために、特定の問題に対してどのような情報を集めて提供するか――これがインテリジェンスです。
例えば、天気予報で「今日、出かけるときに傘を持っていく必要があるかどうか」を知りたい人に長期予報のデータを渡しても意味がありません。しかし、大半のデータ分析はそんなことをやっている。問題定義がものすごく重要なんですね。
松本:日本語では「情報」と表現する言葉でも、英語ではデータ、インフォメーション、インテリジェンスと、いろいろな呼び方があり、共通認識を持つのが難しいです。「分析」は、一般的にアナリシスと呼ばれると思いますが、インテリジェンスとアナリシスはどう違うのでしょうか。
しんゆう:データ・インフォメーションとインテリジェンスには、明確な違いがあります。前者は加工していない生のデータで、後者は意思決定をするために分析、洞察されたものです。ちなみにデータとインフォメーションを区別するかどうかも人によって異なり、私は分けない派です。分けている人は、データは生のデータ、インフォメーションは整理された集計データと区分しています。
アナリシスは、インテリジェンスのプロセスの一部なんです。データを集計し、分析、洞察して……というプロセスの分析の部分がアナリシスです。日本語の分析は数字をガチャガチャといじるだけで話が終わっていて、洞察が抜けています。だから、分析じゃなくて処理と言った方が良いでしょう。
松本:それだと、世の中の「データ分析をやっています」という人のほとんどが「処理をやっています」と言うことになりそうですね。分析と処理だと言葉のイメージもだいぶ変わるので、抵抗感がある人もいるでしょうが。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR