多くの企業がデータの分析・活用に取り組んでいますが、その中で抜け落ちがちなのが、データ整備の視点です。データベースからデータを抽出・集計して分析者に渡す作業は地味に見えますが、データ分析の土台を支える極めて重要な仕事です。
この役割は、戦争でいうところの「兵站」(へいたん)に当たるほど重要なのではないか――データ分析に関する情報発信を続けるしんゆうさんが、自身のブログでこう問いかけた所、予想以上の反響があったといいます。
※兵站:戦場で、前線の部隊のために軍需品や食料などの供給・補充を行う機関
しんゆうさんは、データを抽出・集計して分析者に渡す人を「データ整備人」「データアーキテクト」と呼び、データ分析に関する勉強会を開催するなどの啓蒙活動をしています。
データ整備人の仕事は、単なるデータの抽出・集計だけでなく、「依頼内容を整理し、どういったデータが必要かを考える」「依頼者が求めていることを想像し、依頼内容とギャップがあればそれを解消する」ことなども含まれます。
また、「分析者が使いやすいようにデータマートを設計・作成する」「随時追加・変更されるマスタデータなどの品質を管理する」など、データを渡した後の操作性にまで目を向けます。
多くの日本企業では、この役割を担う人が誰なのかが明確になっていないそうです。エンジニアやアナリストが作業することが多いようですが、その作業は「通常業務+αの雑用」という扱いをされることもあり、正当な評価を得られていないといいます。
今回は、自らデータ整備人としても活動されるしんゆうさんに、データ分析におけるデータ整備の重要性を聞きました。
データアナリストを名乗っているけど、データアーキテクト(データ整備人)+アナリティクスディレクターもやる何でも屋。むしろ業界ウォッチャーとかに肩書を変えるべきなのか悩んでいる。ブログ「データ分析とインテリジェンス」管理人。 データ分析のためのSQLとその応用に特化したDI-SQLを正式公開。データ整備人をテーマにしたイベント「第2回 データアーキテクト(データ整備人)を”前向きに”考える会」の参加者を1月31日まで募集中。
いま話題のAI(人工知能)には何ができて、私たちの生活に一体どのような影響をもたらすのか。AI研究からビジネス活用まで、さまざまな分野の専門家たちにAIを取り巻く現状を聞いていく。
(編集:村上万純)
松本:しんゆうさんが提唱されている「データ整備人」という役割の必要性に強く共感しています。ブログを読んで「そうそう!」と何度もうなずきました。
しんゆう:最初にデータ整備人の話をブログに書いたのは、去年の夏です。ブログが結構バズって、その後に開いたデータ整備人に関する勉強会では、「私のやっている仕事が、まさにそれです」と声を掛けてくれる人がすごく多かったです。大体、その後に恨みつらみが続くのですが(笑)。
松本:データ整備人に関する勉強会は、どんな方が参加されるのですか?
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR