毎週3分、情シスドリル コレ1枚で分かる「アナリティクスのプロセス」即席!3分で分かるITトレンド

業務改善や経営改革に役立つ知見を得るために業務データを活用するには、BI(Business Intelligence:ビジネスインテリジェンス)アプリケーションでの分析・活用するためにデータを最適化するプロセスが必要です。業務データはどのように最適化されるのか、そのプロセスについて解説します。

» 2015年11月02日 07時00分 公開

この連載は

 カップめんを待つ間に、電車の待ち時間に、歯磨きしている間に“いまさら聞けない”ITトレンドが分かっちゃう! 今さら聞けないITの最新トレンドやビジネス戦略を、体系的に整理して分かりやすく解説する連載です。「この用語、案外、分かっているようで分かっていないかも」「IT用語を現場の社員にもっと分かりやすく説明できるようになりたい」――。情シスの皆さんのこんな課題を解決します。


膨大な業務データが有用な解析データになるまで

 CRM(顧客関係管理)SCM(供給連鎖管理)、生産管理システムなどの業務アプリケーションからは、日々膨大なデータ(ビッグデータ)が生み出されています。これらのシステムは、それぞれの業務を効率よく処理するためにつくられたシステムであり、生み出されるデータもその目的のためだけに使用されています。

 業務の状態を可視化するために、あるいは業務上の課題や知見を見つけ出すために、これらのデータから必要なものを抽出・収集し、BI(Business Intelligence:ビジネスインテリジェンス)アプリケーション用のデータベースであるDWH(Data Warehouse:データウェアハウス)に集める必要があります。

【図解】コレ1枚でわかる「アナリティクスのプロセス」

 しかし、業務システムのデータベースは、それぞれの業務処理に最適化されているため、そのままのデータ形式でDWHに集約・統合できません。そこで、各業務システムのデータをDWHのデータ形式に加工・編集する必要があります。

 そのためのシステムが、ETL(Extract:抽出、Transform:変換、Load:書き込み)システムです。ETLシステムは、次のような処理を行います。

  • 【不要なデータの削除】分析に不要なデータや異常なデータを削除する。
  • 【値の変換】Null値の変換や、データ型の変換(日付→文字列など)を行う。
  • 【クレンジング】システム間でコードの意味が違う場合にそれを統一するなど、データの意味をそろえる。また、データ内に不整合があった場合にそれをエラーとしたり、一定のロジックで変換したりする。
  • 【統合・集計】複数のシステムから抽出した別々のデータを1つのデータとして統合する。また、例えば業務システムでは日単位のデータを月単位に集計するなどの集計処理を行う。

 ELTシステムによって加工・編集されたデータは、DWHに書き込まれます。このDWHは、次のような特徴を持っています。

Photo
  • 【項目別】基幹システムは「機能別」に設計されており、データには「目的」がある。DWHでは、これを項目(サブジェクト)ごとに再構成する。
  • 【統合化】さまざまなシステムからのデータを1つに統合するために、データフォーマットの変換や抽象化などを行う。
  • 【非更新】データの修正があった場合、古いデータを削除したり、上書きしたりせずに、追記し、履歴を完全に残す。
  • 【時系列】データを上書きせずに追記していくことによって、過去のある時点でのデータを参照できるようにする。

 なお、多くの業務機能を統合したERPパッケージのなかには、業務処理とBIアプリケーションでの使用を同一のデータベースで行う製品もあります。その場合は、ETLシステムは不要となり、DWHもERPシステムのデータベースに統合されています。

 DWHのデータは、BIアプリケーションによって処理されます。その際、解析の目的に適合したデータや最適な解析手法、予測モデルを選択しなければなりません。また、解析の結果を解釈し、指示やアドバイスを導き出すことも必要です。この役割を担うのはデータサイエンティストです。

 なお、この役割を人工知能に置き換える取り組みも行われており、その一例にIBMのクラウド型分析ソリューション「Watson Analytics」が挙げられます。

著者プロフィル:斎藤昌義

book 【図解】コレ1枚でわかる最新ITトレンド [Kindle版]

 日本IBMで営業として大手電気・電子製造業の顧客を担当。1995年に日本IBMを退職し、次代のITビジネス開発と人材育成を支援するネットコマースを設立。代表取締役に就任し、現在に至る。詳しいプロフィルはこちら。最新テクノロジーやビジネスの動向をまとめたプレゼンテーションデータをロイヤリティーフリーで提供する「ITビジネス・プレゼンテーション・ライブラリー/LiBRA」はこちら


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ