地味だが忘れてはならないデータ品質の重要性特集:データ経営でビジネスを制す(2/5 ページ)

» 2005年09月16日 00時00分 公開
[栗原 潔,ITmedia]

 情報システムの処理ロジックを設計・構築している人の多くが正しいデータが入力されることを大前提として考えている節がある。しかし、現実の環境では、ゴミのようなデータが入力される可能性はとても高いのだ。

 この点を理解してもらうために、筆者がよく使うエピソードは、1996年のアトランタ・オリンピックにおける米IBMの事例だ(もうはるか昔のことなので、もし読者に関係者の方がいらしたとしても、昔話として許してくれるだろう)。IBMはアトランタ・オリンピック運営のための情報システムのインテグレーターであった。しかし、このシステムは初期トラブルが続き、IBMの顔に泥を塗る結果となってしまった。

 重大な問題の1つは、競技者データベースの内容が滅茶苦茶であったことだ。たとえば、選手の身長が5メートルであったり、30センチであったりしたのだ。原因はデータの入力部分にあった。データの入力担当者の国籍はさまざまである。メートル法を使うのが当然の国もあれば、インチで入力する国もある。入力システムには適切なガイダンスがなく、また、データの範囲チェックもしていなかったために、不正データがそのままデータベースに蓄積されてしまい、このような問題が起こってしまったのである。

 IBMという優れたインテグレーターが社運を賭けたプロジェクトであっても、データ品質を維持するための仕組みを軽視したということだけで重大な問題が発生してしまったということだ。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ