コンピュータがデータを扱うものである以上、データ品質の問題が重要であるのは当然。未来永劫変わらないだろう。だが、データ品質を「取るに足らない問題」と考える向きもあるようだ。(特集:データ経営でビジネスを制す)
栗原 潔(テックバイザージェイピー代表取締役)
今まで筆者はITのさまざまな領域で数多くのプレゼンテーションをしてきた。その中で最も受けが良かったものは、データ品質に関するものであった。そのプレゼンテーションをやる前は「こんな地味なテーマが受けるのだろうか?」「こんな話は現場の方は周知なのではないか?」と少し不安だったので、反響が予想以上に大きかったことが意外であったのを覚えている。
コンピュータがデータを扱うものである以上、データ品質の問題が重要であるのは当然のことである。これは未来永劫変わらないだろう。しかし、どうもデータ品質は、取るに足らない課題、現場が扱うべき泥臭い課題という認識が、現場をよく知らないマネジメントやコンサルタントの中にあるのではないだろうか?
筆者のプレゼンテーションが予想以上に受けたことの背景に、データ品質問題に対するこのような認識のギャップがあるような気がしてならない。つまり、データ品質問題を正面から扱ったプレゼンテーションをしたということだけで、既に価値があったということだろう。
データ品質問題を考える時の重要なポイントはGIGO(ガーベジ・イン・ガーベジ・アウト)である。筆者が若手SEだった時にはよく聞いたキーワードだが、最近はあまり使われていない言葉かもしれない(実際、ITmediaの用語辞典にも載っていない)。
GIGOとはおそらくFIFO(ファースト・イン・ファースト・アウト、先入れ先出し)のシャレだと思うが、入力データがゴミ(不正なもの)であれば、出力データは必ずゴミになるということだ。当たり前のことだが、往々にして見逃されがちなポイントだ。
Copyright © ITmedia, Inc. All Rights Reserved.