富士通はDB内の日本語表記ゆれをクレンジングする「Interstage Information Quality」を発表。高精度な解析により、成功率は97%に達するという。
富士通は9月9日、企業や組織が持つ住所・氏名データの表記を統一するデータクレンジングソフトウェア「Interstage Information Quality」を国内市場向けに販売開始すると発表した。
企業IT基盤の再整備により、例えば顧客情報などのデータベースを統合すると、そこには同一人物を示すデータが重複するケースが考えられる。ダイレクトメールや宅配物の重複発送を始めとするトラブルが発生し、時には重大な問題を引き起こす可能性もあるだろう。特に自治体において同様のことがあれば、社会問題にも発展しかねない。とはいえ、住所や氏名の表記方法が多様(新旧字体の混在、市町村名の変更、地名の省略、番地の記載方法など)であるという日本特有の問題があり、これまで企業は有効な対策を見出せなかった。
このような課題を解決するため、Interstage Information Qualityは、富士通独自の解析技術を搭載し、高精度なクレンジングを実現したという。富士通では、日本特有のいわゆる「表記ゆれ」を、短期間で解消できるとしている。
解析技術の特徴としては、クレンジング対象となる住所を、各要素ごとに住所辞書内の要素と照合し、一致する割合の高い住所を選択するというアルゴリズムが挙げられる。また、日本特有の地名省略や漢字の誤りなどを自動補正し、正確な住所を導き出す。クレンジング成功率は、業界トップレベルの97%に達する(富士通による測定)という。
販売価格は、Interstage Information Quality Standard Edition V10のプロセッサライセンスが250万円(税別)、住所辞書更新サービスがサーバ当たり年額80万円(税別)となる。Windows版が2009年10月、Linux版が11月、Solaris版は12月の出荷を予定している。
企業向け情報を集約した「ITmedia エンタープライズ」も併せてチェック
Copyright © ITmedia, Inc. All Rights Reserved.