富士通、DB内の「日本語表記ゆれ」を解消するツールを発表

富士通はDB内の日本語表記ゆれをクレンジングする「Interstage Information Quality」を発表。高精度な解析により、成功率は97%に達するという。


 富士通は9月9日、企業や組織が持つ住所・氏名データの表記を統一するデータクレンジングソフトウェア「Interstage Information Quality」を国内市場向けに販売開始すると発表した。

 企業IT基盤の再整備により、例えば顧客情報などのデータベースを統合すると、そこには同一人物を示すデータが重複するケースが考えられる。ダイレクトメールや宅配物の重複発送を始めとするトラブルが発生し、時には重大な問題を引き起こす可能性もあるだろう。特に自治体において同様のことがあれば、社会問題にも発展しかねない。とはいえ、住所や氏名の表記方法が多様(新旧字体の混在、市町村名の変更、地名の省略、番地の記載方法など)であるという日本特有の問題があり、これまで企業は有効な対策を見出せなかった。

 このような課題を解決するため、Interstage Information Qualityは、富士通独自の解析技術を搭載し、高精度なクレンジングを実現したという。富士通では、日本特有のいわゆる「表記ゆれ」を、短期間で解消できるとしている。

クレンジング例 クレンジング例

 解析技術の特徴としては、クレンジング対象となる住所を、各要素ごとに住所辞書内の要素と照合し、一致する割合の高い住所を選択するというアルゴリズムが挙げられる。また、日本特有の地名省略や漢字の誤りなどを自動補正し、正確な住所を導き出す。クレンジング成功率は、業界トップレベルの97%に達する(富士通による測定)という。

Interstage Information Qualityの解析技術の特徴 Interstage Information Qualityの解析技術の特徴。特許出願済みだという

 販売価格は、Interstage Information Quality Standard Edition V10のプロセッサライセンスが250万円(税別)、住所辞書更新サービスがサーバ当たり年額80万円(税別)となる。Windows版が2009年10月、Linux版が11月、Solaris版は12月の出荷を予定している。

企業向け情報を集約した「ITmedia エンタープライズ」も併せてチェック

関連キーワード

富士通 | Interstage | データベース


関連ホワイトペーパー

富士通 | データベース


Copyright© 2010 ITmedia, Inc. All Rights Reserved.




キャリアアップ



エンタープライズ・ピックアップ

news004.jpg 世界で勝つ 強い日本企業のつくり方:利用契約の検討――グローバルクラウドで失敗しないために(前編)
2010年以降、クラウドサービスの利用がさらに加速する。サービスを利用する企業はプロバイダーのデータセンターに預けた自社情報を保護するために、法的な要素を理解しておかなければならない。企業が注意を払うべき法的な検討事項を整理する。

news001.jpg IT投資の新方程式:「Twitter使ってます」――現役MS社員が“社員力”を語る(前編)
マイクロソフトが掲げるプロモーションメッセージ「社員にチカラを。ITで企業力を。(以下、BIEB)」からは、ITで社員の生産性を向上することが業績の拡大につながる、といったニュアンスを感じる。そこで気になるのが「じゃあ、マイクロソフトの社員自身はどうなのよ?」ということ。3人の現役MS社員により実態が明らかになる……?

news010.jpg 産業構造を変えるか:「住宅クラウド」の衝撃
住宅都市工学研究所が進める「住宅クラウド」は、クラウドが企業のIT領域にとどまらず、ビジネスのやり方自体を変える可能性を示している。

news010.jpg オルタナティブな生き方 栗原進さん:ネットでリアルを楽しくしたい
SE出身の企業広報マンでありながら、趣味は落語で憧れの人はインディ・ジョーンズとアナログ全開の栗原さんに、ブログを書く理由やネットからはじまるコミュニケーションについて伺った。

news001.jpg 最強最速アルゴリズマー養成講座:トップクラスだけが知る「このアルゴリズムがすごい」――「探索」基礎最速マスター
プログラミングにおける重要な概念である「探索」を最速でマスターするために、今回は少し応用となる探索手法などを紹介しながら、その実践力を育成します。問題をグラフとして表現し、効率よく探索する方法をぜひ日常に生かしてみましょう。