注目の書籍

好評発売中!

IT業界徹底研究就職ガイド2013年版

IT/ネット業界で働くと いうことを分かりやす く解説。2013年3月卒 業の学生向けの1冊。

必聴講座ご紹介

Cloud Days Tokyo 2012
クラウド時代を勝ち抜く企業戦略を考える

エムオーテックス


Cloud Days Tokyo 2012
クラウド時代の企業インフラとユーザー環境の姿

ヴイエムウェア


Cloud Days Osaka 2012
クラウドでIT維新を〜ビジネスを加速させるベストプラクティス

アマゾン データ サービス ジャパン

情報システム

ニュース

ITpro

富士通,住所データの表記ゆれを解消するデータ・クレンジング・ソフトを発表

2009/09/09
羽野 三千世=ITpro

 富士通は2009年9月9日,日本語の住所データの表記ゆれを解消するデータ・クレンジング・ソフト「Interstage Information Quality V10」を発表した。毎月更新される住所データベース(住所辞書)を参照し,住所データの欠落補完や誤字補正,「丁番地」の表記の統一,市町村合併などに伴う住所変更を自動的に行う。価格は250万円(1CPU当たり,税別)。Windows版,Linux版,Solaris版を用意し,10月下旬のWindows版発売を皮切りに,順次提供する予定だ。

 「Interstage Information Quality V10」は,住所データに含まれる日本語に特有の表記ゆれを解消し,データの品質向上を図るソフトである。例えば,「“群馬県 草津町 草津”→“群馬県 吾妻郡 草津町 大字 草津”」のように住所の欠落を補完したり,「〜町1丁目1番1号」「〜町1−1−1」のように表現方法がバラバラな丁番地の表記を,「〜町1丁目1−1」に統一したりする。住所データの表記を統一することで,顧客や会員データベースの検索精度を高め,登録データの重複を防ぐことができる。

 住所辞書の参照方法に独自技術を採用することで,高いクレンジング精度を実現したという。一般的な方法では住所データと住所辞書を前方一致で照合するが,同ソフトは,住所データを住所辞書の全要素と総当たりで照合し,一致する要素数から正しい住所を判断する。この方法により,住所の省略や略字も補正できるようになった。同社によるとクレンジング成功率は97%で,この値は「業界トップレベルだ」(富士通 ミドルウエア事業本部 データマネジメント・ミドルウエア事業部 第五開発部長の押金章悟氏)という。

 参照する住所辞書は,過去40年分のデータを収録する。また,毎月最新の住所辞書データを送付する「住所辞書更新サービス」を年額80万円(サーバー1台あたり,税別)で提供する。

この記事に対するfacebookコメント

nikkeibpITpro

読みましたか? 〜 未読記事をご紹介