|
必聴講座ご紹介 Cloud Days Tokyo 2012 エムオーテックス Cloud Days Tokyo 2012 ヴイエムウェア Cloud Days Osaka 2012 アマゾン データ サービス ジャパン |
富士通,住所データの表記ゆれを解消するデータ・クレンジング・ソフトを発表富士通は2009年9月9日,日本語の住所データの表記ゆれを解消するデータ・クレンジング・ソフト「Interstage Information Quality V10」を発表した。毎月更新される住所データベース(住所辞書)を参照し,住所データの欠落補完や誤字補正,「丁番地」の表記の統一,市町村合併などに伴う住所変更を自動的に行う。価格は250万円(1CPU当たり,税別)。Windows版,Linux版,Solaris版を用意し,10月下旬のWindows版発売を皮切りに,順次提供する予定だ。 「Interstage Information Quality V10」は,住所データに含まれる日本語に特有の表記ゆれを解消し,データの品質向上を図るソフトである。例えば,「“群馬県 草津町 草津”→“群馬県 吾妻郡 草津町 大字 草津”」のように住所の欠落を補完したり,「〜町1丁目1番1号」「〜町1−1−1」のように表現方法がバラバラな丁番地の表記を,「〜町1丁目1−1」に統一したりする。住所データの表記を統一することで,顧客や会員データベースの検索精度を高め,登録データの重複を防ぐことができる。 住所辞書の参照方法に独自技術を採用することで,高いクレンジング精度を実現したという。一般的な方法では住所データと住所辞書を前方一致で照合するが,同ソフトは,住所データを住所辞書の全要素と総当たりで照合し,一致する要素数から正しい住所を判断する。この方法により,住所の省略や略字も補正できるようになった。同社によるとクレンジング成功率は97%で,この値は「業界トップレベルだ」(富士通 ミドルウエア事業本部 データマネジメント・ミドルウエア事業部 第五開発部長の押金章悟氏)という。 参照する住所辞書は,過去40年分のデータを収録する。また,毎月最新の住所辞書データを送付する「住所辞書更新サービス」を年額80万円(サーバー1台あたり,税別)で提供する。 最新ニュース記事一覧へ >>
|