注目の書籍

好評発売中!

基礎からきちんと知りたい人のC#プログラミングの入門書

楽しく役立つプログラ ミングをこの一冊でマ スター!付録DVD-ROM ですぐに始められる!

ソフト開発

覚えておきたい!「名寄せ」の基本

日経ソフトウエア
名寄せの基本

 “システムを作成するときには考慮されていなかった観点でデータを使おうとしたとき”に「使えないデータたち」は発生します。しかし,使えないデータだからと言って捨ててしまうことはできないでしょう。なぜなら,そのデータは今まで使っていたデータであり,これからも使うデータだからです。

 では,使えないデータを使えるデータにするにはどうすれば良いのでしょうか。その作業は「データ・クレンジング(Data Cleansing)」と呼ばれます。データ・クレンジングに似た言葉として「名寄せ」というものがあります。名寄せはデータ・クレンジングをした結果,データ間の関連性を導き出す行為です。重複データを特定するという観点では,名寄せはデータ・クレンジングの一環です。

 この連載は,名寄せ技術について,個人データの例をとりあげて具体的に説明します。データを扱うソフト技術者/開発者にとって,名寄せは必須知識の一つと言っていいでしょう。ぜひこの連載で基本を学んでください。

第1回 データ・クレンジングと名寄せ技術 
第2回 標準化でデータのばらつきを解消する 
第3回 同一データの決定と名寄せの限界 

この記事に対するfacebookコメント

nikkeibpITpro

読みましたか? 〜 未読記事をご紹介