データの不備に直面し、その解決に取り組む現場は多い。マスターデータの統合に詳しいインフォテリアの油野達也氏(執行役員 エンタープライズ事業部長 西日本事業所長)は「以前は一部の先行企業が顧客マスターの整備に取り組んでいたが、最近は汚れたデータが社内に蔓延して業務が回らないという理由で、データの不備を解消する企業が増えている」と指摘する。もはやすべての現場が無視できない問題の一つになっているのだ。

きれいなデータが突然汚れる

 中には「うちのデータはきちんと管理しているので別に汚れていない」と思う人がいるかもしれない。しかし、そうしたデータが突如、汚れるケースも珍しくないようだ。

 メインフレームの基幹系システムをオープン系にダウンサイジングしている最中に、突然別会社との合併が決まった協和発酵キリンはその1社だ。「プロジェクトをいったん中断し、2社のマスターデータを統合する作業に取り掛かった。きちんと管理してきた顧客マスターが、合併を機に突然、重複データという形で汚れてしまった」と、篠田敏幸氏(情報システム部 マネジャー)は打ち明ける。

 複数の合併を経験したキヤノンマーケティングジャパンも同様だ。「数えてみたら社内に顧客マスターが10種類近くもあった」と、小手川公寿氏(ビジネスソリューションカンパニー BS事業計画本部 BS情報システム企画部 部長)は驚く。営業や経理の担当者が、どの顧客マスターを参照すればいいのか混乱する事態に見舞われた。

まずは入力、次にDB、最後は出力

図1●データをきれいにする三つのアプローチ
図1●データをきれいにする三つのアプローチ
入力側、DB側、出力側の3カ所で、それぞれデータをきれいにする対策がある。ここでは具体的な対策を全部で八つ取り上げる
[画像のクリックで拡大表示]

 汚れたデータが入ってこないようにするには、どんな対策があるのか。また、汚れたデータをきれいにするにはどうしたらよいのか―。本特集では、最も効果のある、データの「入力(入り口)」「DB(蓄積場所)」「出力(出口)」という三つのターゲットを狙い撃ちする対策を取り上げよう(図1)。

 一つ目の入力は、画面のチェック機構やマスター登録のマニュアル/体制の整備を指す。次から次へと入力される汚れたデータを阻止するのが目的だ。

 二つ目のDBは、蓄積されたデータに対して、クレンジングや名寄せをかけるもの。データモデルの不備を見直すアプローチも含む。

 最後は出力側の対策だ。DBに蓄積されたデータを活用するには、データの“下ごしらえ”が必要になる。最近はSNSなど非定型データを使った分析も広がっている。活用時の扱いを誤ると、きれいだったはずのデータが汚れてしまうことがある。これを解決するのが、出力側のアプローチだ。