「社会保険庁の年金記録問題は,『データの品質管理』という古くからの課題を再度示した」。こう語るのは,IT分野のアナリスト/コンサルタントである栗原潔氏(テックバイザー・ジェイピー代表取締役)。栗原氏は以前ガートナー ジャパンでアナリストとして活動しており,データ品質について継続的に調べてきた。

 今回の年金記録問題は,(1)データの入力時点でそれが正しいかどうかをチェックしていない,という現場の管理のずさんさ。そして(2)データの入力を現場任せにしていた,という管理者の意識の低さなどが根底にある。栗原氏は,「年金記録問題はデータの品質管理の重要性を語る上で典型的な『反面教師』。日本の企業や組織の多くは,それを他人事だと笑ってはいられないはず」と指摘する。

 一般的に,現場でデータを扱っている社員は,システムにデータを誤入力していないか,いまシステムに入っているデータと現実がかい離していないか,といったデータの品質管理がいかに重要かを理解している。だが「マネジメント層がその重要性を認識していないために,品質管理に必要な人的リソースや組織づくり,ソフトウエア・ツールの導入など,人材や道具が確保しにくい現状がある。結局,現場の地道な努力で何とか対応している」(栗原氏)というのが実態だ。これでは品質を高めるにも限界がある。「まずはデータ品質は経営のテーマであるという理解をマネジメント層に広めることが必要だ」と,栗原氏は主張する。

 データの品質を確保する基本は,入力時点で間違いや不整合をできるだけゼロに近づけること。「間違ったデータがシステムに入り込んでしまうと,それが社内に流通し,気づいたときにはもう修正が困難になっている。ウイルスのようなものだ」と栗原氏はデータ品質確保の重要性を強調する。

 データの品質を高めるための代表的なツールとしては,ETL(データ抽出・変換)ツールが挙げられる。ETLツールには住所や姓名などの表記を見比べて,同じものを指すと思われるデータを把握できるようにするデータ・クレンジング機能などが搭載されている。先に挙げたような理由から数百万円から数千万円という導入費用が確保できるかどうかは別として,必要な道具はすでに存在すると言っていいだろう。

 栗原氏は一方で,「データの入力から廃棄に至るライフサイクルの中で,どのプロセスでどのような手法を使えば効果的にデータの品質を高められるかという体系の整備が進んでいない」ことを指摘する。「海外ではこのテーマを専門的に取り上げた書籍がいくつか発行されている。だが日本語による書籍は今のところ見られない」(栗原氏)。