世間を騒がせている年金記録問題。データの誤りや抜け,実態とのかい離,これらを許した業務プロセスの不備といった問題が明らかになった。図らずもこの一件は,多くの企業に警鐘を鳴らした。「ウチのシステムが持っているデータも,実際のところはどうなっているのか不安だ」という企業も少なくはないだろう。

 今,記者はこの問題を起点にして「データの品質管理」について取材を進めている。この「記者のつぶやき」で,これまでの取材結果と現時点での見解を皆さんにお知らせしたい。

再び浮上するデータ品質管理というテーマ

 データの品質低下をどう防ぐか。今も昔も変わらぬ重要なテーマである。「データの品質管理が再度大きなテーマとして浮上しつつある」。IT分野のコンサルティングや調査分析を手がけるテックバイザージェイピーの栗原潔氏はこう見る。栗原氏は現場任せのデータ品質管理,経営層の意識の薄さといった現状の問題点を指摘する。詳しくは関連記事をご覧いただきたい。

 ここに来てデータの品質管理は新たな壁に突き当たろうとしている。企業で扱うデータ量が爆発的に増加したことで,これまでの現場による地道な対応だけでは対処しきれなくなってきたのだ。

 企業経営の観点から見ると,内部統制がデータ量の増加に大きく関わっている。記録として残すべき業務データは,基幹業務のデータはもちろん,電子メールや各種業務に付帯する書類にまで及ぶ。単に量の観点だけではなく,正確性も問われている。増えゆく一方のデータに,品質面での検証はなされているだろうか。

 米IT調査会社のガートナーによると,世界のCIO(最高情報責任者)がいま最も関心を持ち,かつ投資したいと考えている技術のトップはBI(ビジネス・インテリジェンス)だという。ハードの高度化により大量のデータが扱えるようになったことが背景にある。ただ,ガートナー ジャパンでBI分野を担当する堀内 秀明リサーチディレクターは,「いくらデータを分析する仕組みが素晴らしくても,その仕組みに投入するデータがいい加減では,いい加減な結果しか得られない」と指摘する。

 BIに取り組む上では,そのデータが実態を反映したものになるよう保つことが不可欠だ。そもそもデータが正しいか。データの定義が部門ごとに違っていないか。同じ「在庫数」というデータでも,社内の業務ルールが徹底されておらず,部門によっては実態とシステム上のデータが異なるケースがある。

データの間違いが業務に決定的な影響を及ぼす

 既に触れたように,データの品質管理を語る上で重要なテーマの一つが「データの入力」だ。「GIGO(Garbage In, Garbage Out)」。コンピュータの黎明期,こんな言葉が流行ったという。「ゴミを入れればゴミが出てくる」――つまり,いい加減なデータをコンピュータに投入しても,いい加減な結果しか出てこない,という意味である。この真理は変わらない。

 「二重チェック体制を敷くなど,データの入力時点でなるべく間違いを減らすこと。ひとたび間違ったデータがシステムに入り込むとさまざまな部署やシステムにそのデータがコピーされ,修正するのが難しくなる」とテックバイザーの栗原氏は注意を促す。「間違ったデータの挙動と影響はコンピュータ・ウイルスにも似ている」と栗原氏は言う。

 ネット・ショップで10万円の商品を間違って1万円と表記してしまい,顧客からの注文が殺到――。有限責任中間法人ECネットワークの原田由里氏は,「価格データの誤入力・誤表示が大きなトラブルにつながるケースが多々ある」と指摘する。ECネットワークは消費者向けECを手がける事業者に対して,トラブル時のアドバイスをしている。数年前,ある会社がネット上で19万8000円で売るべきパソコンの販売価格を1万9800円としてしまい大きな騒ぎになった。「トラブル発生時,大手の小売店が開いているネット・ショップなら人を投入して対処できる。だが数人で回している小規模なネット・ショップはその後の顧客対応で忙殺される。ショップを閉鎖せざるを得ず,事業の再開まで半年もかかったというケースがある」(原田氏)。

 「入力時によく確認しなかったのが原因,気をつけろとしか言いようがない」などと単純に断定するのは危険だ。コンテンツ管理システムのユーザー・インタフェースに工夫を凝らすことで回避できた問題ではなかったのだろうか。

 これから詳しく取材する予定だが,ユーザー・インタフェースは記者の大きな関心事である。金銭的なことで話が済むのであればまだしも,健康や命にかかわることであれば入力ミスはもっとクリティカルな事項になる。過去,医療データの入力ミスで重大な医療過誤につながったという事件がいくつか発生している。

 最近はRFIDやセンサー,バーコードといったデータの再入力を省く技術や仕組みが発達してきている。近い将来,最大の懸念である「入り口」における間違いは減るかもしれない。それでも間違いがゼロになることはない。人は間違うものであり,機械は壊れるものである。それに根ざしたデータがらみのトラブルは,いつどこにでも発生しうる。それに,人が意識的にデータを入力する機会が減れば減るほど,間違ったデータがひとたびシステムに入り込んだ後の影響は大きくなる。

 ユーザー・インタフェースの改善,データ・クレンジング,システムの全体設計,データを扱う組織体制のあり方など,データ品質管理を語る上での切り口や局面は多岐にわたる。秋頃に発行予定の「日経コンピュータ」誌で,このテーマの取材結果をレポートする予定だ。ぜひ皆様のご意見や問題意識をITproのコメント欄にお寄せいただきたい。