企業システムは「業務で扱うデータ」を保管し・適切に出し入れする仕組みである。データは日々の業務の遂行を支え、またデータからその企業の姿を分析することができる。しかし、データの信頼性が低ければ適切な分析結果が得られない。そもそもどんなデータを保持しているか完全に把握できていない企業も多い。こうしたデータに関わる問題は多くの企業を悩ませている。実はその根は深い。本特集では、このような問題を抱えたデータを「バッドデータ」と呼び、その問題と対策を考察する。

 前回、バッドデータを根本的に解決するには、データの定義が不可欠であることを説明した。第3回の今回は、データを定義する際に必要なポイントを解説する。このポイントは最初にデータを定義するときに必要となるだけでなく、その後、最新状態を保持し続けるためにも重要である。

ポイント1.データ項目の命名ルールの規定

 ポイントの一つめは、データ項目の命名ルールを決めることだ。データの定義に際して、まずその項目名のネーミング(命名)は最重要である。これは当たり前のようだが、実際にルールが定かでない企業も少なくないので最初のポイントとして強調しておきたい。

 具体的な命名ルールとしては、例えばウィリアム.R.デュレル氏の提唱したルールなどがある(図3)。名前だけでその項目が何を意味するか識別できるように、修飾語を十分に付与することが重要だ。一般的な日本語として多少冗長に感じても、データ辞書上に登録する項目としては、誤解なく意味することが分かることのほうが優先される。

 誤解なく意味することが分かるように徹底されていない場合、システム開発時にその業務領域内で暗黙的に通用する名称を付けがちである。例えば以前の事例では「納期日」いう項目名が付けられていた。これは上記ルールとポイントを考慮すれば、「顧客希望納期年月日」など、誤解が生じないようなデータ項目名を付与する。

図3●データ項目の命名ルールの例
図3●データ項目の命名ルールの例
[画像のクリックで拡大表示]