企業システムは「業務で扱うデータ」を保管し・適切に出し入れする仕組みである。データは日々の業務の遂行を支え、またデータからその企業の姿を分析することができる。しかし、データの信頼性が低ければ適切な分析結果が得られない。そもそもどんなデータを保持しているか完全に把握できていない企業も多い。こうしたデータに関わる問題は多くの企業を悩ませている。実はその根は深い。本特集では、このような問題を抱えたデータを「バッドデータ」と呼び、その問題と対策を考察する。

 前回、バッドデータを根本的に解決するための、データ定義のポイントを説明した。データの定義はシステム的に管理し続ける必要がある。第4回の今回は、データ定義を管理するためのシステムについて解説する。

データ定義管理システムのバリエーション

 データ定義をシステム的に管理する仕組みとして「A.分析基盤型」「B.データハブ型」「C.マスターデータ管理型」「D.開発支援ツール統合型」「E.用語集」の五つのバリエーションが挙げられる。データ定義情報を記した「データ辞書」をどこで管理するかという違いがある。ここでは対象を広く捉えて列挙しているので、データ辞書の管理が主目的でないものも含んでいる。なお、これは筆者視点の分類であり、これらを複合するケースも存在する。順に解説する(図4)。

図4●データ定義情報を管理するシステムのバリエーション
図4●データ定義情報を管理するシステムのバリエーション
[画像のクリックで拡大表示]

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。