「データがビッグだろうがスモールだろうが基本は同じではないですか」。
「もちろんそうです。データはビジネスに貢献する資産だという認識が必要です」。
ある団体に昨年加盟し定例会に出席したところ、10数年前に取材した方に再会した。かつてはデータウエアハウスのコンサルタントであったが、昨年は「ビッグなデータとは何か」という話をされていた。
冒頭で紹介したのは「ご無沙汰です」と声をかけ名刺交換をした後のやり取りである。
この団体は「日本データマネジメント・コンソーシアム(JDMC)」という。JDMCの目的はその名の通り、データマネジメントについて実践的な研究をしたり情報交換をすることだ。カンファレンスなどデータマネジメントを普及させる活動にも取り組んでいる。
時節柄「データがビッグになる」という話題を取り上げないといけないのだろうが、データマネジメント自体はざっと振り返っても30年を超える歴史を持つテーマである。かねてより重要だと言われてきたデータマネジメントの取り組みがあってこそ、規模や粒度の大小を問わずデータの価値を高められる。
データマネジメントとは何か
ところでデータをマネジメントするとはどういうことか。データがビッグという話と同様に、個々の英単語の意味は分かるものの説明しようとするとなかなか難しい。
教科書を開いてみた。データマネジメントの国際団体DAMA(The Data Management Association International)が作成した『DAMA-DMBOK Guide(The DAMA Guide to the Data Management Body of Knowledge)』の日本語版『データマネジメント知識体系ガイド』によると、データマネジメントは次の「ビジネス機能」である。
データ資産および情報資産の価値を管理、保護、供給、強化するための計画、ポリシー、プログラム、プロジェクト、処理、実践、手続きについて開発、実行、監督を規律正しく進めること。
要約すれば、データという資産の価値を高めるための管理、つまりデータの「資産管理」を指す。保有しているデータ資産がスモールであろうがミディアムであろうがビッグになりそうであろうが、資産である以上管理したほうがよい。
DMBOK Guideはデータマネジメントを10件の活動に分けている。
- データガバナンス:データマネジメントに対する計画、監視、統制
- データアーキテクチャ管理:データ資産管理のための青写真作成
- データ開発:分析、設計、構築、テスト、配備、維持
- データオペレーション管理:データ収集から廃棄までのサポート提供
- データセキュリティ管理:プライバシー、機密性、適切なアクセスの保証
- データクオリティ管理:品質の定義、監視、改善
- リファレンスデータとマスターデータ管理:ゴールドバージョンと複製バージョンの管理(ゴールドとは最も信頼できるもの)
- データウエアハウジングとビジネスインテリジェンス管理:報告と分析を可能にする
- ドキュメントとコンテンツ管理:データベースの外部にあるデータの管理
- メタデータ管理:メタデータの統合、統制、供給
「ビッグ」とは新たな使い方を意味する
管理や監視といった堅い言葉が10件並ぶと面倒な感じを受ける。ただし10件の活動をみると、それぞれが関係し絡み合っている。10件はデータ資産の価値を高めるための着眼点であって、管理の仕組みを10通り用意せよというわけではない。
10件の説明に使われている言葉からお分かりのように、DMBOK Guideは企業情報システムのデータベースに入っているデータを主な対象にしている。「ドキュメントとコンテンツ管理」は非構造化データに関するものだが、現行のDMBOK Guide第一版には最近話題のビッグなデータに関する明示的な記述はまだない。
しかし、センサーなどで細かい単位のデータをリアルタイムに取得するといったことは、「データ開発」や「データオペレーション管理」の延長と言える。集めた大量データの分析は「データウエアハウジングとビジネスインテリジェンス管理」の発展形になる。