ビッグデータを分析する際、企業システムで扱うデータを組み合わせて分析することが多い。最後に、企業システムのデータをビッグデータ分析システムの対象に加えるときの注意点をまとめる。従来とは異なる視点や考え方が求められるという。

 従来の企業システムで扱うデータを組み合わせて、ビッグデータを分析することも多い。組み合わせる際には注意すべき点がある。三つのポイントを解説しよう。

ポイント1 業務プロセスの視点でデータを捉える

 エンジニアの皆さんは現在、主に顧客の業務を効率化することに重きを置いて、システムを開発しているのではないだろうか。そのような意識では、データは最新の状態だけ保持できればよいと考えがちになる。

 例えば、ある受注データに対して数量に変更があった場合、システムでは受注データに記録された数量の値を上書きすればいいと考えるだろう。だが、こうした数量変更が頻発していると分かったとき、受注業務の担当者は数量変更が発生する経緯を分析し、業務改善につなげたいと考えるかもしれない。分析のためのデータを提出するように求められたとき、皆さんはすぐに用意できるだろうか。

 数量変更の経緯を分析するには、すべての受注データから数量の値が変更されたものだけを抽出すればよいだろう。だが、先ほどのように受注データの数量を上書きしてしまうシステムだと、変更された受注データだけを抽出するといったことは不可能だ。

 受注データが更新されたかどうかの手がかりは、データ操作の履歴(ログ)を記録しておくことで得られる。それだけのことだが現状の基幹系システムでは、ログの記録機能を持つものがほとんどない。理由は、システム開発のエンジニアが「データはアプリケーションを下支えするもの」と思い込んでいるからだ。