前回は「安価ですぐに利用でき」「プログラミングのスキルが必要なく」「サクサク動く」という3つの条件を満たすビッグデータ分析ツールを紹介しました。そこで今回と次回は、そのビッグデータ分析ツールを使って、どのように分析していくかという手法について説明していきます。

 紹介する分析手法は、決して難しいアルゴリズムを使うものではありません。「2次属性付け」と呼ばれるデータのグルーピングと、「クロス集計」というシンプルな集計の繰り返しです。

 経験上、この2つのプロセスの繰り返しだけでも、これまで気づいていない事業上の発見や、正しいと思っていたことの数字的な裏付けの証明、実施した事業の効果測定が可能になります(初公開!IBM辞めたギックスの3人はこうやってビューカード400万会員のデータを分析している)。

 複雑な統計手法を適用するよりも、むしろこの2つの地道なプロセスを、ツールの処理能力を生かして、スピーディーに何度も実行することの方がよほど重要だと、私たちは考えています。

 では、2次属性付けとクロス集計という分析手法を紹介していきます。具体的にイメージできるようにするため、ここでは架空のケースを設定します。

【ケース】スーパーのマーケティング担当者が分析環境を整えたら

 主人公は、スーパーマーケットチェーンのマーケティング部門の担当者です。月々の購買明細データが1000万件程度、顧客会員データは200万件程度あるので、ExcelやAccessを使って自らそれらのデータを分析することは困難でした。

 データは日の目を見ず、購買明細データや顧客会員データはデータベースに眠ったまま。マーケティングの施策は、これまでの経験をもとに企画・実行してそれなりの成果を上げていましたが、データの根拠をもって、今より合理的に施策を企画できたらいいなと常々思っていました。