前回はビッグデータ分析を実施できる環境を整えた後、2次属性付けとクロス集計というシンプルな作業を実施していけばよいという分析の流れを説明し、最初のステップである2次属性付けの作業プロセスまで見てきました。

 今回はその2次属性を利用してクロス集計し、ターゲット層の購買傾向を把握、自分の現場での肌感覚が正しいかどうかを、ビッグデータから数字の裏付けを取る検証のプロセスを説明していきます。前回に続いて、スーパーマーケットチェーンのマーケティング担当者の例で考えていきましょう。

 手軽にできるビッグデータの分析環境を整え、今まで分析できなかった購買明細データと顧客会員データを手元に置きました。やりたいことは男性客の購買特性を把握し、その特性に合わせて、より買ってもらうための施策を考えたいということです。最初のステップとして購買明細データに2次属性を付け終わりました。付けた2次属性は購買時間、購買金額、頻度、商品カテゴリーに関するものです。

クロス集計でターゲット顧客を把握

 付与した2次属性を利用して、ターゲット顧客である男性客の特徴を把握するための最もシンプルで有益な手法がクロス集計です。クロス集計とは、データの項目を掛け合わせて集計する手法のことです。

 まず項目を1つの表の表側(行)と表頭(列)に分けます。それが交わるセルに該当するデータの個数、合計、平均などを集計します。

 例えば、「性別」の違いで「購買時間帯」がどのように違うのかを検証してみます。その場合には、表側(行)と表頭(列)にそれぞれ、「性別」と「購買時間帯」を取り、人数(=データの個数)で集計します。