写真●SAS Institute Japan、ソリューションコンサルティング第一本部、分析グループ、シニアマネージャーの辻仁史氏(撮影:井上 裕康)
写真●SAS Institute Japan、ソリューションコンサルティング第一本部、分析グループ、シニアマネージャーの辻仁史氏(撮影:井上 裕康)
[画像のクリックで拡大表示]

 「ITとマーケティングの進化によって、データ分析の目的は、効率化からイノベーションへと変化した」---。データ分析ソフト大手、SAS Institute Japanの辻仁史氏は2014年3月4日、データサイエンティスト・ジャパン2014で登壇し、データサイエンティストという職業が注目されるようになった背景を解説した(写真)。

 冒頭で辻氏は、データ分析の身近な例として、日曜日夜に放送されているテレビ番組「サザエさん」の次週予告に登場するキャラクターを予測する事例を紹介。予測によれば、3月2日の実績がカツオだったので、3月9日の夜にはマスオが登場する。発見したパターンによれば、登場人物の年齢が上がっていって元に戻る、というサイクルを繰り返すという。

 講演では、現在のデータサイエンティストへとつながっていくデータ分析の変遷を、ITとマーケティング手法の歴史を示すことで解説した。大きく、1990年代以前のメインフレーム時代、1990年代のオープン時代、2000年代のインターネット時代、2010年代のビッグデータ分析---の四つに分けて解説した。

かつては入念な分析計画が要求された

 メインフレーム時代のデータ分析の特徴は、コンピュータのリソースをできるだけ使わずに分析することが要求された点である。あらかじめ入念な分析計画を立ててから分析を実施していた。この時代の代表的なデータ分析は、三つの指標で顧客を分析するRFM分析である。1930年代に米国において、通販カタログを送る顧客と送らない顧客を選別するために考案されたという。

 入念な分析計画を立てることで、少ないデータで全体を理解することができる。この例は、コンジョイント分析である。想定されるユーザーに商品プランを見せて、順位を付けてもらう。例えば、旅行プランの選択の決め手として、「のんびりと休養する」といった目的が大きく寄与することなどが分かる。

 この時代に使われていた多変量解析手法群は数多いが、分析するデータの種類に合わせて適切なものを使うべきとした。例えば、コンジョイント分析の基本モデル式は、一見すると回帰分析に似ている。しかし、コンジョイント分析の変数は順位であって、順位の平均をとることは意味がないといった具合だ。