大規模データも活用しなければ負債である

 電子商取引では、顧客の購買行動データをサービスを介して大規模に収集できる。このような顧客行動データの大規模収集は、サービス・イノベーションの基盤であり、ウェブ上ではない実店舗での購買行動でも、会員カード番号と連結されたPOS(販売時点情報管理)データとして収集されている。

 米ナイキ(Nike)が提供しているシューズに加速度センサーを仕込んでiPodと連携して走行距離を管理するサービスでも、同社製品を買った顧客がどの程度それを使用しているのかのデータを収集していることになる。ここで、大事なことは、大規模データを収集し蓄積するだけでは、単に負債を増やしているにすぎないということだ。これを次のサービス設計に活用する仕組みを持たなければ、大規模データの管理コストや漏洩リスクを抱え込んでいるだけだ。

 大規模に収集、蓄積したデータの活用としては、米アマゾン(amazon)などが行っている「顧客の行動履歴に応じた商品推奨」が最も典型的なものだ。これは「協調フィルタリング」という技術に基づくものと言われている。

 自分が過去に購入した書籍と、他者が過去に購入した書籍のマッチングを図り、そのうえで、自分によく似た購買行動をする他者が、自分が購入していないどのような書籍を買っているかを見つけ出して提示する方法だ。この技術では、商品推奨をするコンピュータが書籍の内容や顧客の特性を符号的に理解しているわけではない。あくまでも類似したパターンを検索して処理しているにすぎない。単純な方法ではあるが、それゆえに、汎用性が高い。

 一方で、筆者には、専門書を買おうと思ったらマンガの本を薦められたという経験が何度もある。簡単な理屈だが、以前にamazonでマンガの本を買ったことがあるからだ。専門書を購入する状況の筆者と、のんきにマンガの本を買う状況の筆者がいて、どちらも同じ個人だ。1人の人間でも、状況や環境に応じていろいろな特性になる場合がある。「十人十色」ならぬ「一人十色」だ。

 残念ながら、協調フィルタリングではこのような状況への対応が十分ではない。だから、専門書を探す筆者にしつこくマンガの本を薦めるのだ。そこで、筆者らは、経済産業省から受託している「サービス工学研究開発事業」において、より深く利用者を理解し、状況に応じてサービス利用者の行動を予測するための技術として「ベイジアンネットワーク」の応用技術を研究している。

ベイジアンネットワーク

 「サービス工学研究開発事業」のプロジェクトメンバーである本村陽一氏が中心になり、このベイジアンネットワークそのものと、その応用技術開発を進めている。ベイジアンネットワークは、統計的なモデリング手法の1つだ。極論を言えば、線形回帰もニューラルネットワークも同類と言うことになる。これらは、大規模データの持つ特性を数学的な法則にあてはめて、その特性を表すいくつかの変量を、データから学習するという方法論だ。

 線形回帰であれば、大規模なデータの間には直線的な関係があると仮定して、直線の数式を当てはめる。そうなると特性を表す変量は劇的に少なくなり、それらをデータから学習して決定する。モデルを当てはめているので、その数式を使って予測推論もできる。ニューラルネットワークではデータの関係が非線形でも対応できるようになり、ベイジアンネットワークでは、同一の説明変数に対して、従属変数の状態が2つに分かれてしまうような場合でも対応できるようになる。

図1●3つの統計的なモデリング手法
図1●3つの統計的なモデリング手法
[画像のクリックで拡大表示]

 ベイジアンネットワークは、ベイス確率を用い、モデルの仮説(直線的な関係があるなど)を持たずに現象をモデル化する方法論だ。線形回帰のように連続変数を対象にするのではなく、通常、カテゴリー変数を解析対象とする。

 例えば、購入金額という数値の変数を直接計算するのではなく、購入金額が低い、中程度、高いの3つのカテゴリーに分け、それぞれのカテゴリーの発生頻度データを計算対象にする。カテゴリーが発生する確率をモデルの変量としてデータから学習することになる。その結果、例えば顧客属性が「男性」というカテゴリーで、書籍属性が「専門書」というカテゴリーのとき、購入金額属性が「高い」となる確率がモデル化され、推論できるようになる。

 ただし、この学習には、通常、数千件のデータが必要になる。カテゴリー変数が多く、構造が複雑になればそれだけ多くの学習データを必要とする。まさしく、大規模データが収集、蓄積できる時代になってはじめて、役に立つ技術だ。ベイジアンネットワークの詳細については、本村氏の書籍を参照されたい(*)。

※参考書籍:本村 陽一、 岩崎 弘利「ベイジアンネットワーク技術 ユーザ・顧客のモデル化と不確実性推論」 東京電機大学出版局 2006年