“情報爆発”の時代を迎え、企業の情報活用戦略は、企業経営に影響を与えるであろう“兆し”、すなわち「パターン」を積極的に見つけ出し、来るべき変化に備える「PBS(パターン・ベース・ストラテジー)」にあると、第1回で指摘した。パターンの探索には、変化のパターンを特定して機会またはリスクを示すための、新たな規律とテクノロジーが必要になる。

 企業がパターンを有効活用するには、変化のパターンに対して、一貫して繰り返し可能な対応を取れるようにするための、規律とテクノロジーが必要である。そのため、情報に含まれるパターンを探索および理解するための、効率的かつ効果的な一連のツールやテクノロジーに対するニーズが高まっている。

 新規あるいは既存のテクノロジーの中で、パターン抽出のためのテクノロジーとして、データマイニングと予測分析が利用できる。いずれも成熟したテクノロジーと手法に基づいているものの、この分野では最近、数学的な面で進化が見られる。既存の手法においても、そのバリエーションが増えている。

 BI(ビジネスインテリジェンス)プラットフォームについて、最近実施したユーザー調査に基づくガートナーの推定では、データマイニングと予測分析の手法を利用しているのは、BIに取り組んでいる企業のわずか3分の1にすぎない。大半の利用企業においては、どのテクノロジーを利用すればパターンマイニングにかかわるどの問題を解決できるのかを、十分には理解していないことになる。

 結果、データマイニングと予測分析のプロジェクトは「確実なもの」ではない。多くの企業において、適切な手法と方法論を効果的に利用できる成熟段階に至るのはこれからだ。以下では、主なテクノロジーの概要とその利用対象について説明する。

パターン抽出で再注目されるデータマイニング

 パターン抽出のためのテクノロジーとして再注目されているのが、大規模な情報セットからパターンを抽出するデータマイニングだ。データマイニング・システムは、対象とするデータベースの種類、マイニング対象の知識の種類、使用する手法など様々だ。だが、大きくは、記述的データマイニングと予測的データマイニング (予測分析とも呼ぶ) に分類される。

 記述的データマイニングのタスクでは、情報セットに含まれる一般的特性/属性および関係の特徴を明らかにする。一方の予測分析では、現在の情報セットで推測を行い、将来の情報セットを予測するために使用するモデルを作成する。

 データマイニング・テクノロジと予測分析テクノロジーは、非常に重要な次の二つのパターン探索機能を提供する。

(1)関係の自動検出:データマイニング・ツールは、データベース内を検索し、それまで隠れていたパターンを特定できる。特徴付け、セグメンテーション、比較、識別といった手法を使い、関係を検出することで得られた洞察は、記述的モデルの作成につながる。

 パターンおよび関係の検出における課題の例としては、一見無関係でありながら、しばしば一緒に購入される製品を特定するための小売業における売り上げデータの分析の例は、誰もが耳にしたことがあるだろう。最近では、不正なクレジットカード取引の検出や、データ入力の打ち込みエラーを表している可能性のある異常データの特定などにも適用されている。

(2)動向および行動の自動予測:ルールおよびモデル駆動型であり、分類や予測モデリングの手法に基づいている。

 予測上の課題の例としては、ターゲットマーケティング、破産やほかの形態での債務不履行の予測、特定の出来事に同じように反応すると思われるグループの特定が挙げられる。使用される手法は、非常に単純なモデル から非常に複雑なモデルまで様々だ。単純なモデルの例が算術平均、中程度に複雑なモデルの例には、線形回帰やクラスタリング、決定木が、非常に複雑なモデルの例には、ニューラルネットワークがある。