前回の第3回では、B to Cビジネスにおいて、トラブルの予兆管理が不可欠な課題になってきたことと、予兆発見のヒントについて解説した。さらに予兆発見のヒントとして、(1)予兆を補足するキーワードは事前に設定できない、(2)「類似する意見が複数あること」が予兆の手かかりになる、(3)複数の類似意見があるだけでなく、時系列で急増していることを示せれば、「おかしい!」と気づける可能性が増える――の3点を説明した。

 今回は、テキストマイニングツールのどんな機能をどう活用すれば、予兆管理が現実になるのかを解説していく。

 予兆の発見は、テキストマイニングの分野では古くから取り組まれてきた課題である。ただし、ツールが普及し始めたおよそ10年前に提案された活用法はこのようなものだった。

(a)あらかじめ「発熱」「煙」「爆発」などの危険性を示す用語に見当をつけて検索語とする

(b)単語の出現頻度で、急増するものを抽出する

 もちろん方法(a)では、予兆を抽出できない。この方法は、過去にあった事象を見つけるだけであり、実務で役に立つことはほとんどない。

 方法(b)は、一見良さそうだが、予兆に関連する単語の出現頻度はまだ低く、抽出結果を見てもその他大勢の単語の情報に埋もれてしまうことがほとんどだ。突出して目立つ傾向を示していれば気づくことは可能だが、その際には既に問題がかなり表面化してしまっている可能性が高い。

類似話題の自動抽出機能を使う

 そこで上記の議論を踏まえた予兆の発見手法のフローを、(図1)に示す。本手法は、予兆の候補を抽出するものであって、最終的に予兆として取り上げるか否かは人の判断に負う。しかし、候補を抽出する精度を上げる工夫を凝らしてある。

図1●予兆発見手法のフロー
図1●予兆発見手法のフロー
出所:クオリカ
[画像のクリックで拡大表示]