テキスト・マイニング・ツール市場が注目を集め始めている。ツール単体のビジネス規模はまだ小さいが,CRM(カスタマ・リレーションシップ管理)などと組み合わせると高度な利用法を提案できるからだ。エンドユーザー部門に食い込む強力な武器にもなる。

図1●テキスト・マイニング・ツールの基本機能。テキスト情報をまとめて分析し,キーワードの登場頻度や,他のキーワードとの組み合わせの多さなどを表示する
名詞だけでなく「おかしい」「不安だ」「買う」などの形容詞や動詞と商品名の相関も分析できる
 「テキスト・マイニング・ツールは,市場アナリストやマーケティング担当者,コールセンター管理者など,エンドユーザー部門の専門家からの関心が非常に高い。システム投資予算の決定権がエンドユーザー部門に移りつつある現在,テキスト・マイニング・ツールを手掛けることはエンドユーザー部門とのパイプ作りに重要だ。CRMの活用提案のカギになる」。日本IBMデータマネジメント・ソリューション推進BIグループの西村弘之氏は同ツールの市場拡大を期待する。

市場参入会社が急増

 テキスト・マイニング・ツールは簡単に言えば,大量のテキスト情報の中から頻度の高い語句を“仕分け”して分類することで,気付きにくいキーワードやその組み合わせを発見するためのツールである。具体的には,文章中に登場する語句を切り分け,ある語句の登場頻度や,他の語句が同じ文章に同時に登場する頻度を調べ,相関の強さを表示する(図1[拡大表示])。

図2●従来の検索系のナレッジ・マネジメント・ツールと異なり,事前に仮説を作ることなく,思いもよらない意見や発想,クレームの発生を検出するのに用いる
(日経システムプロバイダ作成)

 こうした検索機能はナレッジ・マネジメント・ツールにもある。ただし自由文検索の機能が中心で,どんなキーワードで検索すべきかユーザー自身が仮説を立てながら使う必要があった。いわば検索系のナレッジ・マネジメント・ツールに対し,分析系と言えるテキスト・マイニング・ツールは,ユーザーが見過ごしたキーワードを抽出してみせるので,発想支援ツールという性格もある(図2[拡大表示])。

 テキスト・マイニング・ツールが本格的に登場してきたのは99年から。99年10月にコマツソフトが製品化して以降,2000年に富士通,日立製作所,日本IBMなど大手メーカーが相次いで市場に参入。2001年に入ってもジャストシステムやロータス,野村総合研究所,東芝などが製品を売り出した。さらにエス・ピー・エス・エスも自社製データ・マイニング・ツールと,日本語を単語などに分解する(形態素解析)機能を持つフリーソフトを連携させることで,この市場に参入した([拡大表示])。

 先行したコマツソフトは2001年度に130サーバーを販売する見通し。200サーバーを見込む富士通は「(この実績の中には)システム構築の部品として,検索中心の用途で販売した案件を含んでいる。だから2002年1月現在で(純粋に)マイニング用途として販売したのは100サーバー未満」と明かす。その他のベンダー各社の販売実績は十数本~数十本にすぎない。

表●主なテキスト・マイニング・ツールの出荷状況と販売強化策(*は本誌推定)
(日経システムプロバイダ調べ)

 つまり現状ではまだ,一部の専門家が使うニッチなツールの性格が強く,手離れ良く大量に売れるといった市場にはなっていない。ベンダー各社は自前の営業部隊やコンサルティング部門で,提案や販売のノウハウを蓄積しつつある段階だ。

コールセンター関連が先行

 ベンダー各社は(1)他のアプリケーションと組み合わせた提案・構築のパターンを確立する,(2)テキスト・マイニング・ツールの使いこなしを支援する導入支援サービスを提供する体制を整える,の2点に重点を置いて販売強化を図っている。

 他のアプリケーションとの組み合わせでは,ベンダーが考えている分野は主に四つある(図3[拡大表示])。(1)CRM製品と組み合わせて,コールセンターに蓄積した情報を有効活用する,(2)グループウエアの掲示板や営業日報ツールなどに蓄積した社内情報を活用する,(3)データ・ウエアハウスやOLAP(オンライン分析処理)ツールなど,数量的なデータ分析と併用・補完する,(4)インターネット上の掲示板を巡回して情報収集するツールやWebアンケートなどで集めた社外の情報を分析する,といったものだ。

 ベンダー各社の声を総合すると,先行して立ち上がったのは(1)のコールセンター関連の用途である。コールセンターに消費者から寄せられた質問やクレームとその回答事例から,問い合わせの動向を把握しようとすると,これまでは管理者が勘でキーワード検索するしかなかった。だがこの方法では,新製品や新部品の採用に関する問い合わせが“件数はまだ少ないが増えてきた”,というような細かい傾向を見逃す可能性がある。

図3●テキスト・マイニング・ツールを扱うことによって得られるシステム・プロバイダのビジネス・チャンス。
他のアプリケーションをより有効に生かすための付加価値をアピールすることができる
(日経システムプロバイダ作成)

 そこにテキスト・マイニング・ツールを使うと,仕分けされたカテゴリ内の問い合わせ数の増減が把握しやすい。新製品の出荷が進んで問い合わせが爆発的に増える前に,FAQ(よくある質問と回答)を充実させたり,製品の品質を見直すなどの先手を打てるというわけだ。「キヤノンとキヤノン販売はVextSearchを実際にこうした用途で導入・活用している」(コマツソフト)という。

 一方,ロータスは営業日報など社内情報の分析にテキスト・マイニング・ツールを生かす提案を推し進めている。ノーツ・ドミノに蓄積された情報の有効利用が焦点だ。「ノーツ・ドミノのユーザーで複数の文書データベースに分散して情報を蓄積してしまい,検索が難しくなっているケースが多々ある。営業情報であれば,ある顧客へは他チームがもう提案済みだったとか,顧客情報が埋もれていたというようなケースが出てしまう。そういったことを防ぎ,社内情報のポータル・サイトの構築を支援するツールとして提案している」(ロータス)。

 日立製作所も社内情報の横断的な分析用途を開拓している。自社製テキスト・マイニング・ツールを,日立グループの研究テーマの重複をチェックするのに活用し始めているという。「グループ内の論文を電子化してマイニングしてみて,似たようなテーマの研究が重複している例が多くあることが初めて分かってきた」(日立)そうだ。

 商品開発やマーケティング業務への適用にも市場拡大の期待がかかる。例えばノート・パソコンの購入者へのアンケートの分析に適用すると,「液晶」という言葉に対して「ドット」「明るい」「暗い」「綺麗だ」といった言葉がどの程度の相関度で登場するかで,ディスプレイ部品に関する消費者の評価を定量化できる,といった使い方だ。野村総合研究所は「引き合いの中心はコールセンター関連だが,『インターネットの掲示板の情報を分析して商品開発に生かしたい』といったニーズも出ている」という。

使いこなし支援のサービスを整備へ

 これらの用途開拓に向けて,各社は使いこなし方を指導する導入支援サービスの提供体制も整えつつある。雑多な情報から商品開発などに役立つ情報を得るには,分析対象の語句を事前に辞書化して設定したり,特定の用語は排除するよう設定するなどの工夫が必要なケースも多いからだ。例えば「社内の文書データベースで特定の執筆者が突出している場合,分類の見出しが人名になってしまう」(ロータス)。そこでロータスは製品販売時に2カ月間の導入支援サービス(500万円)を必ず一緒に販売するよう,この1月から価格体系を改めた。

 この点でもコマツソフトは先行している。2001年5月に開始した導入コンサルティング・サービスの実績は約10件に達した。コンサルティング期間は通常2~3カ月,1人月当たりの費用は百数十万円だという。日本IBMもコールセンター商談にあたり,テキスト・マイニング・ツールの辞書作りや設定支援で平均2000万円程度のサービス料金を得ているし,ジャストシステムは2002年度に導入・活用支援サービスをメニュー化する方針だ。「『かっこいい』『高級感がある』といった感性による評価をテキスト・マイニングで定量化する方法論を,大学と1年越しで共同研究してきた。こうした成果を反映したサービスにする」(ジャストシステム)と意気込む。

エンドユーザーに食い込む武器に

 ベンダー各社が提案や導入・活用支援体制の整備に追われていることや,一部の専門家の導入にとどまっている状況を反映して,テキスト・マイニング・ツールの間接販売はまだ活発ではない。販売代理店作りに先行し2002年1月現在で14社を抱えているコマツソフトですら,2001年度は直販が6割を占めるという。それでも各社は2002年度に「コールセンターやマーケティング関連にノウハウのあるシステム・プロバイダや調査会社と,協力関係を築いていく」(東芝やコマツソフト,日本IBMなど)と,チャネル作りにも徐々に踏み出す。

 販売規模は一見小さいが,マーケティングや品質管理,商品開発など企業の重要な活動に直結するため「テキスト・マイニング・ツール自体は数百万円でも,CRMと合わせて数千万円規模のコールセンターの構築/再構築商談が進んでいる」(日本IBMの西村氏)。エンドユーザー部門に直接,提案力をアピールして商談を獲得したいシステム・プロバイダが増えれば,市場は急速に拡大するだろう。

(井上 健太郎=日経情報ストラテジー)