米SAS Instituteが米国時間1月21日に,同社のデータ・マイニング機能のスイートにテキスト・マイニング機能を加えた「SAS Text Miner」を発表した。出荷は2002年中旬を予定している。

 同製品は,コール・センターからの報告,医療記録,顧客からの電子メールなどさまざまなテキスト・ドキュメントからデータの発見と抽出を行うための豊富なツール群を提供する。

 たとえば,次のような利用方法がある。

・分析的な顧客関係管理(CRM)プログラムを実装する企業は,同製品により,顧客から送られる大量の電子メールを分類して迅速にフォローアップが可能

・人事部は,企業の求人に対して適切な資格を保有する応募者を,数千の履歴書と応募から選び出せる。また調査に対するフリーフォームの回答の分析により,傾向を認識して管理に有用な結果を作成

 同製品は,「SAS(R) Enterprise Miner」のプロセス・フロー内に完全なテキストの前処理機能を提供することにより,他のテキスト・データ・マイニング製品より1歩進んでいる。ユーザーは統一性のないテキスト・データを,例えば年齢,所得,購入パターンなど既存の組織化されたデータと統合して,全体的にデータ・マイニングするためのプロセスを強化できる。

 また,カスタマイズ可能な辞書が,英語,仏語,独語て提供され,すべてのASCIIベースの言語向けに間接的なサポートも提供される。データベース,ファイル・システム,さらにはWWWの徘徊などによるさまざまな形式のテキスト・ベースのドキュメントにアクセスできる。

 同製品の機能に関して,米Compaq Computer社がいくつかのテストを実施した。その1つとして,同社に宛てられた電子メールや電話販売員などからのフリー形式のテキスト,2.5Gバイト以上を分析するテストを行った。これまでは,このような覚え書きを含めたデータを有効な方法で報告することができなかった。しかし,テキスト・マイニングを通じて,自動的に意味を持つグループに分類でき,販売サイクルにおいて,どの製品がどんな顧客に役立っているかを判断するための材料にすることができるようになったという。

 またSAS Instituteと米Inxight社が同日,このテキスト・マイニング技術に関して提携関係に入ったことを発表している。提携のもと,Inxight社の単語,フレーズ,文章を分析する自然言語のテキスト分析を行う「LinguistX Platform」,ドキュメントから企業名,製品,人名,住所,日付などのコンテンツを検索して抽出するソフトウエア「Thing Finder」を「Text Miner」に加えてテキスト分析機能を強化して,市場への投入を早めることを狙うという。

◎関連記事
SAS,データ分析ツールの新版を発表
「データ分析の敷居を低くする」,SASが支援ソフト投入
SAS,大規模サイト向けのログ統計分析ソフトを夏に発売
経営者のためのキーワード 3分間講座,テキスト・マイニング
米ピープルソフトが分析系アプリケーション群を発表

発表資料へ