住友電工情報システム(ブース番号4130)は、2月4日から千葉市・幕張メッセで開催中の「NET&COM 2004」に類似情報検索システム「QuickSolution」の大容量モデルを展示した。CPUがPentium4 2.4GHz、メモリーは4ギガバイト、ハードディスクが1テラバイトのシステム環境で、300ギガバイトのテキスト・データを約3秒で検索できるという。膨大なメールのログを持っている企業や、Webサイトに掲載している情報の全文検索を可能にしたいサイト運営者などに売り込む。

 QuickSolutionは、テキスト一致だけでなく検索文に近い情報を検索するためのソフト。どの語句がどの文書に含まれているかという索引(インデックス)を、単純にある文字列と、それが含まれる文書IDの対応表である転置ファイルにしたことで、メモリーの使用量を抑えた。同時に、頻繁に使われるインデックスだけをメモリー上に展開するといった工夫により、同社の従来製品と比べおよそ100倍の容量を高速に扱えるようになったという。

 これまでQuickSolutionは「Suffix Array」という方式でインデックスを作成していた。検索速度を高めるために、一定の長さの文字列が出現する文書と、その位置をポインタ情報として保持するため、インデックスのデータ量が増え膨大な文書を扱うのが難しかった。

 QuickSolution大容量モデルの価格は1サーバー当たり500万円。従来製品も、比較的小規模なファイルサーバー向けに販売を継続する。

(八木 玲子=日経バイト)