エンタープライズ・サーチ製品の選択に当たってはライセンス体系に気を配っておきたい。検索対象の文書数,サーバー/CPU数など、個別の製品によって体系は大きく異なる。さらに製品の使い方次第では導入コストが大幅に違ってくるので注意が必要だ。

 製品選択に際しては,ライセンス体系も押さえておきたい。製品価格がサーバー台数で決まるもの,対象文書数で決まるものなど,ライセンス体系は様々である。例えば法律事務所のように文書数は膨大だが利用者数が数人というようなケースでは,サーバー・ライセンスが有利。逆に文書数が少なく利用者が多い場合は,文書数に応じて段階的に価格が変わる方が無駄な費用を払わずに済む。

 特徴的なライセンス体系を持つのがウチダスペクトラム。ユーザー数と文書数,または同時利用ユーザー数とインデックス容量に応じて年次利用で課金する。「導入初年度に共通費で導入し,効果を見定めつつ次年度から部門の予算で順次拡大していくようなユーザーを意識したライセンス体系」(町田潔社長)となっている。

 「容量」で価格が決まる製品もある。例えば文書から抽出したテキストの容量である。数Mバイトのパワーポイント形式(.ppt)のファイルであっても,インデックス・データベースに格納するテキスト成分の容量は数Kバイト程度に過ぎない。住友電工情報システムの製品では10Gバイト,30Gバイト,1Tバイトとテキスト容量で価格が変わる。文書数に換算すると1000万件,3000万件,10億件程度になる。

 総じて文書の数が多い場合は,検索対象に含める文書を導入前に整理する作業も費用の削減に効果がある。拡張子やフォルダ,サーバー単位でリストアップしておけば,無駄なファイルをインデックスに格納するコストを減らせる。製品によっては,価格の安い下位版を選択する余地が生まれる。「文書を整理する手間をかけたくないから導入する」(複数のベンダー)という場合は,アプライアンス型の製品や下位版の製品を導入して,サーバーやフォルダごとにファイルを検索,重複や古さの目立つ文書を見つけて整理したうえで本格導入する手もある。

デスクトップ検索との連携は双方向で

 文書ファイルをはじめとする情報があふれかえっているのは,サーバーだけではない。個々人のパソコンにも数多くのデータがある。最近のパソコンは標準で数十Gバイトのハードディスクを搭載しており,データの量は増える一方。当然,サーバーだけでなくパソコンの中にあるデータも検索したいというニーズが出てくる。

 こうしたニーズに応えるツールが「デスクトップ検索」製品である。2005年に米グーグルの「Googleデスクトップ」,米マイクロソフトの「Windowsデスクトップサーチ」など無償で利用できる製品が登場すると,一気に利用が進んだ。Windowsデスクトップサーチは,Windows VistaではOSの標準機能となっている。

 例えばいくつかのエンタープライズ・サーチ製品のベンダーは,別製品としてデスクトップ検索ツールを提供している。グーグルの「Goolge検索アプライアンス」や「Google Mini」は,デスクトップ検索の画面にエンタープライズ・サーチの検索結果をマージすることができる。英オートノミーは,デスクトップ検索専用のクライアント・アプリケーション「IDOLデスクトップ」を提供している。IDOLデスクトップからは,ローカルとリモートを区別することなく横断検索できる(写真A)。Windowsデスクトップサーチも,SharePoint Serverのクライアントとして動作する。

 一方,Googleデスクトップなどのデスクトップ検索ツールのAPIを呼び出せるエンタープライズ・サーチ製品もある。GoogleデスクトップはAPIが公開されているため,こうした連携機能の作り込みは比較的容易である。代表例はオラクルの「Oracle Secure Enterprise Search」。エンタープライズ・サーチのエンジンが,サーバーの検索結果にデスクトップ検索の結果を統合して一つの画面に表示する。

写真A●デスクトップ検索製品との連携でローカルと社内ネットワークを横断検索
写真A●デスクトップ検索製品との連携でローカルと社内ネットワークを横断検索
オートノミーが日本語化中のデスクトップ検索製品。