学校法人の慶應義塾は4月中をメドに、Webページや電子メール、Wordファイル、データベースに格納されたデータなど、様々な電子データを検索できる「デジタルドキュメント共有システム」を稼働させる。このシステムは、ある単語を検索にかけると、その単語に関連の深いキーワードを検索結果と共に表示する「関連語検索」機能を備え、探したい文書を見つけやすくした。

 デジタルドキュメント共有システムは、日本IBMの「WebSphere Information Integrator Omnifind Edition」を採用。同製品が備える「UIMA(UnstructuredInformation Management Architecture」という技術を使って構築した。UIMAは、電子メールやWordファイルなど複数の非構造化データから、検索対象の単語に関連の深いキーワードを抽出するためのインタフェースで、今年1月に日本IBMがオープンソース化している。

 UIMAの技術を使った検索システムの構築は日本初。慶應義塾が2004年に設立したデジタルメディア・コンテンツ統合研究機構がシステムを企画・開発した。