米IBMは,文書や構造化されていないコンテンツ・ソース内のテキスト処理を向上させる技術「Unstructured Information Management Architecture(UIMA)」をオープンソース化する計画を米国時間8月8日に発表した。同技術は,非構造化データに含まれるテキストを分析して,潜在的な意味,関係,関連のある事実の発見を狙うもの。

 UIMAは,オンライン技術リソース・ネットワークのOpen Source Technology Group(OSTG)が運営するオープンソース開発サイトのSourceForgeを通じて2005年末までに公開される予定。

 同社によれば,企業内やインターネット上には,文書,画像,コメント,メモ,電子メールや,ビデオ,オーディオといったリッチメディアなど,構造化されていない情報が急増している。しかし,これらの異なる形態のデータを検索する技術は存在していない。

 UIMAは,IBM社の研究所と米国防省の国防高等研究事業局(DARPA)が4年前から共同で研究開発を進めてきた技術。標準的なインターフェイスを採用したオープンソースのフレームワークであり,非構造化データの分析機能を異なるベンダーが提供する業務アプリケーションに組み込める。また,新しい再利用可能な分析ソフトウエア・コンポーネントの作成を促進するツールも提供する。

 UIMAフレームワークは,すでに「IBM WebSphere Information Integrator OmniFind Edition」,「IBM WebSphere Portal Server」,「Lotus Work Place」といったIBM社製品に組み込まれている。

 UIMAフレームワークは,現在同社の技術情報サイト「IBM AlphaWorks」から無償でダウンロードすることができる。

◎関連記事
米Apple,Safariのフレームワーク「Webkit」をオープンソース化
米IBMがコンテンツ管理ソフトの新版を発表,XML処理機能を強化
米Siebel,ビジネス・アプリ強化に向けノルウェーFAST/米Intel/米IBMと提携
「Linuxの台頭がSolarisオープンソース化の動機」,サン纐纈氏
米Black DuckがSourceForge.netと提携,顧客が同サイトの情報を利用可能に

発表資料へ