プリファードインフラストラクチャー(PFI)は2013年5月20日、リアルタイム処理を重視したビッグデータ分析ソフトウエア「Sedue for BigData」を発表した。1秒当たり数千~数万件送られてくるデータに対してリアルタイムでインデックスを作成し、データに対する分析を可能にする。最小構成価格は3000万円からで、6月20日に発売する。

 PFIが今回発表したSedue for BigDataは、同社が従来から販売する検索ソフト「Sedue」をベースに様々な機能を追加した新製品となる。Sedueは今後も販売する。検索ソフトのSedueが、ドキュメント検索を対象とした製品であるのに対して、「Sedue for BigDataは、サーバーのログデータやセンサーデータなど、流れるようにやってくるデータを収集して、インデックスを作成し、すぐに分析できるようにする」(PFIの西川徹社長)ことを対象にした製品である。

 大量データを分析するための製品としては、分散バッチ処理ソフトの「Hadoop」があるが、Hadoopが蓄積データをバッチ処理するのに対して、Sedue for BigDataはサーバーに送られてきたばかりのデータに対してインデックス処理を行い、分析可能にする。SSD(ソリッド・ステート・ドライブ)に最適化することで、大量データに対する高速なインデックス処理を行うという技術は、PFIが独自に開発した。

 またリアルタイム処理をうたう製品としては、「CEP(複合イベント処理)」や「ストリーム処理」などの製品群があるが、Sedue for BigDataはそれらとも用途が異なる。CEPやストリーム処理は、送られてきたデータを事前に設定したパターンやルールとを照らし合わせるというもの。それに対してSedue for BigDataはその時点のデータだけでなく、過去に送られてきたデータも含めて分析できる。

 Sedue for BigDataは、PFIがNTTと共同開発する大規模分散機械学習フレームワーク「Jubatus」とも連携可能であるほか、分析結果をリアルタイムに可視化するユーザーインターフェースなどを備えている。