大規模リアルタイム解析エンジンJubatusの創り方

Preferred Infrastructure、熊崎宏樹／小田哲＝NTT

2014.06.27

　NTT PF研（現ソフトウェアイノベーションセンタ SIC）と株式会社Preferred Infrastructure（PFI）は2011年に大規模リアルタイム解析エンジンJubatusをオープンソースソフトウェア（OSS）として公開し，現在様々なビッグデータ活用の現場での利用検証を進めている．本稿ではJubatusの公開までの経緯，及びその過程でどのような試行錯誤，判断があったかについて述べる．特にJubatusはリアルタイム，分散並列，そして深い解析という三つの目標をまず掲げ，その実現に向けて様々な試行錯誤を行った．この目標を実現する際に，どのような選択肢があり現在の構成を採用していったかについて述べる．また，Jubatusは異なる強みを持った複数の企業が共同で企画／研究／開発を行い，その成果をOSSとして公開するという新しい研究開発の形をとって開発されている．こうした連携の背景や，そのメリットなどについて言及する．

1. Jubatus開発の背景

　Jubatus（ユバタス）はNTTソフトウェアイノベーションセンタ（以下NTT SIC）とPreferred Infrastructure（以下PFI）が2011年より研究開発を開始し，2011年10月よりOSS（オープンソースソフトウェア）として公開[1]，その後も開発を継続しているプロジェクトである．