東京大学生産技術研究所喜連川研究室がオープンソースソフトウエア(OSS)の地理空間データベース(DB)「PostGIS」に、喜連川優教授の研究チームが開発した「非順序型実行原理に基づく超高速DBエンジン技術」を実装し、従来に比べて処理速度を100倍以上高速化した。2014年7月9日に東京都内で開催する「FIRST喜連川プロジェクトの報告とビッグデータの今後に関するシンポジウム」で詳細を発表する。

 PostGISはOSSのリレーショナルDBである「PostgreSQL」をベースにした地理空間DBである。PostGISに対して、非順序(アウト・オブ・オーダー)型実行原理に基づく超高速DBエンジン技術(非順序型DBエンジン技術)を適用することで、地図上の特定エリアにターゲットを絞って解析を行うようなクエリー処理が、従来に比べて100倍以上高速化したという。9日に開催するシンポジウムでは「渋谷にいる人たちがこの先12時間でどこに移動するかをすべてトラッキングするといったデモを披露する予定」(喜連川教授)だ。

 非順序型DBエンジン技術は、内閣府最先端研究開発支援プログラム(FIRST)の「超巨大データベース時代に向けた最高速データベースエンジンの開発と当該エンジンを核とする戦略的社会サービスの実証・評価(中心研究者は喜連川教授)」の中で開発している。データ入出力要求の発生順序とは無関係な順序で、非同期にデータを処理することで、DB性能が大幅に向上するとする。同技術は既に日立製作所の超高速DB「Hitachi Advanced Data Binder プラットフォーム」に採用されている。東大と日立は2014年6月、両者が開発するDBエンジンが従来型DBに比べて約1000倍の処理性能を達成したと発表している(関連記事)。

 喜連川研究室では非順序型DBエンジン技術のOSSへの実装も進めている。既にPostgreSQLへの実装も行っており、今回はその対象をPostGISにも広げた。喜連川教授は、「地理空間DBで使用するデータ構造である『R-tree』は、一般的な『B-tree』と比較して実装が難しい。またR-treeを採用するDBを逐次的に動作させると非常に遅くなることが知られている。R-treeを使いながら高速化を実現した今回の研究は他に類を見ないものだ」と説明する。

 喜連川研究室では、PostgreSQLやPostGISに非順序型DBエンジン技術を実装した成果について、OSSコミュニティへ貢献することなどを検討中。具体的な内容については、2014年秋以降に公表するとしている。