写真1●Sybase IQの機能拡張策
写真1●Sybase IQの機能拡張策
[画像のクリックで拡大表示]
写真2●米サイベースのダン・ラール氏
写真2●米サイベースのダン・ラール氏
[画像のクリックで拡大表示]

 サイベースは2012年4月18日、データベースの新版「Sybase IQ 15.4 日本語版」を5月中旬に出荷開始すると発表した。オープンソースの分散処理ソフト「Hadoop」、および統計解析プログラミング言語「R」との連携機能を追加。より大量のデータに対して、複雑な分析をできるようにした。

 カラム型データベースであるSybase IQは、ロー(行)ではなくカラム(列)単位でデータを操作。データウエアハウスにおける高速検索を可能にしている。この特性を生かしながら、Sybase IQは「データ管理」「サービス」「エコ・システム」という3分野で、データ分析機能を拡張している(写真1)。構造化データと非構造化データの共用をバージョン15.2で実現済み。今回、Hadoopとの連携機能を加え、構造化されていないデータに対しても高速処理できるようになった。

 Hadoopの構成要素は、プログラミングモデル「MapReduce」と、分散ストレージ「HDFS」の大きく二つがある。Sybase IQ 15.4は、MapReduceを内部に取り込んだ。ユーザー定義関数(UDF)を使うことで、MapReduceのプログラムを開発することを可能にした。「Sybase IQはシェアード・エブリシング型のDBなので、MapReduceとの相性がよい。また、Hadoopを稼働させたサーバーとの連携では、アプリケーションのニーズに応じて手法を使い分ける必要がある」(米サイベース プロダクトマーケティング担当シニアディレクターのダン・ラール氏、写真2)。

 Hadoopサーバーとの連携では、四つの手法を用意。(1)「クライアントサイド連携」は、米Quest Softwareのツール「Toad」を使い、Sybase IQとHadoopの両方からデータを取り出す。(2)「ETL処理」は、Hadoopで処理した結果をSybase IQに転送する方法で、ETLツールとして米ClouderaのSqoopを使う。(3)「データ連携」は、HDFS上のデータに対して、Sybase IQからクエリーを実行する機能。(4)「クエリー連携」は、HadoopのMapReduceをSybase IQ内のMapReduceやSQL文と組み合わせる手法である。

 R言語からは、RJDBCインタフェースを介して、Sybase IQのデータを分析する。そのほか、ODBC/JDBCドライバを改善することで、Sybase IQに対する大量データのロード処理を高速化した。価格は従来同様で、「Sybase IQ Small Business Edition」が840万円/チップから、「Sybase IQ Enterprise Edition」が1008万円/コアなどである。