写真1●レッドハットで製品・ソリューション事業統括本部ミドルウエア事業部長を務める岡下浩明氏
写真1●レッドハットで製品・ソリューション事業統括本部ミドルウエア事業部長を務める岡下浩明氏
[画像のクリックで拡大表示]
写真2●Red Hat JBoss Data Virtualization 6の設計画面
写真2●Red Hat JBoss Data Virtualization 6の設計画面
[画像のクリックで拡大表示]

 レッドハットは2014年2月20日、複数のデータベースを統合して単一のビューでアクセスできるようにする“データ仮想化”ソフト「Red Hat JBoss Data Virtualization 6」を発表(写真1)、同日提供を開始した。既存のETL/データ統合ソフトがバッチ処理でデータを抽出/ロードするのに対し、データ仮想化ソフトは仮想的なビューを仲介してデータソースに直接アクセスする。価格(税別)は、サブスクリプション(購読)ライセンス方式をとり、16コアで年額468万円から。販売目標は、2014年に50社。

 JBoss Data Virtualizationは、背後にある複数のデータソースを仮想的に統合する単一のビューを提供する、データ仮想化ソフトである(写真2)。BI(ビジネスインテリジェンス)ソフトからは、JBoss Data VirtualizationがSQLデータベースに見える。JDBC/ODBCやWeb APIを介してアクセスする。JBoss Data Virtualizationは、クライアントからのSQLの問い合わせを個々のデータソースに合わせて変換/仲介し、これらの検索結果を統合する。個々のデータソースに接続するためのアダプターを用意している。

 ETLベースのデータ統合ソフトとの違いは、データソース以外にはデータの実体を持たず、ビューを仲介して背後のデータソースにリアルタイムにアクセスすることである。高速化のためにキャッシュを利用する。これに対してETLでは、バッチ処理によっていったんデータソースからデータを抽出/変換し、データ統合のために別途用意したデータベースに格納する。

 ETLと比べてメリットが多いという。例えば、業務部門が要求するデータを提供できるようにするまでの導入/設計期間が、ETLよりも短くて済む。「紀陽銀行の例では、約100個のデータソースを2.5カ月で統合した」(同社)という。また、データを抽出してコピーする必要がないことから、データの品質が向上する。JBoss Data Virtualizationだけでビューを提供できるので、複数のデータ統合ソフトを組み合わせる必要もない。