ソフトベンダーのダイナトレックは2009年2月19日、複数の異なるデータベース(DB)を仮想的に統合してDWH(データウエアハウス)を構築するソフトの新版「DynaTrek 4」を発表した。新版ではリッチクライアント技術を採用し、ダッシュボード機能やグラフからデータをドリルダウンする機能を追加した。4月から出荷する。

 DWH製品の多くは、複数のDBからETL(抽出・変換・移行)ツールを介してデータを別のDBに集約して保存する。バッチ形式でデータを集めるので、DWH上のデータは必ずしも最新のデータではない。これに対しDynaTrekは、DBからのデータ集約を検索作業のたびに実施するEII(Enterprise Information Integration)と呼ぶ技術を採用。あらかじめデータを集約して保存しておく作業は発生せず、データは最新のものになる。

 DynaTrekを利用する際は、DynaTrekサーバーをOracle DatabaseやSQL Serverなど複数のDBサーバーと接続する。クライアントが「全事業部の昨日の商品の売り上げを集計したい」などと問い合わせると、DynaTrekは該当するデータを持つ複数のDBに対し、それぞれに適したSQLを自動生成して照会。返ってきたデータを集約してDynaTrekのDBに格納する。データ集計の切り口を保存することも可能で、一般のDWHと同様に利用できる。

 EIIは米国で1990年代から研究されているが、「この方法ではパフォーマンスを保ちながらDBごとに適切なSQLを生成・照会するのが難しかった。このため、DWH用途では専用DBにデータを集約して保存する方式が主流になった」(ダイナトレックの佐伯譲二代表取締役)。だが、2000年ころから「ハードウエアの処理性能が向上したことなどにより、十分なパフォーマンスが得られるようになった」(同)。DynaTrekは1999年の出荷開始以来、経済産業省などの官公庁、製造業や通信など、国内で約40の導入実績があるという

 ただし、利用には注意が必要だ。検索のたびに各DBにSQLを投げるので、データの集計にDBの検索よりも時間がかかることも少なくないという。そのため高速処理に特化したDWH製品よりも処理時間は長くなる。ただ、「一般のDWHにあるデータも集計の対象にできるので、DWHを併用すれば処理時間の問題は解決できる」(同)としている。

 データクレンジングを実施する機能を持っていないため、DBのデータの品質が低い場合は集計作業などで正しい結果が得られない可能性がある。これについても佐伯代表取締役は「汎用的なDWHは100%データの品質がそろわないと利用できず、データ品質の統一に多くの手間がかかる。実際は、それほど品質がそろっていなくても利用できるデータは多い。品質をそろえる必要のあるデータだけを手直しすれば良い」とする。

 価格はオープン価格だが、DBのインスタンスを3つ程度使用する場合で約1000万円。導入にかかる期間は2週間ほどという。佐伯代表取締役は「DWHを小さく始めて、徐々に適用範囲を広げたい企業に向く」と話す。BI(ビジネスインテリジェンス)環境でのDWH用途のほか、アプリケーションのDBとしても利用できる。