アシストは2011年7月14日、大量データの集計やETL(Extract/Transform/Load)のデータ変換などを高速に実行するデータ加工ソフト「Syncsort DMExpress」の新バージョン6.8を販売開始した。新版では、大量データ時の処理性能を高めたほか、各種のユーティリティを追加して使い勝手を高めた。価格は、2コアの最小構成時に200万円(税別)から。開発会社は、米Syncsort。

 Syncsort DMExpressは、データ加工ソフトである。DWH(データウエアハウス)のETLにおけるデータ変換処理や、大量データのソート/集計/結合バッチ処理などに利用する。処理速度の高さをうたっており、ETLのベンチマークテストにおいて、5.65Tバイトの生データを1.6Gバイト/秒で抽出、変換、ロードしたとしている。

 ファイルやDB接続、標準入出力などを介してデータを入力し、加工して出力する。単独で動作するほか、外部のETLツールと組み合わせて利用したり、バッチ・ジョブ管理ソフトなどから呼び出して利用することができる。

 ソフトウエアは、データ加工処理を実行するエンジン「DMExpress Server」(実行環境)と、データ加工処理をGUIで開発してテスト実行するクライアント「DMExpress Workstation」(開発環境)で構成する。DMExpress Serverは、Windows ServerやLinux、各種UNIXなどで動作する。DMExpress Workstationは、Windows 2000/XP以降で動作する。

 新版では、大量データの加工性能を高めた。詳細は不明だが、入力データ量が12Gバイトを超えた場合に、これまでとは異なるアルゴリズムを適用することによって、ソート/集計/結合にかかる時間を短縮した。また、処理時間を短縮する工夫として、ファイルやテーブルの値を参照して必要なデータを抽出するLookup関数を追加した。入力データが少量で、参照先DBのレコード件数が多い場合に、同関数を使うことによって従来の結合処理よりも処理時間が短くなる場合があるという。

 新版ではまた、DMExpressのジョブ/タスクの定義ファイル同士を比較して差分を標準出力に出力するユーティリティや、定義ファイルを一括して更新するユーティリティを追加するなど、使い勝手を高めた。従来版では、定義の差異は、ジョブ/タスクを開いて目視で確認するしかなかった。また、ほかのETLツールから変換定義のメタデータを取り込んで、DMExpressの定義の一部を自動生成できるようにした。