画面●Syncsort DMExpressの画面(ジョブ設計画面)
画面●Syncsort DMExpressの画面(ジョブ設計画面)
[画像のクリックで拡大表示]

 アシストは2014年12月16日、大量データの集計やETL(Extract/Transform/Load)のデータ変換などを高速に実行するデータ加工ソフト「Syncsort DMExpress」(画面)の新バージョン7.15を発表、同日提供を開始した。新版では、VerticaやGreenplumなどのDWH(データウエアハウス)にデータを高速にロード(登録)できるようにするなど、いくつかの機能を強化した。開発会社は、米Syncsort。

 Syncsort DMExpressは、処理性能の高さをうたうETL(抽出/変換/登録)ソフトである(関連記事:アシスト、大量データ時の処理性能を高めたデータ加工/集計ソフト)。各種のDBMS(データベース管理システム)や、ファイル/標準入出力などを介して、データを入出力する。DWHにデータをロードする際のデータ変換処理や、大量データのソート/集計/結合バッチ処理などに利用する。ETLの中核機能であるデータ変換に注力しており、スケジュール機能などの上位機能を使いたいときのために、外部のETLソフトやバッチジョブ管理ソフトから呼び出して使えるようにしている。

 ETLエンジンとして、高速に動作することを追求したとしている。例えば、Syncsort DMExpressの実行環境(CPUコア数やメモリー容量など)や入出力データのサイズなどに応じて、処理の並列化や処理アルゴリズムなどを自動的に調節する。ソート(並べ替え)の処理だけでも30種類以上のアルゴリズムを用意しており、状況に応じて最も適したものを使うという。

DWHへのロードを高速化、データ接続先も増強

 新版ではまず、DWH接続機能を強化し、データのロードを高速化した。「HP Vertica AnalyticsPlatform」への接続機能と、「Pivotal Greenplum Database」への接続機能をそれぞれ強化し、並列処理などによって高速化したとしている。

 データの入出力先も増やした。例えば、汎用的なDB接続手段として、ODBC接続に加えてJDBC接続できるようにした。また、DataConnector Java APIに準拠した任意のサードパーティー製データ接続製品を介してデータにアクセスできるようにした。さらに、BI(ビジネスインテリジェンス)ソフトのTableauのデータ形式で出力できるようにした。Hadoopの上位層ソフトでSQLが使えるApache Hiveのテーブルへのデータ入出力もできるようにした。

 ジョブ/タスク関連の機能も強化した。例えば、ジョブ/タスクを、これまでのGUI定義だけでなくテキスト形式で定義できるようにした(DTI機能)。これにより、データベース接続や関数などのGUIでなければ開発できなかったジョブ/タスクの全てをテキストで定義できるようになった。また、JSONリーダータスクにおいて、JSON形式ファイルを読み込んでCSV形式に変換して出力できるようにした。

中小企業向けOracleサーバーに特化した廉価ライセンスも用意

 Syncsort DMExpressの価格(税別、以下同)は、1コアの最小構成時に147万8400円から。また、データベースの移行時などにスポット的に利用可能なレンタルライセンスも用意しており、価格は2コアで月額38万円から。

 なお、Syncsort DMExpressには、データ登録先を中小企業向けのデータベースサーバー機である「Oracle Database Appliance」(ODA)に限定することで価格を抑えたライセンス「Batch Turbo Option for Oracle Database Appliance」がある(関連記事:アシスト、中小向けDB専用機の集計バッチを簡単に高速化するソフトを出荷)。

 また、スポット利用のレンタルサービスにも、既存のDBMSからODAにデータを移行する使い方に限定した廉価版ライセンス「超高速データ移行オプション for Oracle Database Appliance」がある(関連記事:中小向けOracle DB専用機にデータ移行ソフトを1カ月単位で提供)。