画面1●Event Horizonのコマンドライン画面の例(出典:バンクラックジャパン)
画面1●Event Horizonのコマンドライン画面の例(出典:バンクラックジャパン)
[画像のクリックで拡大表示]
画面2●Event Horizonのコマンドライン生成ウィザードの画面
画面2●Event Horizonのコマンドライン生成ウィザードの画面
[画像のクリックで拡大表示]

 バンクラックジャパンは2014年10月3日、Windowsのコマンドプロンプトで利用できるビッグデータ分析用途のコマンド群「Event Horizon」(画面1)を発表した。テキストファイルを対象に、検索インデックスを用いて高速検索する。大容量のCSVデータから所望のデータを抽出したり、並べ替えたりといった処理を高速に実行できる。価格(税別)は50万円からで、10月14日に発売する。

 Event Horizonは、大容量データの分析処理をWindowsのバッチファイルで実行できるようにするコマンド群である。検索/抽出、ソート、文字列置換、ファイル操作などを行うための汎用コマンドを全部で32個提供する。これらを組み合わせることによって、大抵のデータ分析処理ができるとしている。Windows XP以降のコマンドプロンプトで動作する。32個のコマンドは、いずれもC言語で開発されており、外部の共有ライブラリーなどは使わない。

 最大の特徴は、高速に検索できることである。普通のパソコンでも、秒速で1億件(テラバイト級)のデータ検索が可能としている。同社が公開しているデモンストレーション動画では、1億1800万件(202Gバイト)のCSVデータからデータを12秒で抽出している。高速検索の仕組みの一つは、元データであるテキストファイル(CSV)を対象に検索インデックスを作成し、インデックスを用いて検索できること。このほか、ファイルをメモリー空間にマッピングすることによってI/O性能を高めるメモリーマップトファイルの仕組みも採用している。