図1●リファレンス資料の一部(性能結果のまとめ)
図1●リファレンス資料の一部(性能結果のまとめ)
(提供:NEC)
[画像のクリックで拡大表示]
図2●リファレンス資料の一部(Sparkのチューニング内容)
図2●リファレンス資料の一部(Sparkのチューニング内容)
(提供:NEC)
[画像のクリックで拡大表示]

 NECは2016年2月25日、ビッグデータの可視化に適したシステム構成と性能検証結果をまとめたリファレンス資料「ビッグデータ可視化の性能検証結果について」を公開した。BI(ビジネスインテリジェンス)ソフトからSQLでアクセスするデータベースとして、商用DWH(データウエアハウス)とHadoopを性能比較している(図1)。資料は50ページのPDFファイルで、Webページからユーザー登録を経てダウンロードできる。

 NECは今回、ビッグデータをBIソフトで可視化したいユーザーに向けて、可視化システムの構築に役立つ情報をまとめた。性能検証済みのシステム構成やチューニング例などが分かるので、システム構築作業を最大で50%短縮できるとしている(図2)。検証にあたっては、BIソフト「Tableau」(関連記事)を提供するTableau Japan、ETL(抽出/変換/登録)ツール「Talend」(関連記事)を提供するTalend、何を分析すべきかをコンサルティングするサービスを提供するデータキュレーションの3社が協力した。

 PDF資料では、商用DWH、Hadoop+Spark SQL、Hadoop+Hive on Tez、Hadoop+Hive LLAPという4種類のSQLデータベース構成に対してBIソフトのTableauから問い合わせ、性能を検証している。Hadoopには、NECがサポートサービスを提供している米ホートンワークスの「Hortonworks Data Platform」(HDP、関連記事)を使った。PCサーバーは、インメモリー型の並列分散処理に適した「Micro Modular Server DX1000」を使った。

 NECでは、HDPとMicro Modular Server DX1000の組み合わせで、2016年度に100セットの販売を目指すとしている。また、2016年4月26日付でDX1000の上位モデル「DX2000」を強化し、CPUとして既存の8コアに加えて16コアのXeon D-1571を搭載できるようにする。16コアCPU搭載時の価格(税別)は、サーバーモジュール7台搭載で880万円から。

製品のWebサイト