SAPジャパンは2015年11月5日、Hadoopに格納したビッグデータに対してOLAP(オンライン分析処理)のように対話型でドリルダウン分析できるようにするソフト「SAP HANA Vora」を発表した。2015年12月末の提供を予定する。Hadoopデータをインメモリーで高速に分析するためのミドルウエアであるApache Sparkのプラグインとして実装してあり、Sparkをエンジンとして使う。

図1●Hadoopに格納したビッグデータと、業務データベースに格納した業務データを結合することによって、ビジネスに役立つ新たな洞察を得る
図1●Hadoopに格納したビッグデータと、業務データベースに格納した業務データを結合することによって、ビジネスに役立つ新たな洞察を得る
[画像のクリックで拡大表示]

 SAP HANA Voraは、Hadoopに格納したビッグデータと、SAP HANAのような業務データベースに格納した業務データを結合することによって、ビジネスに役立つ新たな洞察を得られるようにするソフトである(図1)。例えば、Webアクセスログから顧客の行動を把握し、これとCRM(顧客関係管理)データを結び付ける使い方ができる。機器のメンテナンスにセンサーデータを活用する予測保全などの用途もある。

写真1●SAPジャパンでプラットフォーム事業本部長を務める鈴木正敏氏
写真1●SAPジャパンでプラットフォーム事業本部長を務める鈴木正敏氏
[画像のクリックで拡大表示]
写真2●独SAPのアジア太平洋地域でデータベースとテクノロジーのヘッドを務めるロイット・ナガラジャン氏
写真2●独SAPのアジア太平洋地域でデータベースとテクノロジーのヘッドを務めるロイット・ナガラジャン氏
[画像のクリックで拡大表示]

 SAPジャパンでプラットフォーム事業本部長を務める鈴木正敏氏(写真1)は、SAP HANA Voraの意義を、「ビッグデータを、特定の狭い領域のためだけでなく、企業の意思決定を高度化するという汎用的な用途のために活用できる」と説明する。独SAPのアジア太平洋地域でデータベースとテクノロジーのヘッドを務めるロイット・ナガラジャン氏(写真2)も、「センサーデータは収集するだけでは意味がない。業務データと組み合わせて活用しなければならない」とする。

 SAP HANA Voraの実態はSparkのプラグインであり、Sparkを業務システム向けに拡張する(関連記事:Hadoop超える機械学習向きのビッグデータ処理基盤、Spark 1.0が正式公開)。大きく二つの機能を拡張する。一つは、Hadoopデータの上に仮想的な分析キューブを用意する機能である。これにより、そもそもがフラットなHadoopデータに対して、OLAPのように対話型でドリルダウン分析できるようになる。検索結果に対してさらに抽出条件を狭めていくような検索ができる。

 もう一つの追加機能は、Hadoopデータに対する検索結果と、SAP HANAなどの業務データベースに対する検索結果を結合して分析する機能である。これを同社はコンパイルクエリーと呼んでいる。SAP HANAを検索するためのアダプター機能も用意しており、SAP HANA VoraからSAP HANAにアクセスして業務データを取得できる。

 これとは反対に、SAP HANAからSAP HANA Voraを介してHadoopデータにアクセスする使い方もできる。これは、業務アプリケーションからビッグデータを活用する使い方になる。