データを統計解析するためのプログラミング言語の「R言語」に注目が集まってきた。関数ライブラリーなどをサイトからダウンロードして手軽に利用できる。モデル作成からシミュレーションへつなぎやすいことがメリットの一つ。モデルをビジュアル表示できないなど、商用の解析ソフトに比べた弱みもある。

 ビッグデータ活用のニーズが本格化するなか、「R言語」が脚光を浴びている。R言語とは、統計解析機能が付いたプログラミング言語で、回帰分析など多くの統計関数を備えたフリーウエア。関数ライブラリーやマニュアルなどをまとめた「パッケージ」をサイトからダウンロードすれば、すぐに利用できる。

 ブレインパッドのアナリティクスサービス部に所属する白木広亮氏は、ネット広告の効果分析などにR言語を利用する。その環境を図1に示した。膨大なクリック履歴を分散処理ソフト「Hadoop」で分析し、RDBMS「EMC Greenplum Database」上のデータと組み合わせて分析を進めている。

図1●R言語を使う解析環境の例
Hadoopを使って作成したサマリーデータをRDBMSに取り込み、各種データを組み合わせてR言語で解析する
[画像のクリックで拡大表示]

 「Greenplumは連携機能を備え、R言語によるストアドプロシージャを登録しておき、呼び出せる」(EMCジャパン グリーンプラム事業本部の松下正之氏)。EMCと同様に、オラクルやサイベースも、自社RDBMSとR言語との連携に力を入れている。

次ページ以降はITpro Active会員(無料)の方のみお読みいただけます。