データを統計解析するためのプログラミング言語の「R言語」に注目が集まってきた。関数ライブラリーなどをサイトからダウンロードして手軽に利用できる。モデル作成からシミュレーションへつなぎやすいことがメリットの一つ。モデルをビジュアル表示できないなど、商用の解析ソフトに比べた弱みもある。
ビッグデータ活用のニーズが本格化するなか、「R言語」が脚光を浴びている。R言語とは、統計解析機能が付いたプログラミング言語で、回帰分析など多くの統計関数を備えたフリーウエア。関数ライブラリーやマニュアルなどをまとめた「パッケージ」をサイトからダウンロードすれば、すぐに利用できる。
ブレインパッドのアナリティクスサービス部に所属する白木広亮氏は、ネット広告の効果分析などにR言語を利用する。その環境を図1に示した。膨大なクリック履歴を分散処理ソフト「Hadoop」で分析し、RDBMS「EMC Greenplum Database」上のデータと組み合わせて分析を進めている。
「Greenplumは連携機能を備え、R言語によるストアドプロシージャを登録しておき、呼び出せる」(EMCジャパン グリーンプラム事業本部の松下正之氏)。EMCと同様に、オラクルやサイベースも、自社RDBMSとR言語との連携に力を入れている。