ビッグデータ/データ分析

最新ITを読み解く

「R言語」でビッグデータを解析

2013/01/15

森山 徹=日経コンピュータ

  • このエントリーをはてなブックマークに追加

 データを統計解析するためのプログラミング言語の「R言語」に注目が集まってきた。関数ライブラリーなどをサイトからダウンロードして手軽に利用できる。モデル作成からシミュレーションへつなぎやすいことがメリットの一つ。モデルをビジュアル表示できないなど、商用の解析ソフトに比べた弱みもある。

 ビッグデータ活用のニーズが本格化するなか、「R言語」が脚光を浴びている。R言語とは、統計解析機能が付いたプログラミング言語で、回帰分析など多くの統計関数を備えたフリーウエア。関数ライブラリーやマニュアルなどをまとめた「パッケージ」をサイトからダウンロードすれば、すぐに利用できる。

 ブレインパッドのアナリティクスサービス部に所属する白木広亮氏は、ネット広告の効果分析などにR言語を利用する。その環境を図1に示した。膨大なクリック履歴を分散処理ソフト「Hadoop」で分析し、RDBMS「EMC Greenplum Database」上のデータと組み合わせて分析を進めている。

図1●R言語を使う解析環境の例
Hadoopを使って作成したサマリーデータをRDBMSに取り込み、各種データを組み合わせてR言語で解析する
[画像のクリックで拡大表示]

 「Greenplumは連携機能を備え、R言語によるストアドプロシージャを登録しておき、呼び出せる」(EMCジャパン グリーンプラム事業本部の松下正之氏)。EMCと同様に、オラクルやサイベースも、自社RDBMSとR言語との連携に力を入れている。

データ解析に当たっては、R言語による

1 2 次ページへ
次ページ以降はITpro Active会員(無料)の方のみお読みいただけます。
会員の方は、 ログインしてご覧ください。
まだ会員でない方は、ぜひ登録(無料)していただき、ITpro Activeの豊富なコンテンツをご覧ください。
出典:日経コンピュータ 2012年8月2日号pp.102-103
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

おすすめの記事

    関連プレスリリース

      注目コンテンツ