特集の第2回で「安価ですぐに利用でき」「プログラミングのスキルが必要なく」「サクサク動く」という3つの条件を満たした、まさに手軽にビッグデータ分析ができるツールを紹介しました。そして第3回第4回では具体的なケースに沿って、2次属性付けとクロス集計を行うという、ビッグデータを分析する手法も紹介しました。

 最終回の今回は、応用編になります。別のツールを利用したビッグデータ分析を紹介しましょう。そして最後に、この特集でお伝えしたかったことを改めてまとめます。

プログラミングは必要だが、無料で使えるR言語

 統計プログラミング言語である「R言語」でも、2次属性付けとクロス集計ができます。

 R言語は、第2回の手軽に利用できるビッグデータ分析では紹介しませんでした。それは、私たちの手軽の定義である「プログラミングのスキルが必要なく」という条件を満たさないからです。

 R言語を使うには、R言語でのプログラミングの知識が必要です。また、計算をメモリーに展開して実行するため、分析できるデータ量はパソコンのメモリー容量に依存します(その上限値は後述します)。

 ただし、R言語はオープンソースのフリーソフトなので、無料で利用できます。費用を全くかけられないという条件で、かつプログラミングを学ぶ努力をいとわない人であれば、まずはR言語を利用してビッグデータを分析することも選択肢の1つになります。ですので、今回は簡単にR言語を利用したビッグデータ分析について触れます。

 R言語はオープンソースであるフリーソフトの統計解析向けプログラミング言語、およびその開発環境です。インターネット上からR言語のインストーラーをダウンロードして、自分のパソコンにその環境をインストールするだけで利用できます。

 R言語は統計プログラミングですので、王道の利用方法は統計解析です。私たちもR言語で「アプリオリ・アルゴリズム」を使い、マーケットバスケット分析をすることがあります。また、ニューラルネットワークを利用して、予測モデルを作ることもあります。

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。