今回は「データ分析の仕組み作り」の2回目。分析の仕組みを構成する「データウエアハウス」「分析ツール/ソフト(以下分析ツール)」「ETL」のうち、分析ツールを選定するコツを重点的に解説します。そして、業務システムからデータウエアハウスにデータを流し込むETLについては、運用する上で陥りがちな“落とし穴”を、実際の例を元に紹介します。

分析ツールは機能面で3つに分類できる

 ビッグデータが盛り上がりを見せるにつれ、様々な分析ツールが新たに登場しました。一体どのツールを使ったら良いのか、分からなくなってしまう方も多いのではないでしょうか。

 分析ツールは恐ろしく多機能のようにみえますが、機能に着目してざっくりと分類すれば3種類しかありません(図の右側)。

図●データ分析の流れと分析ツールの種類
図●データ分析の流れと分析ツールの種類
[画像のクリックで拡大表示]

(1)日々の面倒なレポート作成を簡略化・自動化してくれる「ダッシュボード/レポーティングツール

(2)日常必要な分析の大部分をこなせる「集計/ビジュアル化ツール

(3)日々のデータを基に将来予測などに活用できる「統計解析/機械学習ツール

 このほか分析用のツールではありませんが、

(4)分析の前段階でデータをきれいに整形する「データ統合/ブレンドツール

 があります。

 分析ツールには様々な種類がありますが、一体どの製品を選べば良いのでしょうか?

 本記事では、まずそれぞれのツールの特徴を紹介した上で、私が考える「選定の考え方」を解説します。分類ごとの特徴まで読むのが面倒だ、という方は、「まずは、ツールのうち(1)(2)を導入する必要があって、将来予測をやりたければちょっと高価だけど(3)を導入すればいいんだな」、くらいに考えて頂ければ、あとは選定の考え方まで読み飛ばしても大丈夫です(選定の考え方へのリンク)。

 なお、この分類や紹介する製品は、あくまで事業会社で分析を行っている筆者の主観に基づくもので、世の中一般のものとは異なっている可能性もあることを知っておいてください。

(1)ダッシュボード/レポーティングツール

写真1●QlikView 11の画面。集計ツールとしても、ダッシュボードツールとしても使える
写真1●QlikView 11の画面。集計ツールとしても、ダッシュボードツールとしても使える
[画像のクリックで拡大表示]

 ダッシュボード/レポーティングツール(以下ダッシュボードツール)は、決められた指標を定期的にモニタリングするのに適したツールです。データの計算方法やグラフ化の方法をあらかじめ定義しておくことで、例えば日次、週次、月次のレポートを自動的に生成してくれます。PC上ですべてのデータを扱うExcelと異なり、分析ツールは外部のデータウエアハウスと連携してレポートを作成するので、数百万件のデータであっても安定して扱えます。

 皆さんも役員や上長に、Excelなどで日次/週次/月次の定期的にレポートを作成された経験があるかと思います。その際、「毎回同じ手順だからシンプルではあるが、時間はかかって面倒だ」「Excelのファイルサイズが大きくなりすぎると、ファイルを保存できなかったりクラッシュしたりすることがあって困る」といった不満があったり、また作成作業に無視できない工数をかけている場合は、上記のようなツールの導入をお勧めします。

 例えば飲食業界では、日々の売上に加え、客数や単価といった指標が非常に重要で、この指標を毎日、地域別や時間帯別に見ています。このようなレポートを人手を使って作成するのは非常に無駄です。コンピュータでできることはコンピュータに任せて、人間は人間にしか出来ない仕事に注力しましょう。

 なおダッシュボードツールには、データの集計範囲を絞って詳細な情報を参照できるドリルダウン機能など、簡単な分析機能を備えたものもありますが、基本的にはレポート作成の工数を削減するものと割り切って使うと良いでしょう。ただしQlikViewやTableauなどのように、集計/ビジュアル化が主目的のツールにもダッシュボードツールとしても使えるものも多く存在します。

ツール例: Tableau、QlikView、Chartio、Domoなど