EMCジャパンは2013年4月19日、都内で記者向けの説明会を開催し、同社が2012年から提供している、ユーザー企業のビッグデータ分析を支援する二つのサービスについて、詳細を発表した。分析の専門家「データ・サイエンティスト」を養成するサービス(写真1)と、実際に企業内でのデータ分析チームの立ち上げを支援するサービスである。
これらのサービスが対象としているデータ分析業務とは、データ分析をビジネスの課題解決や経営意思決定に役立てることを指す。具体的なライフサイクルは、ユーザー企業が抱えているビジネス上の問題をデータ分析課題へと落とし込み、これを各種のデータ分析手法を用いて分析し、分析結果を生かしてビジネスを運用/評価する。
同社はデータ分析の専門家をデータ・サイエンティストと呼ぶ。データ分析のライフサイクルを回すためには、まずは企業内にデータ・サイエンティストを育成することが必要で、さらにこのうえで、データ・サイエンティストがデータ分析の仕事に就ける環境を用意することが重要と説く(写真2、写真3)。同社では、この二つのステップに対応したサービスを、それぞれ提供している。
5日間の研修でデータ・サイエンティストを養成
一つめのサービスは、データ・サイエンティストを養成する5日間のトレーニングコース「Data Science and Big Data Analytics」である(2012年5月から提供中)。テキストとDVDの教材、パソコンによる実習などを経て、データ分析のライフサイクルを通じてデータ分析の実態とスキルを学ぶことができる。
同トレーニングコースは、原則としてEMCジャパンのオフィス(川崎市)にて、定員12人(複数のユーザー企業が混在)で開催する。開催ペースは月に1回で、平日の月曜日から金曜日までの5日間、連続で実施する。価格(税別)は、参加者1人当たり30万円。なお、ユーザーの要望に応じて、ユーザー企業側のオンサイトで実施することも可能であるとしている。
5日間のプログラムの詳細は、以下の通り。
日程 | プログラム名 | プログラムの内容 |
---|---|---|
1日目 | ビッグデータ分析入門+データ分析のライフサイクル | ・Big Dataの概要 ・分析実務の現状 ・データ・サイエンティストとは ・業界別のBig Data分析 ・データ分析のライフサイクル |
2日目 | データ分析の基本~「R」を使って | ・R言語の基礎知識 ・データ調査と分析 ・モデル構築と評価理論 |
3日目 | 先進的分析の理論と手法 | ・K平均法クラスタリング ・アソシエーション・ルール ・線形回帰 ・ロジスティック回帰 ・単純ベイズ分類機(Native Bayesian Classifier) ・決定木 ・時系列分析 ・テキスト分析 |
4日目 | 先進的分析の技術とツール | ・非構造化データの分析(MapReduceとHadoop) ・Hadoopエコシステム ・In-database分析-SQLの要点 ・In-database分析で活用する先進SQLとMADlib |
5日目 | 分析結果の可視化とプレゼンテーション+課題チャレンジ | ・分析プロジェクトの実施と運用 ・最終成果物の作り方 ・ビジュアル化のテクニック +課題チャレンジ データ分析ライフサイクルの適用業務(ケーススタディ) |
データ分析チームの立ち上げを支援
二つめのサービスは、ユーザー企業内で実際にデータ・サイエンティストがデータを分析できるように、チーム作り/組織作りを支援するコンサルティングサービス「データ・サイエンスチーム立ち上げサービス」である(2012年4月から提供中)。分析対象のデータを社外に出せないといったケースでは、EMCジャパンのエンジニアがユーザー先に半常駐し、ユーザーと一緒になってデータ分析に取り組む、としている。
データ分析チームを実際に立ち上げるための方法としては、スモールスタートによる効果の実証、というアプローチを取る。実データを使って実際にデータ分析のライフサイクルを実践し、成功事例を作る。こうして社内にデータ分析チームを根付かせる。この最初のライフサイクル1回当たりの所要期間は3~4カ月。多くの場合、最初の2カ月ほどは、分析テーマの選定とデータの用意/分析環境の用意で費やされるという。
同サービスの価格は、1500万円程度としている。