ビッグデータ利活用の主要なボトルネックの1つが人材不足だといわれている.我が国におけるデータサイエンティストの育成を加速するため.我々は文部科学省委託事業「データサイエンティスト育成ネットワークの形成」を2013年に開始した.本稿では,この事業を推進する上で見聞きした,さまざまなデータサイエンティスト育成の取り組みと,データサイエンティストを実際に組織の中で活かしていく取り組みについて,ベスト・プラクティスとして紹介する.

1.はじめに

 本データ分析を行う上で,特に我が国において最大の問題の1つとして指摘されているのが,人材の不足である.Mckinsey Global InstituteのBig Dataに関するレポート[1] によれば,“deep analytical talent”が2018年までに米国で14万人から19万人不足するという.日本経済新聞は2013年7月17日付けの記事で,米調査会社ガートナーの数字として,将来的に国内ではデータサイエンティストが約25万人不足すると報じた.

 我が国におけるデータ分析専門家の持続的な育成と効果的な活用を目指して,我々は文部科学省委託事業「データサイエンティスト育成ネットワークの形成」を2013年7月に開始した.この事業では,我が国におけるデータ分析人材の「あるべき姿」を明らかにするとともに,データ分析人材育成に熱意を持つ教育機関と,データ分析をビジネスに活かしたい企業・組織を広くネットワークし,それらの間で知識・経験を共有することで,多くのデータ分析人材が育成され,有効に活用されることを狙っている.

 データサイエンティストに必要なスキルについてはコンセンサスが固まりつつあるが,そのスキルをどのように育成しどのように活用するかについては,いまだ手探りの状態である.本稿では,我々の事業を通して得られたさまざまな事例をもとに,データサイエンティスト育成とそれら人材利活用のベスト・プラクティスについて議論する.

2.データサイエンティストとは

2.1 日米のデータサイエンティスト像

 Harvard Business Reviewの記事において,トーマス・ダベンポート(Thomas H. Davenport)は,「データ・サイエンティストとは,高度な数学的素養を持ち,プログラミングに長けていて,好奇心旺盛で企業の経営にも興味を持つ,スーパースターである」と述べている[2] .

 だが,必ずしもすべてのデータサイエンティストが,ダベンポートの言うようなスーパースターではない.我々の事業においては,我が国におけるデータサイエンティスト像を調べるために,統計検定合格者313名に対するアンケート調査と,20名のデータサイエンティストに対する聞き取り調査を行い,我が国のデータサイエンティスト像について,以下のように分析した[3] .

  1. データ分析人材のバックグラウンドはさまざまであること.現在,データサイエンティストとして活躍されている方々の出身は,理系も文系もあり,さまざまである.
  2. データ分析は全人的な能力であること.データ分析人材の能力は,データ分析だけでなく,ビジネスの問題を発見してデータ分析の問題に落とし込む力,またデータ分析の結果を現場に適用してビジネスの成果につなげるためにコミュニケーション力も要求される.
  3. データ分析は,個人の能力というよりは,組織の能力であること.「データサイエンティスト」という個人がデータ分析のすべての局面を担当するのではなく,チームとしてそれぞれの得意分野を担当している.また,社員全員が基本的なデータ分析スキルを持つように教育している会社もある.
  4. 発注側のリテラシーが大切なこと.どんなに良いデータ分析結果を持っていても,経営者がそれに基づいて意思決定できなければ役に立たない.

2.2 必要なスキル・セット

 我が国でデータサイエンティストの育成や社会に対する普及啓蒙活動を行っているデータサイエンティスト協会は,およそ1年にわたる集中的な議論の結果,2014年12月にデータサイエンティストの「ミッション,スキルセット,定義,スキルレベル」を発表した☆1.それによれば,データサイエンティストとは,「人間を数字入力や情報処理の作業から解放するプロフェッショナル人材」であり,そのミッションは「データの持つ力を解き放つ」ことである,としている.

 「データの持つ力を解き放つ」ためには,データを分析するだけでは足りないことに注意してほしい.ビッグデータを解析して「何か面白いことが見つかった」だけでは,データサイエンティストの仕事は半分しか終わっていない.分析の結果から,既存のビジネスプロセスを変え,その結果新しい価値を生んで初めて「データの持つ力を解き放った」ことになるのである.逆に,データの持つ力を解き放つことができるのであれば,必ずしもデータの分析は必須ではない.分析しなくても,データを整理・統合しうまく見せるだけで,データの力をビジネスに結びつけられる場合もある.このように,データサイエンティストとは,単にデータの分析にとどまらない,新たな種類のプロフェッショナルということができる.

 データサイエンティストに必要なスキルはどのようなものであろうか.前述のデータサイエンティストのレポートにおいては,データサイエンティストのスキルを図1のように3つに分類している.

図1●データサイエンティストに求められるスキル
図1●データサイエンティストに求められるスキル
[画像のクリックで拡大表示]

 ビジネス力とは,課題背景を理解した上で,ビジネス課題を整理し,解決する能力である.データサイエンティストは,データの持つ力を解き放たなければならない.そのためにはビジネスを理解し,データをどのように価値創造につなげられるかを見通せる人材でなければならない.ビジネス力のもう1つの重要な側面は,コミュニケーション能力である.どんなに良いデータ分析結果が得られても,意思決定者が理解できなければ使ってもらえない.また,使ってもらえたとしてもデータ分析の結果は不確定要素が多く,うまくいかないときのリスクを正しく理解してもらえないこともある.したがって,データ分析結果を正しく意思決定者に理解してもらうためには,コミュニケーションに相応のスキルが必要なのである.

 データサイエンティストに求められるスキルセットの2つ目はデータサイエンス力である.これは,統計学,情報処理,人工知能などデータ分析に必要な手法を理解し,使う能力である.統計的仮説検定や回帰分析など伝統的な統計手法だけでなく,機械学習など人工知能の分野で新たに開発された手法などについても使えるようにしておかなければならない.また,それらを効率よく実装するためのアルゴリズムや,プログラミングモデルについても,理解とともに実践が大切である.特に,ビッグデータの分析には,並列計算など計算機アーキテクチャやネットワークの構成など,計算資源の特質を熟知した上で実用的な実装を行わなければならない.これらのテクノロジは日進月歩であり,努力してフォローしていなければならないだろう.

 データサイエンティストに求められるスキルセットの3つ目はデータエンジニアリング力と呼ばれる.データサイエンスを意味のある形で使えるようにシステムを設計,実装,運用する能力であり,ある意味これが一番難しい.ある程度以上の複雑なシステム構築を繰り返して身に付くスキルであり,体系的に学べる性質のものではないからである.

 データサイエンティストになるには,上記の3つのスキルセットをすべて満遍なく身に付けなければならないのだろうか.このスキル定義を行ったデータサイエンティスト協会スキル定義委員会の委員長である安宅氏は,どれか得意分野があってよいが,それぞれのスキルセットについて最低限の知識・経験は持っていてほしい,と述べている.我々の調査からもいえることは,お互いにコミュニケーションのできる最低限の共通スキルを持った上で,ビジネス力の強い人,データサイエンス力の強い人,データエンジニアリング力の強い人をチームとして組み合わせて,組織能力としてデータ分析の力を発揮するのが,多くの会社がやっていることのようである.

☆1 http://prtimes.jp/main/html/rd/p/000000005.000007312.html