「データサイエンティスト」というと、統計学の博士号を持ち、最先端の技術を駆使して高度な分析を行う人というイメージがあります。確かにネット専業の企業や、分析を受託するコンサルタントなどは、そうした“スーパーマン”を採用するケースも多いのでしょうが、一般の事業会社ではなかなか難しい。
渋谷 直正(しぶや なおまさ)氏
実務経験者に分析教育を行い、育成していくアプローチも重要だと考えています。私の部門でも実務担当者にデータ分析手法を教え、利活用できるよう取り組んでいます。
この過程でぶつかるのが、統計学の壁です。平均値やヒストグラムといった統計の基礎知識からスタートし、確率論や推定・検定などの推測統計学、多変量解析、最近ではベイズ統計学などへと徐々に学びを深めていきます。しかし難度が上がると勉強が進まなくなります。山登りに例えれば、3合目を過ぎた辺りで疲れてしまい、登山をあきらめてしまうことが多いのです。
ヘリコプターで上がってもいい
そんなときには「徒歩ではなく、ヘリコプターで登ってもいいじゃないか」と言っています。多変量解析など、使用頻度の高い分析手法については、難度が高くてもまずやり方をマスターし、原理が分からなくても実際に分析することで慣れてもらうのです。
そのため、クロス集計やロジスティック回帰分析、非階層的クラスター分析など、約20の分析手法の実務での使用頻度を洗い出しました。頻度の高いものを優先的に学ぶべき手法と定義し、詳しい社員が講師役を務めるなどして、担当者全員が習得できるよう努めています。