いち早くデータ分析ツールを導入したが、今は使っていない。こんな状況に陥っている国内のユーザー企業は意外と多い。分析システムへの投資が無駄になる理由の一つは、製品選択の過ちだ。自社の目的と能力を見極め、賢くツールを選ぶことが求められる。
高速分析 編
“初体験”でも心配無用
Hadoop導入は怖くない
様々なデータを取り込んで、分析すれば、新たな効果や効能を持つ医薬品を開発できるはず――。こうした考えの下、ビッグデータ分析に熱心に取り組んでいるのが塩野義製薬だ。同社は通常とは異なるアプローチで新薬開発に挑む(BigData036)。
新薬の開発では、医薬品メーカーは臨床試験で得た治験データを統計解析するのが一般的である。これに対し塩野義製薬は、治験データに加え、動物試験データや細胞試験データ、米食品医薬品局(FDA)が公開するオープンデータなど外部の様々なデータを収集・分析し、医薬品開発に役立てている。こうしたアプローチは、「医薬品メーカーではまだ珍しい」(同社解析センターの北西由武データサイエンス部門サブグループ長)。
外部のデータを積極的にデータ分析の対象とすることで、同社は文字通りビッグデータを扱うようになった。新薬開発で扱うデータ量は数年前に比べて約200倍という。
年々増大するデータを円滑に処理するため、同社は新たなITシステムを2013年10月に導入した。この時に目を付けたのが、OSSの分散データ処理ソフト「Hadoop」だ。
長年活用していたSAS Institute Japanのデータ分析ツールの最新版「SAS 9.4」とHadoopを採用し、新システムを構築。旧システムで利用していたRDB(リレーショナルデータベース)にHadoopを加えた格好だ。
「大量データの中から、SAS製ソフトによる統計解析に使うデータを選別するには、並列演算処理を得意とするHadoopが最適だと判断した」。北西サブグループ長はこう話す。とはいえHadoopの導入は初めてで、そのノウハウもなく不安を覚えたという。
そこで同社が活用したのが、SAS製品とHadoopのデータをやり取りするためのソフト「SAS/ACCESS Interface to Hadoop」だ。これにより、「Hadoopの知識があまりなかった我々でも、スムーズにSASとHadoopを組み合わせたシステムを構築できた」と北西サブグループ長は振り返る。
Hadoopが“初体験”でも、導入を支援する市販製品は着実に増えている。最新の製品動向を把握しておけば、不安を解消してくれる製品にたどり着く可能性は高まる。
実際に塩野義製薬は、最新の製品を使った次の一手を打つ。新システム稼働後もデータ量は増加の一途をたどっており、現状のままでは将来的には処理能力が不足する恐れがある。それに備えて同社は、Hadoop上でSAS製ソフトを動かし、メモリー上でデータ分析処理する「SAS In-Memory Statistics for Hadoop」の導入を検討している。「インメモリー技術で大量データを高速処理できるようしたい」と北西サブグループ長は意気込む。
米メイシーズで効果出す
国内外で既に500社以上の導入実績があり、最近注目を浴びているデータ分析ソフトがある。SAPジャパンが出荷している「SAP InfiniteInsight」がそうだ。独SAPが2013年10月に買収した米KXEN製のソフトで、知りたいことに合わせて迅速にデータ分析できるという。
利用者は分析アルゴリズムを選ばなくても、「キャンペーンに反応する確率は?」「メルマガのリンクをクリックする確率は?」といった問いに答えを出せる。SAPのインメモリーデータベース「SAP HANA」とデータをやり取りし、大量データの高速分析を可能としている(BigData037)。
InfiniteInsightを導入して効果を上げている企業もある。百貨店大手である米メイシーズがそうだ。顧客の購買行動を把握し、電子メールやウェブサイトによるマーケティングキャンペーンの最適化に活用している。
顧客属性に応じて最適な電子メールを送り分けるなどの施策によって、オンライン販売の売り上げを導入前に比べて8~12%伸ばしたという。国内ではセガがInfiniteInsightを採用している。