以前は、ネット系企業向けの技術というイメージが強かった分散処理基盤のフレームワークApache Hadoop (以下、Hadoop)だが、昨今では、多くの業界での活用が急速に広がりつつある。

 オムニチャネル戦略を進めるみずほ銀行では、SNSデータなどの非構造化データを含むビッグデータ分析のために、Hadoopの導入を決定した。店舗窓口に加え、インターネットバンキング、ホームページ、コールセンターなどのさまざまな接点から得られるお客様とのコミュニケーションデータを、「Data Lake(データレイク:データの湖)」に格納し、蓄積データを分析・活用することで、One to One マーケティングの実現に取り組んでいる。

 これまでも同行では、顧客の行動特性を把握し、最適なオファリングを提供するために、データベースとBIツール、マーケティング自動化ツールなどを活用してきたが、非構造化データを含む多種多様なデータ分析を促進するために、Hadoopの導入を早い時期から視野に入れ、パフォーマンスのテストや稼働プラットフォームの検討を行ってきた。今回の本格的なHadoopの導入により、多種多様なデータの活用がさらに進むとみられている。

 欧州の自動車メーカーであるPSA・プジョーシトロエンでは、交通状況や生産情報、天候などの一般的な情報提供だけでなく、運転データをリアルタイムに分析して未然に事故を防止する“Connected Carサービス”を、Hadoopの技術を活用していち早く実現している。

 また大日本印刷(以下、DNP)では、顧客のライフスタイルや購買履歴などから生活者の価値観を判別し、企業のマーケティング活動を支援する「DNP生活者情報活用支援サービス」向けのビッグデータ分析基盤にHadoopを導入。50テラバイトにおよぶ構造化データ、非構造化データからデータを高速に抽出し、分析可能な基盤を構築した(※1)

 また、Hadoopのエコシステムの1つとして登場したApache Spark(以下、Spark)も昨今注目されており、ストリーミングや機械学習を身近に活用するフレームワークとして関心を集めている。

[画像のクリックで拡大表示]

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。