NTTドコモは2014年から、全社統合のデータウエアハウス(DWH)である「IDAP」をAWS上で稼働させ、規模や機能を拡張してきた。顧客向け各種サービスのログや顧客関連情報など多岐にわたるデータを集約し、AWSのDWHサービス「Amazon Redshift」に格納・分析するシステムだ(図1)。利用者は、各事業部門の分析担当者200人ほど。扱うデータ量は数PBに上る。

図1 重要情報を扱うDWHをRedshiftに移行
図1 重要情報を扱うDWHをRedshiftに移行
[画像のクリックで拡大表示]

 IDAP の構築に当たっては、「セキュリティの確保に最も苦労した」(NTTドコモ R&Dイノベーション本部 サービスイノベーション部 ビッグデータ担当 佐々木純氏)。大量の重要データをAWS上で安全に処理するため工夫を重ねた。

外部・内部の犯行を防ぐ

 同社は従来、部署やサービスごとにデータを蓄積し、活用していた。DWHも、社内に複数存在していた。動画配信やネット通販、旅行予約など提供するサービスの幅が広がる中で、「各種データを一元的に分析できる仕組みが求められるようになった」(佐々木氏)。

 そこで、IDAPの構築を決定。システムリソースの柔軟性などを理由に、2014年6月に基盤としてAWSを選定した。音声アシスタントサービス「しゃべってコンシェル」のシステムをAWS上に構築・運用するなど、活用ノウハウが豊富だったことも後押しになった。

 ただし当時から大規模なデータ漏洩事件が相次いでおり、「クラウドを使ったデータ分析システムには、オンプレミス(自社所有)環境と同等以上のセキュリティレベルが求められた」(佐々木氏)。外部からのサイバー攻撃と、内部犯行によるデータ持ち出しの両方を防止できるシステム設計が必須だった。

 実現に当たり、2014年後半の初期構築時に二つの技術的障壁に直面した。稼働後に実施した機能強化でも、二つの障壁を乗り越える必要があった。障壁を乗り越えた工夫を、順に見ていこう(図2)。

図2 IDAPの構築と機能拡張の経緯
図2 IDAPの構築と機能拡張の経緯
[画像のクリックで拡大表示]