AWSを利用し、ビッグデータ基盤を構築する。そんなユーザー企業が増えている。各社の事例から、構築の勘所である性能・コスト・セキュリティの工夫を見いだす。

 データベースやWebサーバーのログなど、企業が保有するさまざまなデータを統合し、分析に利用する「ビッグデータ基盤」。これを、AWS上に構築するユーザー企業が増えている。

 大きな要因は、ストレージやサーバーを柔軟に拡張できるという特徴が、ビッグデータ基盤に適していること。企業が保有するビッグデータはテラバイトクラスになることもある。オンプレミス環境の限られたリソースでは、そんなデータの扱いが難しい。

 AWSであれば、オンラインストレージS3(Amazon Simple Storage Service)で、容量を事実上無制限に拡張できる。AWS上のシステム構築・運用を手掛けるアイレットの吉田真吾氏(cloudpack事業部 エバンジェリスト ソリューションアーキテクト)は、「容量の制約を考えずに済む」と話す。

 AWSのサービスの幅が広がったことも、追い風だ。例えば2014年7月には、リアルタイムのデータ収集・処理を行うAmazon Kinesisが東京リージョンで利用できるようになった。「モバイルアプリやセンサーのように、大量かつ不定期に届くデータを分析する基盤として評価を受けている」(アマゾン データ サービス ジャパン 技術本部 技術本部長 玉川 憲氏)。回転寿司チェーン大手のあきんどスシローがKinesisを採用。全国の店舗の状況をほぼリアルタイムで把握できる基盤を整備した。

課題は性能・コスト・セキュリティ

 AWSでビッグデータ基盤を構築する際に検討したいポイントは、主に三つある。(1)データ集約時の性能、(2)コスト、(3)セキュリティだ(図1)。

図1●AWSを利用してビッグデータ基盤を構築する際に検討したい主なポイント
図1●AWSを利用してビッグデータ基盤を構築する際に検討したい主なポイント
(1)データ集約時の抽出・加工・転送処理に対する性能、(2)必要な性能を確保するコスト、(3)パブリッククラウド上のデータを守るセキュリティ、の三つがある
[画像のクリックで拡大表示]

 (1)データ集約時の性能とは、データ集約時に必要な処理に対するもの。データの抽出・加工・転送処理に十分な性能を確保する必要がある。

 (2)は、性能を確保するためのコストである。AWS上にサーバーやストレージを多数並べて処理すると、台数が増える分、利用料金がかさむ。課金体系によっては、データの加工などに用いるソフトのライセンス料も増える。コストを抑える工夫が必要だ。

 (3)のセキュリティは、顧客情報などの機密データを、パブリッククラウドサービスであるAWSに転送することへの措置だ。AWSに、機密データを転送する場合は、セキュリティ対策が重要となる。

 以下では、あきんどスシロー、ゴルフ商品・サービスのECサイトなどを手掛けるゴルフダイジェスト・オンライン(GDO)、NTTドコモの3社の事例から、データ集約時の加工・転送処理に対する性能、コスト、セキュリティの工夫を見る。

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。