前回は、ビッグデータがもはや企業にとって珍しい存在ではなくなっていることと、基盤を自前で構築・運用する場合の三つのハードルを示した。実はこれらのハードルは、AWS(Amazon Web Services)を利用すると比較的容易に乗り越えられる。今回はその理由を中心に解説する。

 初めに、前回挙げたハードルをおさらいしよう。(1)基盤に利用するソフト、ハードの初期費用の高さ、(2)スペック見積もりの難しさ、(3)ハード障害の対策、の三つである。

 一方、AWSなどのパブリッククラウドは、三つの特徴を備える。(i)小さく安価に始められる、(ii)リソースを柔軟に拡張できる、(iii)ハード障害対策を任せられる、である(図1)。

図1●AWSなどのパブリッククラウドでビッグデータ基盤を構築・運用する利点
図1●AWSなどのパブリッククラウドでビッグデータ基盤を構築・運用する利点
[画像のクリックで拡大表示]

 (i)の特徴により、初期費用の高さというハードルを乗り越えられる。例えばAWSのDWHのサービス「Amazon Redshift」は、初期費用なしで利用できる。ソフトウエア、ハードウエアともに調達コストは不要で、利用に応じた費用がかかるだけだ。

 動作検証をしたい場合は、本番と同等の環境をクラウド上に構築すれば済む。検証用のハードウエアを調達するコストを省ける。

 加えて、クラウドでのシステム構築を得意とするITベンダーの多くは、設計の成功パターンを公開している。こうしたパターンを取り入れることで、安定性の高いシステムを短期間で構築できる。このため、インテグレーションに関わる費用も抑えられることが多い。

 このように初期費用が抑えられるため、「投資に見合う効果があるか分からないからビッグデータ基盤を構築できない」という姿勢を変えられる。「初期費用をかけずに基盤を試しに構築し、利用して効果があれば拡大する」という考え方ができるようになる。事実、筆者が基盤構築を支援したユーザー企業は、年度末に残った少額の予算を利用した例が多い。

 もちろん、パブリッククラウドはデータ量などに応じて月額の利用料金が発生する。ただ、よほど巨大なデータを扱わない限り、大半のユーザー企業は数万~数十万円程度で済む。

 従って数年間で試算しても、自前でDWHを導入するより安価に利用できることが多い。