パブリッククラウドの相次ぐ大規模障害を受けて、Amazon Web Services(AWS)に精通したアーキテクト2人を招いた座談会の後編。クラウドの障害に対してユーザー企業が取るべき対策について語ってもらった。

(聞き手は、中山 秀夫=日経クラウドファースト
セクションナイン 代表取締役社長 吉田真吾氏
セクションナイン 代表取締役社長 吉田真吾氏
アイレットなどを経て、2015年11月にAWSを使ったシステム構築を手掛けるセクションナインを設立。AWSの普及に尽力した個人に与えられる「AWS Samurai」を2014年と2017年に受賞。サーバーレスアーキテクチャーのコミュニティー「Serverless Meetup Japan(Tokyo/Osaka)」を主宰

停止させたくないシステムはクラウドに乗せないとしても、ダウンタイムは短いほうがいい。今回のような障害がAWSの東京リージョンで起こるかもしれないという前提に立ったとき、どんな対策をすればいいでしょうか。

吉田 今回障害が発生したオブジェクトストレージのAmazon S3であれば、複数のリージョンに同じデータを保存しておき、障害発生時にすぐ切り替えられるようにすることですね。簡単にリージョンを横断して冗長化できるのがクラウドの利点です。

 しかし無条件にそうすべきというわけではありません。冗長化にはコストが掛かる。同じコストを掛けるなら、1年に1回も起こらないリージョン単位の障害に対応するよりも、優先すべきことがあるのではないでしょうか。例えば、自社で利用しているEC2(AWSの仮想マシンサービス)を冗長化したほうが効果が高いと思います。

秋永 クラウド上に保存したデータが消えたら一大事です。これはデータの堅牢性(Durability)の問題。AWSに解決策があります。1年間にわたりデータが失われず保持される確率がイレブン・ナイン(99.999999999%)であるS3を使うのが一つの手です。今回の障害でも、データは失われませんでした。

 しかし、システムの可用性については割り切りも必要です。可用性を高める対策と、実現に掛かるコストのバランスを取ることが欠かせません。

吉田 可用性の割り切りは必要ですよ。例えば米国のATM(現金自動預け払い機)は動かなくなることがよくあります。日本のATMは常に動いていることが求められますが、本当にその必要があるのでしょうか。

 企業システムにしても、過剰なまでに可用性を高めるため、多額のコストを投じている例が見られます。ERP(統合基幹業務システム)であろうと、可用性とコストのバランスを取るべきです。可用性の要求水準が高い場合は、クラウドを使わないという選択を考えるべきでしょう。