2012年6月に発生したファーストサーバによるデータ消失事故は記憶に新しい。単純なオペレーションミス(オペミス)が、ユーザー企業のデータ消失という大きな被害につながった。「この事故は、クラウドの『負の側面』を提示した。企業はオペミスについて、今一度注視すべきだろう」と語るのは、ガートナー ジャパンでセキュリティおよびリスク分野の分析を担当するリサーチ部門セキュリティ担当の石橋正彦リサーチ ディレクターである。
専門のクラウドベンダーに任せたとしても、人が作業する限り、オペミスはゼロにはならない。「むしろ技術の適用範囲が広がっている今、事故によるビジネスへの影響範囲は大きくなる一方だ」と石橋リサーチ ディレクターは指摘する。「企業はオフラインバックアップをこまめに実施するなど、『基本中の基本』に立ち戻るべきだ」(石橋リサーチディレクター)。
石橋リサーチ ディレクターに、2012年のオペミスを取り巻く現状と、ユーザー企業が実施すべき対策の指針を聞いた。
2012年のセキュリティおよびリスク管理分野の重要トピックは。
ズバリ、オペレーションミス(オペミス)だ。ファーストサーバで今年6月、データ消失事故が発生した(関連記事)。どんな組織でもオペミスは起きるということを、私たちは強く認識する必要がある。
ガートナーは今年、「世界で2015年までに少なくとも1つのパブリッククラウドサービスが連鎖的な故障に陥り、その結果数百万ドル相当の回復不能なデータ損失が発生するだろう」という予見を提示していた。ファーストサーバの事故は残念ながらこの予見が一部当たった格好だ。
通常であれば、システム運用管理の現場では「人間のミスはゼロにはならない」という前提の下で、オペレーションの手順を組む。例えば、まずリハーサル環境を用意してここで試す。また本番機3台に対して作業を実施するなら、3台同時に作業を進めるのではく、最初に1台のサーバーに実施して確認する。それで問題がなければ、残りのサーバーに1台ずつ実施する。オペミスが起きても被害が最小限にとどまるし、原因の特定作業も進めやすい。
といっても、多くの現場では手間を省く方向に進んでいく。この結果、オペミスが発生した際に、ビジネスへの影響範囲の拡大と相まって、大きな事故に発展してしまうわけだ。
ユーザー企業としては「オペミスは決してなくならない」という前提に立って、必要な対策を採るべきだ。自社のIT部門で実施していてもオペミスはなくならない。ではプロのクラウド事業者に任せればオペミスがなくなるかというと、ファーストサーバの事故が示したように、それもない。
以前、企業の情報システム部門は週次で磁気テープにデータを保存して倉庫に格納する、といったことを当たり前に実施していた。私はユーザー企業に対して、自社でオフラインバックアップを取ることをあらためて推奨している。
システムを委託している事業者とは別の環境にバックアップシステムを構築し、週に1回、あるいは月に1回のタイミングで実施する。事業者側が復旧に失敗したとしても、最悪でも1週間前、あるいは1カ月前の状態に戻せるので、被害を最小限に食い止めることができる。
昔はどのユーザー企業でも、オフラインバックアップは当たり前のように実施していた。
最近はハードディスクが安くなって、バックアップもハードディスクで実施するようになった。だが環境によっては、今回のファーストサーバの事故のように、バックアップ先のディスクにあるデータも同時に消してしまうという事態が起きてしまう。なのでオフラインバックアップが安全だ。