複雑さを増すシステムを短時間で復旧する備えはあるか?
デジタルビジネスを支えるITインフラには、これまでになく柔軟な対応が求められている。アプリケーションの開発サイクルは短くなり、クラウド利用やPaaS(Platform as a Service)などの連携が求められることで、システム全体はますます複雑になりつつある。
一方、企業活動におけるシステムへの依存度に比例して、システムの可用性の重要度も高まっている。システムは常時稼働しているのが当たり前であり、万が一障害が発生してシステムが停止すればビジネスに多大な影響を及ぼし、停止時間が長ければ長いほど損害は増大する。
こうした中で問題になるのが、いかにシステムの迅速な復旧環境を整備するかという点だ。地震などの自然災害だけでなく、計画停電やサイバー攻撃対策などによってもシステムを停止させなければならない事態は発生する。その際に、本当に短時間でバックアップサイトを立ち上げてシステムを切り替えることができるのだろうか。
東日本大震災以来、多くの企業では本番サイトとは別に遠隔地にバックアップサイトを用意し、いざというときの備えを進めてきた。しかし、実際のシステム復旧環境は多くの不備を抱えたままだ。復旧の作業手順がマニュアルベースで自動化されていなかったり、机上のシミュレーションをしただけで、実践的なリハーサルの経験がなかったりする。
こうした事態にシステムの複雑化という要因がさらに拍車をかける。システム全体は多くのサブシステムで構成されるようになり、復旧環境もそれぞれのサブシステムで完結している。ビジネスの継続性という観点からは「システム全体での復旧」が求められるが、実際に全てをカバーしているケースは少ない。
なぜ、システム全体での復旧環境が整備されていないのだろうか。システム復旧環境の具体的な課題を整理しつつ、求められる解決策を考えてみたい。