米アマゾン・ウェブ・サービシズは2011年4月21日(米国時間)、仮想マシン貸しサービス「Amazon EC2」で21日未明から発生している障害の復旧が、当初の想定よりも長引くとの見通しを示した。米国東海岸データセンターの一部区画で、外付けストレージサービス「Amazon Elastic Block Storage(EBS)」が利用できなくなるという障害が続いている(関連記事)。

 米国東海岸データセンターでは当初、二つのデータセンター区画(Availability Zone:AZ)で、EC2の仮想マシンに接続できなくなったり、EBSの遅延が大きくなったりするなどの障害が発生した。EBSは、EC2仮想マシンから利用できる外付けディスクボリュームを提供するサービスである。

 EC2仮想マシンの障害は2時間で復旧したが、EBSの障害は発生から半日以上経っても全面復旧していない。障害を起こした二つのAZのうち一つではEBSが復旧したが、もう一つのAZでEBSの障害が続いている。そのため、リレーショナル・データベース・サービスの「Amazon Relational Database Service(RDS)」など、内部でEBSを利用している他のサービスにも影響が出続けている。

 アマゾン・ウェブ・サービシズは、EBSで障害が発生した経緯も明らかにした。それによれば21日未明、米国東海岸データセンターでネットワーク障害が発生し、それがトリガーとなって、EBSのディスクボリュームの複製を作り直す(再ミラーリング)というオペレーションが大量に発生した。

 複製の作り直しが多発することで、あるAZにおけるストレージ容量が足りなくなり、EBSの新しいボリュームが作成できなくなったほか、複製を作り直すという作業自体にも遅れが生じ始めた。さらに、複製の作り直しの多発やストレージ容量の枯渇によって、EBSの管理ノードも1台ダウンし、障害が拡大した。

 同社は現在、ストレージ容量の追加を行うことで、ディスクボリュームの複製作業を早期に完了させようとしている。それでも日本時間22日午後1時現在で、一つのAZでEBSが復旧していない。障害が発生しているAZでは、EBSのディスクボリュームに記録したユーザーのデータなどが、読み出せなくなっている。