本稼働中のサーバー機にパッチをいきなり当ててしまうと,故障間近のサーバー機がパッチの適用をきっかけに故障することが多い。そうなると,故障の原因がサーバー機自体にあったのかパッチにあったのかすぐに判別できず,問題の切り分けに時間がかかる。だから,本番機にいきなりパッチを当ててはいけない。

 パッチをきっかけに故障するのは偶然ではない。長期の安定稼働とパッチの適用では,サーバー機に与える負担に大きな違いがある。その違いをスポーツのマラソンを例に説明しよう。

 長期にわたり安定稼働しているサーバー機は,ペース(=負荷)の増減はあるものの,決まり切った筋肉(=リソース)を使い,一定の運動(=処理)で済んでいる。これに対してパッチの適用は,短距離ダッシュやスクワットのようなもの。要求されるペースも,使う筋肉も,成すべき運動も,マラソンとはまるで異なる。

 技術的に言えば,平常時より大きな電力を消費したり,普段は使わないデバイスや領域にアクセスしたりする。発熱量も急激に上がる。その結果,「パッチの適用中に,特にディスクやディスク・コントローラ,チップなどの部品の故障が頻発する」(パッチの適用などを数多く経験しているラック SNS事業本部 JSOC部 グループリーダ 花岡顕助氏)というわけだ。

 そこでサーバー機にパッチを適用するときには,あらかじめサーバー機のOSを再起動させておく。この“準備運動”で,具合が悪くなりつつあるサーバー機を見極められる。「故障間近なサーバー機は,たいていOSの再起動に失敗する」(花岡氏)からだ。うまく再起動できたサーバー機にだけパッチを適用する。もしパッチ適用後に動作不良が起きると,その原因はパッチにある可能性が高い。問題の切り分けが楽になる。