システムの信頼度を計算する

 複数の機器を組み合わせたシステムの可用性を検討するときには,「故障率」から「信頼度」を計算できることを覚えておきたい。

 故障率とは,単位時間当たりに故障が発生する確率のことである。平均故障間隔(MTBF)の逆数が,故障率となる。ベンダーにもよるが,機器の平均故障間隔の情報を開示していることがあるので,その情報から故障率を求める。例えば平均故障間隔が100万時間のSCSIディスクがある場合,故障率は100万分の1件/時間となる。

 これに対して信頼度とは,故障が発生し得る機器が,ある期間内に正常動作し続ける確率のことである。信頼度は次の式で表される。

信頼度=e^(-故障率×期間)

 「e」は自然対数の底(約2.72),「^」はべき乗を表している。例えば,1カ月当たりの故障率が100分の1の機器の年間(12カ月)の信頼度は「e^(-0.01×12)≒0.89」となる。

 こうした個別の機器の信頼度を積み重ねると,システム全体の信頼度を計算できる(図1)。信頼度が低い装置が含まれている場合は,装置の二重化などの対策で全体の信頼度を底上げできる。

図1●システム構成から信頼度を求める
図1●システム構成から信頼度を求める
全構成要素の信頼度に基づいて,全体の信頼度を測ることができる。図の場合,ディスクを二重化することで信頼度が約0.14ポイント上がる
[画像のクリックで拡大表示]

 前述した信頼度の計算式は,「ポアソン分布」と呼ぶ統計学と確率論に基づき求められる。詳しい説明は省くが,ポアソン分布の計算式は下記のようになる。

 λは故障率,xは故障の発生回数である。

 この計算式を利用すれば,年間に何回の故障がどれくらいの確率で起こるのかを算出できる。仮にシステム全体の年間故障率が0.6だったとすると,年に5回までしか故障しない確率は0.99996となり,年5回以上の故障発生はまず無いという結果を導き出せる。

 ただし,このような計算が成立するのは,ハードウエアだけと考えた方がよい。それに,同じハードウエアでも,現実には設置状態(温度,湿度,振動など)によって故障率は変わってくる。ましてソフトウエアに起因する計画外停止を考慮に入れると,一般的にハードウエアは無停止か,あるいは年間1回程度の故障で済むように設計すべきだろう。


高安 厚思(たかやす あつし) オープンストリーム テクニカルコンピテンシーユニット 主管システムズアーキテクト
銀行系シンクタンクでオブジェクト指向技術の研究に携わった後,大手SI業者でアーキテクチャ構築やプロセス研究を担当。現職ではSOA(Service Oriented Architecture)を中心とする研究開発とアーキテクチャ構築に従事している