ITIL 徒然草

保守性


前回は信頼性の説明をしましたが、その中で持ち越した可用性と 信頼性の関係について説明します。結論から言えば、可用性には 保守要因が含まれていますが、信頼性には保守要因が 含まれていません

つまり信頼性は、サービス復旧に費やされる時間に影響されるべき指標ではありません。 たとえ、修理に手間取り復旧に時間がかかってユーザの信頼を失ったとしても、 それはあくまでもサービスの可用性の問題であり信頼性の 問題ではありません。さらに言及すればサービスの保守性の問題になります。

保守性は保守のしやすさを表す指標であり、障害を検出する能力障害からの復旧する能力の高さを表すものです。保守性が高めることで、障害からの 復旧時間を短縮することができれば、結果的としてサービスの可用性を高めることができます。

合意された機能をサービスが提供し続けるためには、サービスを中断させない仕組みを 用意すると同時に、サービスの停止時間を短縮することが必要です。 そこには次に様な式が成り立ちます。

サービスの可用性 = サービスの信頼性 + サービスの保守性

すなわち、サービスを中断させないということはサービスの信頼性を高めることであり、 サービス停止時間を短縮するということはサービスの保守性を向上させることなのです。

信頼性を測る代表的な指標に平均故障間隔がありますが、 保守性を測る際には平均サービス回復時間 (MTRS:Mean Time to Restore Service) という指標が利用されます。 これは文字通り、サービスが停止してからユーザが利用できるようになるまでの 平均時間です。

ちなみに、平均サービス回復時間には、従来、平均修理時間 (MTTR:Mean Time To Repair) という言葉を使用していました。しかし、「修理」が「コンポーネントの修理」なのか、「サービスそのものの修理」 なのか明瞭でないという指摘があり、V3 から平均サービス回復時間という言葉が 使われるようになりました。

次回は、2009/11/10 の予定です。

第84話 第86話