第 5 章 可靠性指标
可靠性指标用于使用限定措施表达软件组件的可靠性。您使用的指标取决于应用可靠性指标的系统类型以及应用域的要求。从站点可靠性工程角度来说,需要专注于 Java 应用程序的一些关键指标。
失败的时间
平均故障时间(MTTF)是两个连续故障之间的时间间隔。您用于测量 MTTF 的时间单元取决于系统,还可由事务数量定义。对于具有大型事务的系统,MTTF 通常一致。
修复的时间
补救时间(MTTR)是跟踪导致失败和修复错误所花费的平均时间。
表示故障之间的时间
当您组合 MTTF 和 MTTR 指标时,结果等于 Mean Time Failure (MTBF)。时间测量是实时的,而不是 MTTF 中包含的执行时间。
失败的速度
失败率(ROCOF)是以单元时间间隔内发生的故障次数,并专注于经常发生、意外事件的可能性。
Demand 上的故障的可能性
在 Demand (POFOD)失败的可能性是系统在发出服务请求时失败的概率。POFOD 是安全关键系统以及偶尔需要服务的安全系统保护系统的重要措施。
Availabiity
可用性测量系统可在任意给定时间使用的可能性。您必须考虑修复时间和系统的重启时间。