本帖最后由 仙賢戀軒 于 2014-7-29 19:21 编辑
在购买电子产品的时候,经常可以看到一个指标“MTBF”,MTBF是“Mean Time Between Failure”的缩写,中文译作“平均无故障时间”。这个参数对于我们DIY玩家来说尤其常见如硬盘等于存储类产品中。而通常硬盘上该指标的参数都很大,往往是几十万小时甚至几百万小时,要知道1年拢共才365天x24小时/天,大概8700小时,算来一百万小时可是有一百余年的时间。那么是不是这个硬盘可以保证工作一百年不出故障呢?如果不是,那么如此标识有又何意义呢?
想要搞清楚这里面的一切缘由,我们就必须从产品本身开始出发。
事先声明,本文只是科普性内容,偏重于新手对内容有感性认识,不会纠结于数理统计上的严谨性,如果对此有兴趣的朋友欢迎另开一贴进行交流。
通常,电子产品的故障率可以分为三个阶段:早期故障、使用故障和磨损故障。
早期故障是指由于产品本身的设计和生产等的问题导致产品本身存在问题,这种这类故障率通常会很高,但随着时间的流逝会迅速下降,这也就是许多厂商做出厂测试的原因,可以通过短期的高强度测试筛选掉大多数问题产品。
使用故障是指在正常使用过程中产生的故障,这种故障的诱因往往是使用环境和使用方式,故障率通常很低且可以被修复。
磨损故障是指产品本身使用已经超越了厂商保证工作时间或工作量之后由于产品本身的损耗而产生的故障,这种故障的发生率会随着产品使用时间的推移急速上升。
所以,通常我们讨论的是在使用过程中产生的可被修复的故障,而对于像硬盘这样的产品而言,即便是发生可被修复的故障也会是致命的,因而MTBF就是被用来描述产品这种概率的参数。为了便于各位理解,也便于我的表达,我们不妨以一块硬盘为例。
比如一块硬盘的MTBF是100万小时,显然不可能真的让 一块硬盘连续运营100万小时等到其发生错误,那么一块硬盘的MTBF是怎么得出的呢?
不同的地区有着不同的标准,但大体上来几个主要步骤是一样的:先收集一定数量的同型号硬盘,在实验室中进行加速工作实验,记录下其中的具体工作时间和修复时间,再根据各地不同的标准进行换算得到最终的MTBF值。
那么,对于我们普通消费者而言,应该怎么去理解和认识MTBF呢?这里我提供一个比较简单的方法。
指数分布通常被用于预测产品的使用寿命和周期,虽然指数分布的无记忆性和产品的实际发生情况略有出入,但作为一个大致估计来说精确度已经足够。对于指数分布而言,其期望值是其参数的倒数,也就是说:
那么假设一个硬盘的MTBF是100万小时,约合114年,那么就可以这么考虑:
E[X]=1/λ=114,λ=1/114≈0.88%,也就是说预期该产品的年故障率是0.88%。
这里我们不妨来看一下不同MTBF引起的差异。比如两块不同型号的硬盘,其MTBF值分别为80万小时和150万小时,看上去差了几乎一半,然而用上面的算法去考虑,实际上期望年故障率是1.10%和0.58%,差距也只有大约0.5%。按照这个年故障率来计算,可以得到一张表:
在MTBF差了近一半的情况下,即便是连续用5年其期望无故障率差距也没有超过3%。当然,这里肯定会有人问:我看硬盘的返修率通常都是2%-4%,为什么和你计算出来的数字差那么多呢?这只是一个理论计算的估计值,和实际发生的情况可能产生一定的差异,在实际的使用过程中,会受到各种环境影响的制约,根据每个人的使用情况和使用频度,即便实际返修率比这个期望值低也是不无可能的。更何况,统计数字只有在多次试验的基础下才有意义,普通用户买个一块两块的几乎可以说和返修率没有关系。
|