样本量计算公式(样本量计算公式最简单)

80酷酷网    80kuku.com

样本量计算公式(样本量计算公式最简单)原创2021-08-08 15:09·臭皮匠试验室

本文为臭皮匠试验室(同微信号)观点。转载请请注明出处。

在产品设计开发阶段,会通过一定样本数量的DV/PV测试验证,以评估产品全体对象的失效行为。那么,在可靠性目标确认的前提下,样本量的大小究竟对全体评估有什么样的影响呢?产品的可靠性"五部曲",我们已经聊过了"质量"与"可靠性"、产品的寿命需求、可靠性目标的确认,今天我们聊第4部分:置信水平与样本数。

关于可靠性这块,按照如下逻辑进行归纳总结:

1. "质量"与"可靠性"

2. 产品的寿命

3. 可靠性目标

4. 置信水平与样本数

5. 加速模型

本文是对第4部分的介绍(想对之前内容进行回顾,可直接点选章节名称)。

4.1 样本数计算公式

开始介绍之前,我们再重温下"可靠度"和"置信水平"的概念:

"可靠度",英文名"reliability",指在整个生命周期内的特性,是指产品在规定的使用条件下和规定时间内,完成规定功能的概率。

系统是由许多零部件组成的,系统可靠性一般取决于:1) 各零部件的可靠性, 2)部件之间的组合方式, 3)相互匹配的各零部件、子系统与系统之间的关系,这与他们的物理装配关系相关。

"置信水平",英文名"confidence",指的是抽样指标和总体指标的误差不超过一定范围的概率保证度,描述的是一个随机变量落在一定区间内的概率。例如90%的置信区间就是说100例当中有90例会在这个区间之内。90%的置信区间是在5%-95%置信极限之间的区域。

下面这张图形象的表述的置信水平的意义:

产品可靠性,你可知"多少"?——置信水平与样本数

图1 通过试验样本获得对全体对象的评估

因此,当试验样本有限,而又需要对全体对象的失效行为进行评估时,前后两者评估结论可能会相去甚远,尤其是当样本数量很少的时候。此时,就需要利用统计学工具,通过“置信水平"帮助我们确认试验样品评估结果的可信程度,进而估计全体对象的失效行为。

逻辑清楚了,那么关系式是怎样的呢?如下:

产品可靠性,你可知"多少"?——置信水平与样本数

其中,R为可靠度,C为置信水平。

以R=97%,C=50%为例,其总的样本容量为23。

BUT, 考虑到项目周期、设备资源、成本投入等因素,一般很少会选择选择全体试验,那么这时候要怎么做呢?

4.2 如果样本数受限,怎么办?

考虑到项目周期、设备资源、成本投入等因素,可能要减少样本数,那么要怎么做呢?

在第3部分<产品可靠性,你可知"多少"?——可靠性目标>中,我们介绍过产品失效的三个阶段:早期失效、随即失效和磨损失效,并借用威布尔系数(Weibull shape),描述了产品进入随机故障阶段的速度,以及达到磨损后停止运行的速度。

产品可靠性,你可知"多少"?——置信水平与样本数

图2 浴盆曲线

因此,可以用下式来表征产品的使用寿命(L)、威布尔系数(β)、可靠度(R)、置信水平(C)和样本量(n)之间的关系:

产品可靠性,你可知"多少"?——置信水平与样本数

据此,我们可以在测试时长与样本数之间进行权衡。

以上,就是关于样本量大小对全体对象可靠性评估的影响解读。下节会对电驱动系统测试验证中几套常用的模型进行介绍,敬请期待!

最后,在网上看到关于"置信水平"和"置信区间"的白话表达,觉得很不错,贴在文章末尾,帮助我们理解。(未能查到源头,此处非商业用途,若有侵权请联系我)

- -----------------------------------

*小贴士:置信水平与置信区间*

统计量是指统计理论中用来对数据进行分析、检验的变量;参数,也叫参变量,是一个变量。统计量和参数都用来描述数据特征,参数用来描述总体特征,统计量用来描述样本特征。例如,为研究大学生身高分布,随机抽取一万个同学,在这个事件中,【大学生身高】的均值和方差为参数,【一万个同学身高】的均值和方差为统计量。

统计的一个重要作用就是"用样本估计整体",比如上面的【大学生身高】的例子,抽取的这一万名同学,身高均值可能与全部大学生身高均值相等,也可能不等,但是由于这一万名同学是从总体里抽取的,所以样本均值与总体均值的差距是有限的,即如果一万名大学生身高均值为170cm,那么全体大学生身高均值可能是165cm或者172cm,不可能是70cm,也就是说样本均值是一个在总体均值周围波动的值。但是,不管样本怎么变,所有样本的均值和总体均值的差值都不会超过某一个数,记这个数为c,置信度就是所取得样本均值和总体均值的差值小于这个c的概率,即【|x-μ|<c】的概率,这个概率就是置信度。

置信区间是一个以【样本均值】为中心的一段区间,因为总体均值是不变的,只是我们不知道,但是样本均值和方差是变化的,所以置信区间有可能包含总体均值,也有可能不包含总体均值。例如,95%的置信区间【不是】说总体均值在这个区间里的可能性是95%,而是任意选取100个样本,会得到100个均值和100个置信区间,而这100个置信区间里有95个包含了总体均值。

产品可靠性,你可知"多少"?——置信水平与样本数

如图,长虚线为总体均值,只有固定的一个值,短线为不同样本得出的置信区间,有的包含总体均值,有的不包含,其中包含总体均值的占所有置信区间的95%(99% or 99.9%)。

理论基础摆在这里,

而实际落地应用的却很少,

希望能借此传递出一份期待,

从零部件,到系统,到整车能将可靠性铭记于心,

莫要让前辈们的成果付之东流,

莫要让电动汽车成为花花架子。

分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间

上一篇台湾的风景名胜(台湾的著名八大景点)

下一篇狮子座的性格(彻底解析狮子座完整性格!)

点击: