标准差符号(样本标准差符号)
所有接触质量工作的人,相信都对休哈特控制图并不陌生。休哈特告诉我们,只要超过±3倍标准差的,可以判定为异常值,需要查找是否有特殊原因造成不稳定波动。
自从通用电气的前CEO杰克·韦尔奇在全世界大力推广六西格玛,近年来六西格玛在企业中可以说是蓬勃发展。很多人在初学的时候,会听到老师说,所谓的六西格玛,就是过程中的波动足够小,能在"单边"公差容纳6倍标准差,这就叫做六西格玛。
很多人就纳闷了,这两者到底有什么区别呢?
为了回答这个问题,我们得先搞清楚两个概念,"标准差"以及"正态分布"。
· 正 · 文 · 开 · 始 ·
首先讲什么是标准差,大家看看下面两组数字:
1 3 5 7 9
3 4 5 6 7
这两组数字的平均值都是5,那么哪组数字的波动比较大呢?明显是上面那组。那么我们该用什么数字来描述每组数字间的"离散程度"呢?
我们第一步就是考虑每一个点跟中间值的差距,并进行累加再平均。但结果就是:
为了抵消掉正负值的影响,我们使用平方后再相加,然后再除以个数,这个值我们称之为"方差",我们计算这两组数据的方差如下:
但这是平方后的结果呀。所以我们得再重新给他们开根号,这样算出来的数值,我们就叫他"标准差",用希腊字母σ 表示(发音叫做西格玛Sigma),可以代表每个数字跟平均值分别去比较后再统计出来的偏差程度。常见缩写为 S (整体标准差)或者是 σ (样本标准差)。
做为给小白看的科普文,标准差的完整公式我就不放了,这边先知道标准差怎么来的就行了。
需要提醒的是,这里是5个数字,底下除以5。但实际在应用的时候,比如工厂中的抽样,计算标准差的时候要写n-1,比如从所有产品中抽取10去推算总体的标准差,底下就要除以9。至于为什么,这篇先不讲,有兴趣的朋友可以去研究。(下方链接慎入)
为什么样本方差的分母是 n-1?
上面是一级小白科普,接下来进入第二级
随著时代的进步,我们可以用数学的方法去抽样或是统计各种数据。比如我们可以抽样调查中国男子平均身高,并算出平均值以及标准差。如果你现在去抽查一家集团公司1000位男性身高,并将统计数字画成直方图。不意外的话,大概会长这样:
虽然上图的数据是我瞎掰的,不过相信跟我们一般人的常识也八九不离十。从中可以看出平均值是169公分,七成左右的人大约坐落在163-175之间,特别高或特别矮的人虽然也有,但人数随之递减。
聪明的你大概也发现了,上图右手边还计算出标准差是5.9,上面我说的163-175大约刚好是在一倍标准差的区间。
关于这个神奇的现象,在200多年前,德国数学家高斯就发现了,他将这种自然界中普遍存在的分布,叫做正态分布。
关于正态分布我们再看一下下面这个影片。只要数量足够多,小球通过下方随机的碰撞,最后落在下方的状态也符合正态分布。
为了纪念高斯的成就,德国人特地将高斯的头像,还有他提出的正态分布的图形公式放在德国的钱币上。
通过高斯提出的正态分布的计算,我们可以推算出,不同的标准差,在正态分布的图形中的位置及出现概率。
上图可以看出,在正态分布中,±1σ、±2σ、±3σ下的概率分别是68.3%、95.5%、99.73%。
将这个数学模型与上面的身高分布进行对照,是不是很有意思呢。你也可以再想想看生活中还有哪些正态分布呢。
第三级来啦,要进入重点了
时间继续往后推移,到了1924年,美国的休哈特博士提出了世界上第一张控制图,并将其应用在工厂的生产线上。
休哈特认为,当你的参数数据符合正态分布的情况下,99.73%的数据应该是在三倍标准差之内的(详见上一小节)。
一旦你的数值超过了三倍标准差,你就该有警觉了,这种小概率事件是正常波动或是有特殊原因造成的呢? 你的生产过程是否处于稳定状态呢? 通过控制图的绘制,您可以去检验该过程的稳定性并进行即时监控。
如果我们把三倍标准差之间的数据波动,当成是我们公司的过程能力。而客户给的上下公差规格线当成是客户要求。这客户要求比上过程能力的比值,我们一般称之为过程能力指数Cp。
当规格线与±3标准差重合时,Cp值等于1,如果你的过程能力愈强,产品波动愈小,标准差愈小,则Cp值愈大,可能到达1.33或1.67等等。。。
扯远了,关于过程能力指数,不在本文章的探讨范围,有兴趣的朋友,可以阅读本公众号的逗比系列,里面有相当多探讨。
回到控制图来,你需要知道的是,控制图中讲的±3倍西格玛(标准差),指的仅仅是过程数据在符合正态分布情况下,99.73%的波动范围。与合格率或公司能力无关。(除非加入客户规格线进行比较)
最后讲讲六西格玛
在20世纪末,摩托罗拉公司进行了一系列的质量改进活动。通过一系列的改进步骤,逐步减少产品的不良率,即尽可能的减少生产过程中的不稳定因素,将产品的标准差不断缩小。
举个例子来说,如果我们人工去包饺子,包100个可能会有大有小,但如果通过机器自动化包饺子,基本可以让饺子的大小尺寸固定在一个范围内。随著你的机器愈精密或优化其它干扰变因(比如面粉的比例),你的饺子大小尺寸的标准差将愈来愈小。
在1987年,摩托罗拉首先提出六西格玛的概念,也就是当产品的标准差足够小,小到在公差范围内能容纳±6倍标准差,那么产品几乎可以做到0缺陷。(注:在正态分布中,超过6倍标准差的概率是0.000000001 , 即0.001ppm。)
六西格玛是一个目标,至于怎么做到六西格玛,就需要一系列的六西格玛方法论了。