自习人课堂:数据非正态可以计算CPK吗?
我们知道计算Cpk的前提条件有两个,一是要过程受控,二是数据要服从正态分布。
那么如果数据不是正态分布,该怎么计算Cpk呢?
首先,第一步我们要验证数据是否稳定,看过程是否受控
先随机一组自由度为5,数量为20的卡方分布
我们知道卡方分布不服从正态分布
通过概率图来看,的确也不服从正态分布。
然后我们看这组数据是否稳定,做控制图来看
控制图显示数据标签第五个数据点出界了,说明过程不受控
我们去观察原始数据发现第五个数据有点异常,出现极大值13.6780
假设这是一个异常数据,我们将它剔除后再做控制图看看
这个时候就过程受控了
这个时候就有同学问,查明原因后剔除了异常值会不会数据就正态了呢?
我们试试
这个时候概率图的P值0.207大于0.05,数据正态
这就是为什么数据不是正态分布的时候
我们首要做的是分析原因,而不是直接去转换
看是不是有什么异常情况导致数据非正态
当然这个例子有很大的偶然因素在里面,
并不是每一次剔除异常值都能使得数据变为正态分布
第二步,非正态数据常用转换方法
假设刚才我们随机的数据就是正常情况
数据5也不是异常数据,确确实实不正态
我们常见非正态数据转换的方法为Box-Cox变换
我们将变换后的数据存储在C2列标注“变换后数据”
最终得到这个图,可以看到数据变换以后发生了变化,那到底发生了什么样的变化呢?
通过这个图,我们可以看到Lambda的均值有95%的概率落在(-1.01,0.51)之间,系统给到估计值为-0.20,
为了便于计算,minitab取整值为0。
Lambda取值不同,转换方式也不同,总结如下图
这里取值为0,说明应该取自然对数
也就是通过Ln(Y)转换
我们对变换后的数据做稳定性验证
其次,做正态性验证
得出结论:转换后的数据稳定且正态
满足了算CPK的条件
所以接下来我们才能做过程能力分析,得出CPK值
注意,规格上下限也要跟着做Ln(Y)的变换才行哦
end~~
2025通关六西格玛考试,
就从自习人课堂「备考四件套」开始!
备考六西格玛的同学可以添加六六老师微信:zixiren666
免费领取海量备考资料
全部 0条评论