假设检验的\置信区间\判定法,经常犯的一个错误
首先,判断两组数据的均值是否有显著性差异,是假设检验里面的重要知识点。
其次,对于判定两组数据的均值是否有显著性差异的方法,相信你张口就来:“p值法、置信区间法、临界值法”。至于具体的判定准则,相信已经深深的印在你的脑海里,甚至比结婚纪念日是哪一天记得还要清楚。
如果有人问你相关的问题,你犹豫只要超过5秒钟,你就输了!
当显著性水平a=0.05时:
1.p值法
p≤0.05,拒绝原假设H0;否则,没有足够的理由拒绝原假设H0。
2.临界值法
检验统计量落在拒绝域,则拒绝原假设H0;否则,没有足够的理由拒绝原假设H0。
3.置信区间法
观察原假设的均值是否落入置信区间内,不落入则拒绝原假设H0,落入则没有足够的理由拒绝原假设H0。
关于置信区间法,有许多说法,比如观察0是否落入置信区间,或者置信区间是否有重叠。这篇文章的目的是在于分辨如何使用置信区间法。
为了便于理解,先晒出两组数据,熟悉的小伙伴一看,都知道小编用的是minitab。
目的:判定产线1与产线2的均值是否有显著性差异。
如果建立假设,则:
H0:两组均值无显著差异
H1:两组均值有显著差异
今天不讨论p值法与临界值法,只聊置信区间法。
一、两组数据的置信区间情况
先分别计算两组数据的置信区间,我不傻,不想手动计算的,借助minitab,方便、快捷、高效。
从以上两个图中,我们得知:
产线1均值的置信区间:524.61~538.59
产线2均值的置信区间:517.48~527.52
如果画图出来,红线范围是两个置信区间的重合区域(画的太丑,勿介意)。
由此,我们是否可以作出判断:产线1与产线2的均值之间是没有显著性差异的?
快!快!快!用你高于130的智商,思考一下。
有的小伙伴会说:“嗯嗯,没显著差异,无法拒绝原假设H0”
二、P值法
我们再看一下minitab计算的p值
p=0.035<0.05,拒绝原假设H0。
与上述置信区间的判断结论是相反的,什么原因?难道是置信区间法不准确吗?
到这里,再思考一下!
三、正确的置信区间判定方法
不是置信区间法不准确,是我们比较错了对象。
我们使用置信区间法,关注的应该是两组数据均值的差值的置信区间,而非两组数据均值的置信区间是否有重合。
换句话说,我们不能直接比较两组数据的均值的置信区间分布,而是要看“其均值的差值的置信区间是否包含0”。因此,我们应该看的是“差值的95%置信区间”:
为了便于理解,举一个不怎么恰当的例子。算上绩效,你每月的工资大概在5000~10000,你领导的工资每月在9000~15000。
你和领导的工资区间确实有重合的部分,但你摸着良心说你们俩的工资是在同一个档次吗?
四、计算差值的置信区间
对于两个独立样本,且假设两总体方差齐性(方差相等)时,均值差值(u1-u2)的置信区间为:
x1、x2:样本1与样本2的均值
n1、n2:样本1与样本2的大小
df:自由度,df=n1+n2-2
Sp:合并标准差(书上有公式)
t(a/2),df:自由度为df,显著性水平为a时的t分位数
接下来我们就 计算均值差值的置信区间:
1.计算样本统计量
x1=531.6,x2=522.5,S1=9.78,S2=6.00,n1=10,n2=8,df=10+8-2=16,t(0.025,16)=-2.12
2.计算均值差值的置信区间
将样本统计量带入均值差值置信区间的公式,即可计算出均值差值的置信区间是0.8~17.4
3.作出判断
均值差值的置信区间是不包含0,因此应该拒绝原假设H0,认为两组数据是有显著性差异的。
假设检验的判定方法是六西格玛绿带与黑带书上的重要内容,也是中质协六西格玛考试的高频考点。在直播课中多次强调,不要求计算,但给出一个情景与minitab输出结果,我们要能准确、快速的作出判断。
如若各位有关于六西格玛绿带与黑带考试相关的问题,请添加微信:dadu19,或识别下面的二维码。
【自习人课堂】提供六西格玛绿带与黑带考试备考“四件套”-视频课、直播课、有解析的专业题库、全程答疑服务,助力各位小伙伴通过考试,拿到六西格玛证书。
全部 0条评论