一部电影读懂六西格玛假设检验
假设检验是六西格玛项目管理中最常用的一个统计工具,而且是最绕的,搞明白一个假设检验可能会让脑细胞伤亡一半。
为了更通俗的解释六西格玛假设检验的概念,我们从日常生活中最常见的电影说起。
周星驰,香港喜剧演员,是我最喜欢的演员之一,曾经带来了许多的欢乐。
纵观周星驰的电影,每一部都能让人捧腹大笑,可以毫不夸张的说,周星驰所有的电影平均评分应该在9左右,即使偶尔有一些片子评分低,但分值波动很小,也就1分左右的来去。
然而,最近周星驰的一部电影:“喜剧之王2”,一些媒介与观影者的评分都不太好,其中一家媒介给出的电影评分分别是8、9.2、7.5、8.5、9、8.5、9.1、8.2.
或许,有人看到这些数据之后会大呼:“周星驰江郎才尽,拍出来的电影不行了,平均分才8.5,以前平均分可是9哎”
真的是这样的吗?我不相信自己的偶像实力下降了,带着疑问,用刚刚学的六西格玛的假设检验证实一下,否否周星驰真的水平下降、江郎才尽?
假设检验有一套完整的步骤,初学者可以根据步骤计算即可,不要迈的太快,“步子迈的太大容易扯着蛋”。
1.首先建立假设
H0:u0≥9
H1:u1<9
H0是原假设,H1是备择假设。通常,我们常把想要证明的观点作为备择假设,而已知或者不需要证明的作为原假设。
比如H0:u0≥9,是已知的,是根据周星驰很多年的电影评分得出的结论;H1则是我们想要证明的。
若证明H1是对的,则表示 “喜剧之王2”的评分确实不如以往,周星驰有点江郎才尽。
2.选择检验的统计量,确定拒绝域
由于时间、精力有限,不可能把媒介上的所有分数全部统计出来。因此,随机选取了8、9.2、7.5、8.5、9、8.5、9.1、8.2这8个样本,用这8个样本的检验统计量去推断总体。
如上图,如果推断出来的统计量落在阴影部分(拒绝域)中,则拒绝刚才的假设H0,承认H1,认为周星驰确实水平下降、江郎才尽。
如果推断出来的统计量落在阴影部分(拒绝域)外,则无法拒绝刚才的假设H0,承认H0,拒绝H1,认为周星驰确实水平没有下降。
3.确定显著性水平a
通常情况下a=0.05,显著性水平的意思是我们犯第一类错误的概率只有5%。
犯什么错呢?
假设H0是真,但是呢,由于在媒介上选取的电影评分是随机的,可能会导致推测出来的统计量落在拒绝域中,让我们错误的拒绝H0、承认H1,错误的认为周星驰江郎才尽。
为了避免出现这种错误,统计学里给出了一个显著性水平a,要求犯这样的错误的概率小于a,通常取0.05.
4.给出拒绝域的临界值
显著性水平a=0.05,查表可知道拒绝域的临界值Z=-1.64
5.计算检验统计量
根据上面的描述,已知u0=9,暂且把分值的波动作为标准差σ=1,u1=8.5
在方差已知的前提下,采用Z检验,根据Z检验的计算公式,由选取的样本计算检验统计量:
Z=[(8.5-9)]*根号下8/ 1=--1.41
由上图可知,检验统计量Z=-1.41落在了非拒绝域(承认域)。
因此,我们无法拒绝原假设H0,认为H0的假设是对的,意思是 “喜剧之王2”的平均分稍低,仅有8.5,但根据这些评分无法说明周星驰水平下降、江郎才尽,属于其电影评分的正常波动。
在日常工作中,我们常常接触大量的数据,更经常用样本的数据与以往的数据进行对比,但是采用最多的是平均值。
如果计算出来的平均值稍微低,我们想当然的认为水平下降了。
但是,只是想当然。
暂无评论