实验设计的三大基本原则你都了解吗?
在试验设计中必须要考虑三个基本原则:
重复(replication)
随机化 (randomization)
区组化(blocking)
这是统计学家费舍尔(R. A. Fisher)提出的,在实验设计方面有重要的指导意义,下面我们就图文并茂的来详细讲解一下。
重复有时也简称为“复制”、“仿行”,是指一个处理要施于多个试验单元。
理论上讲,进行试验的目的就是比较不同处理之间是否有显著差异,
我们这里是把一个处理所能获得的结果看成一个总体,
而实际进行试验时所获得的结果是各个处理所形成的不同总体的抽样。
显著性检验都是拿不同总体间形成的差别与随机误差相比较,
只有当各总体间的差别比随机误差显著大时,
才说“总体间的差别是显著的”。
我们知道,误差总是会出现的,这个世界上没有两片一模一样的叶子,
没有随机误差的估计也就无法进行任何统计推断。
为此,在处理相同的条件下一定要进行完全重复的试验,以便获得试验误差的估计。
这里啰嗦一句,minitab里的仿行数如果填1,代表什么含义?
这里的1,是重复了1次还是没有重复呢?
可以看到minitab输出结果:
这是一个2因子2水平的全因子试验,加了3个中心点,试验次数是2²+3=7,
仿行数1,有同学就认为重复了一次,
但是实际上minitab的逻辑仿行1是没有重复的,
仿行2才是重复1次,是不是有点奇怪?
这里大家需要理清一个概念,
重复是在相同条件下重新做完全重复试验,
而不是单纯的去重复观察或者重复取样。
因为同单元重复取样得到的差异估计试验误差将会造成低估,
识别不出真实的误差,所得的结论就都是不可信的。
(敲黑板:重复可以识别纯误差,可提高效度)
我们在试验安排中一定要包含真正的重复,完全的重复。
当然,完全重复不一定要对所有处理全都重复,
例如可以安排只在“中心点”处进行完全重复用以估计纯误差,
别处只进行一次试验,这将大大节省试验费用。
随机化是试验设计的第二个原则
随机化的含义是以完全随机的方式安排各次试验的顺序。
这样做的目的是防止那些试验者未知的但可能会对响应变量产生某种系统的影响。
举个通俗易懂的例子:在试验设计中,X1是温度,X2是时间,Y是强度。
X1有100,110,120,130,140五个水平,
X2也有50,40,30,20,10这五个水平,
如果我们不随机打乱温度和时间的顺序,
操作者按照这个顺序测量强度得出的结果是依次增加。
那我怎么知道是温度增高使得强度增加
还是因为时间缩短导致强度增加呢?
这就说不清楚了。
如果将这些试验顺序完全打乱,则不会再出现上述问题。
随机化并没有减少试验误差本身,
但随机化可以使不可控因素对试验结果的影响随机地分布于各次试验中,
因此可以防止未知的但可能会对响应变量产生某种系统影响的出现。
(敲黑板:随机化并不能减少误差本身,也不能提高效度)
区组化是试验设计的第三个原则
在实际工作中,各试验单元间难免会有某些差异。
如果能按某种方式把它们分成组,每组内可以保证差异较小,
即它们具有同质齐性,而允许区组间有较大差异。
这将使我们可以在很大程度上消除由于较大试验误差所带来的分析上的不利影响。
一组同质齐性的试验单元称为一个区组 ,
将全部试验单元划分为若干区组的方法称为区组化或分区组。
通过在同一个区组内比较处理间的差异,
就可以使区组效应在各处理效应的比较中得以消除,
从而使对整个试验的分析更为有效。
举个例子:假定在白班、夜班时段内差异不大(视为组内误差),
而白班、夜班差异可能较大(视为组间误差),
就把白班、夜班当作两个区组。
这时在分析中就可以去除掉白班、夜班间差异的影响,
或尽可能把试验全都安排在白班(或夜班)进行。
如果分区组有效,可以将区组与区组间的差异分离出来,
这样就能大大减少可能存在的未知变量的系统影响。
(敲黑板:区组可以减少误差,提高效度)
当然,在区组内还应该用随机化的方法进行试验顺序及试验单元分配的安排。
那么有同学要问了,什么时候用分区组,什么时候用随机化 呢?
在试验设计中应遵照下列原则:“能分区组者则分区组,不能分区组者则随机化”!
距离中质协六西格玛考试还有1个月时间,既然学习了知识,我们不妨来做两道相关类型的题,
这是公众号:自习人课堂《黑带试卷2》的试题
大家做完以后可以看答案和解析
这道是2023年考的六西格玛黑带真题,有点难度哦 ~,~
各位也可以在留言板上写下答案
我会一一回复。
需要相关资料,想进学习交流群,学习计划,备考攻略,项目辅导等,扫码添加微信
暂无评论