因变量y的95%预测区间为什么是±2个西格玛?
微信学习群里有一个小伙伴在计算y的预测区间时,不明白为什么是±2个标准差。
首先,预测区间指的时当y取单个值时的区间范围,这一点要和置信区间区分开。
比如,通过回归分析得到一个回归方程y=2x+1,标准差是1。
当x=2时,y=2*2+1=5
此时,y是一个单值,它的预测区间就是±2个标准差,也就是[5±2*1],即3~7.
其次,预测区间为什么是±2个标准差?
大家想一下,95%的范围是不是±1.96?我们通常说a=0.05的时候,分位数z=1.96,这个时候的置信水平就是95%。
因此,为了方便计算,1.96约等于2。
这一点,在红皮书上也有提及,比如:
如果你正在备考六西格玛绿带或黑带考试,请关注一下微信公众号“自习人课堂”,或者添加微信:dadu19
[自习人课堂]提供六西格玛绿带和黑带考试备考四件套:视频课、直播课、每一题都有解析思路与步骤的专业题库、全程答疑服务。
全部 0条评论