控制图八大判异原则的第5条:“连续15点在中心线两侧的C区内”。这是许多熟悉控制图的小伙伴烂记于心的一个原则,
为什么连续15点在中心线两侧的C区内就要判定异常?俗话说:知其然,还要知其所以然,今天来唠叨唠叨。
首先,还是要从小概率事件说起,这是基于3σ理论,落在3个σ里面的概率是99.73%,而界外的概率则是0.27%。因此,定义概率<0.27%的事件是小概率事件。
一旦事件发生概率低于这个值,则认为是小概率事件,小概率事件不是那么容易发生,至少在一次试验中绝对不可能发生。一旦出现,则认为是异常。
这是基础理论。
“连续15点在中心线两侧的C区内”是什么意思?
在标准正态分布里,根据σ与中心线,又把±3σ细化成6个区域,即A/B/C,如下图:
一个σ区域定义为C区,两个σ区域定义为B区,三个σ区域定义为A区。“连续15点在中心线两侧的C区内”则是样本观测值连续有15个点都在±1σ内,记住是连续、连续、连续,重要的话说三遍。
根据上图,可以知道落在中心线上侧或下侧的概率是34.14%+34.14%=68.28%
那么:
连续14个点在中心线两侧的C区内的概率:68.28%^14=0.47%>0.27%(小概率事件)
连续15个点在中心线两侧的C区内的概率:68.28%^15=0.32%>0.27%(小概率事件)
连续16个点在中心线两侧的C区内的概率:68.28%^16=0.22%<0.27%(小概率事件)
可见,连续16个点在中心线两侧的C区内的概率比小概率事件发生还要小,已经出现异常。而且控制图是以观察或判定事件发生的趋势为目的,做到提前预判、提前遏制,因此以连续15个点在中心线两侧的C区内的概率判定是异常。
各位小伙伴可以根据这个思路理解或计算一下其它几个判异原则中的发生概率。