列联表是研究两个因子之间是否互相独立,是否具有关联性的方法,主要应用于离散型数据。
首先,举一个最常见的例子: “吸烟与咳嗽”,目的是通过卡方检验分析吸烟与咳嗽之间是否有关联,简单随机抽样取得下表的数据:
经过minitab分析之后,我们会得到卡方检验的结果,卡方检验的分析结果主要有两部分内容,如下:
一.卡方检验p值
P=0.002<a=0.05,则拒绝原假设,说明吸烟与咳嗽不是互相独立的,具有一定的关联性。
二.列联表
初始的列联表即是第一张图所示,这是分析之前进行数据整理的结果,是原始数据。而经过卡方检验之后,这张表格会增加一些内容,如下图:
与原始的列联表比较,这张列联表增加了两个内容:No.2期望频数与No.3对卡方统计量的贡献。
列联表期望频数是怎么计算的?
期望频数是预计频数,在分析过程中是与实际发生的频数进行比较。如果两个因子互相独立不具有关联,则期望频数与实际频数相差不大。
P不吸烟=(1100+100)/2000=0.6
P吸烟=(700+100)/2000=0.4
P咳嗽=(100+100)/2000=0.1
P不咳嗽=(1100+700)/2000=0.9
则,不吸烟不咳嗽的比例=0.6*0.9=0.54
因此,期望频数=0.54*2000=1080
同样,按照这个思路,可以计算出其它几项的期望频数。