常用的抽样方法:随机抽样与分层抽样
为了判断总体样本的状况,我们常常从大量的总体样本中抽取一定量的样本,从而用来推断总体的特征。为了确保数据的准确性与代表性,采用合适的抽样方法是一件比较重要的事情。
根据抽样方式的不同,常用的抽样方法有两种:简单随机抽样与分层抽样
一、简单随机抽样
顾名思义,简单随机抽样是按照随机的原则从总体中抽取样本,根据抽取样本的情况推断总体样本的特征。既然是随机抽样,必须满足两个基本条件:
1.等可能性
总体样本中每一个样本被抽中的概率是相等的
2.独立性
每次抽样是相互独立、互不干扰
简单随机抽样的方法有许多种,比如抽签法,这是最为常见的一种;比如滚球法,看过彩票开奖的朋友应该很了解这种方法。比如计算机模拟法,这在一些年会中经常用到,每一个员工另一个号码,由计算机随机抽取。
二、分层抽样
分层抽样又叫分类抽样,先把总体按一定的类别标识出来,比如按班次、设备线等,这就组成了层,然后在各层中按简单随机抽样的原则抽取一定量的样本,最后由抽取的各层样本组成一个总体的样本。
根据每层抽取样本数量的多少,分层抽样有几种方法:
1.比例分配
每层抽取的样本数按各层总体数的多少确定,遵循等比例抽取。比如总体样本分两层,第一层数量是50,第二层数量是150,如果第一层抽取10个,那么第二层则需要抽取30个,由两层抽取的样本之和40个组成一个抽取的总样本。
2.适度分配法
相对于比例分配,适度分配法考虑了样本的波动状况,要求波动程度大的分层抽取的样本多,而波动小的分层抽取的样本少,这样做的好处是可以减少抽样误差。
既然考虑了波动,自然离不开标准差,因此,适度分配法要求各层的样本数与每一层的总体和标准差的乘积相等。
比如,N是每层的总体样本量,n是每层抽取的样本量,σ是每层的标准差
在使用此方法抽样之前,需要知道每层波动的标准差
3.经济适配法
在适度分配法的基础之上,经济适配法考虑了每层的抽样费用,要求抽样费用较高的层少抽一些,而费用较少的层多抽一些样本。比如,C是费用,则经济适配法遵循的抽样原则:
在日常工作中,虽然抽样的方法有许多种,但适合的才是最好的,更重要的是抽取的样本能正确的反应总体样本的特征。
暂无评论