在整群抽样中,被抽中群中的SSU全部进入样本。但在很多情况下,群中单元具有相似性,尤其在群比较大时,显然没有必要调查PSU中的所有SSU,而是在每个被抽中的PSU中对SSU再抽取子样本,这就是两阶段抽样。
我们首先考虑初级单元规模相等的两阶段抽样,即初级单元中二级单元个数相等的情形。第一阶段从包含N个初级单元的总体中以简单随机抽样抽取n个初级单元,第二阶段在每个被抽中的初级单元所包含的M个二级单元中,以简单随机抽样抽取m个二级单元。下面举例说明:
某连锁企业调查100家连锁店的某项指标,首先从100家连锁店中抽取了一个含有5家样本店的简单随机样本。由于填报一个月的数据需要每天填写流水账,为了减轻样本店的负担,调查人员对这5家店分别在调查月内随机抽取3天作为调查日,要求样本店只填写这3天的流水账。调查的结果如下:
- 1. N=100,M=30,n=5,m=3,f1=5/100=0.05,f2=3/30=0.1
- 2. 样本按SSU的平均值的方差=(1-0.05)/5*49.3+0.05*(1-0.1)/(5*3)*23.4=9.367+0.0702=9.4372
- 3. 计算Y(估计)和V(Y估计)
- 4. Y(估计)=100*30*53.6=160800
- 5. V(Y估计)=100*100*30*30*9.4372=84934800
- 6. Y的标准差=SQRT(84934800)=9216
- 7. Y(估计)的95%置信区间为:160800+(-)1.96*9216,或者说在142736.6-178863.4之间。
值得注意的是,如上所述,方差估计式中,第一项是主要的,第二项要小得很多,这是因为第二项的分母是第一项分母的m倍,而且它还要乘以小于1的f1。在最终样本量n*m确定的条件下,提高n并减少m可以大大提高估计精度。(作者系国际数控管理专家李颖)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.