此处输入图片的描述


我们重点关注下概率抽样1

简单随机抽样2

从总体 $N$ 个单位中随机地抽取 $n$ 个单位作为样本,每个单位被抽中的概率是相等。

此处输入图片的描述

例如:按照“抽签法”、“随机表”法抽取访问对象,从单位人名目录中抽取对象。

优点: 随机度高,在特质较均一的总体中,具有很高的总体代表度;是最简单的抽样技术,有标准而且简单的统计公式。

缺点:未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率低;有可能抽到一个“差”的样本,使抽出的样本分布不好,不能很好地代表总体。


整群抽样

 将总体全部单位分为许多个“群”,然后随机抽取若干“群”。

此处输入图片的描述

例如:入户调查,按地块或居委会抽样,以地块或居委会等有地域边界的群体为第一抽样单位,在选出的地块或居委会实施逐户抽样;市场调查中,最后一级抽样时,从居委会中抽取若干户,然后调查抽中户家中所有18岁以上成年人。

此处输入图片的描述

优点:适用于群间差异小、群内各个体差异大、可以依据外观的或地域的差异来划分的群体。

缺点:群内单位有趋同性,其精度比简单抽样低。


系统抽样(等距抽样)

将总体中的各单元先按一定顺序排列,并编号,然后按照一定的规则抽样。其中最常采用的是等距离抽样,即根据总体单位数和样本单位计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。

此处输入图片的描述

例如:从1000个电话号码中抽取10个访问号码,间距为100,确定起点(起点<间距)后每100号码抽一访问号码。

优点:兼具操作的简便性和统计推断功能,是目前最为广泛运用的一种抽样方法。如果起点是随机确定的,总体中单元排列是随机的,等距抽样的效果近似简单抽样;与简单抽样相比,在一定条件下,样本的分布较好。

缺点:抽样间隔可能遇到总体中某种未知的周期性,导致“差”的样本;未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率低。


分层抽样

把调查总体分为同质的、互不交叉的层(或类型),然后在各层(或类型)中独立抽取样本。

此处输入图片的描述

例如:调查零售店时,按照其规模大小或库存额大小分层,然后在每层中按简单随机方法抽取大型零售店若干、中型若干、小型若干;调查城市时,按城市总人口或工业生产额分出超大型城市、中型城市、小型城市等,再抽出具体的各类型城市若干。

优点:适用于层间有较大的异质性,而每层内的个体具有同质性的总体,能提高总体估计的精确度,在样本量相同的情况下,其精度高于简单抽样和系统抽样;能保证“层”的代表性,避免抽到“差”的样本;同时,不同层可以依据情况采用不同的抽样框和抽样方法。

缺点:要求有高质量的、能用于分层的辅助信息;由于需要辅助信息,抽样框的创建需要更多的费用,更为复杂;抽样误差估计比简单抽样和系统抽样更复杂。


多阶段抽样(多级抽样)

先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。

此处输入图片的描述

以全国性调查为例,当抽样单元为各级行政单位时,按社会发展水平分层后(或按经济发展水平,或按地理位置分层),从每层中先抽几个地区,再从抽中的地区抽市、县、村,最后再抽至户或个人。

优点:具体整体抽样的简单易行的优点,同时,在样本量相同的情况下又整群抽样的精度高。

缺点:计算复杂。


概念辨析

整群抽样与分层抽样

  • 分层抽样要求各层之间的差异很大,层内个体或单元差异小,而整群抽样要求群与群之间的差异比较小,群内个体或单元差异大;
  • 分层抽样的样本是从每个层内抽取若干单元或个体构成,而整群抽样则是要么整群抽取,要么整群不被抽取。

如果分成两个阶段抽样的话,第一阶段全面调查,第二阶段随机抽查就是分层抽样;第一阶段随机抽查,第二阶段全面调查就是整群抽样;而两个阶段都随机调查是二阶抽样。总体可以分为很多群,抽一个或多个群进行分析是整群抽样,对不同的群抽取个体是分层抽样。