HyperAI超神经

抽样 Sampling

抽样是一种常用的推论统计方法,它是指从目标总体(Population ,或称为母体)中抽取一部分个体作为样本(Sample),通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识。

抽样过程主要阶段:

  • 定义总体(母体。

  • 确定抽样框。

  • 确定抽样方法。
  • 决定样本量。
  • 实施抽样计划。
  • 抽样与数据收集。
  • 回顾抽样过程。

常用抽样方法

1)简单随机抽样(simple random sampling),也叫纯随机抽样。

从总体 N 个单位中随机地抽取 n 个单位作为样本,使得每一个容量为样本都有相同的概率被抽中。

特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

2)系统抽样(systematic sampling),也称等距抽样。

将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。先从数字 1 到 k 之间随机抽取一个数字 r 作为初始单位,以后依次取 r+k 、 r+2k……等单位。这种方法操作简便,可提高估计的精度。

3)分层抽样(stratified sampling)。

将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。从而保证样本的结构与总体的结构比较相近,从而提高估计的精度。

4)整群抽样(cluster sampling)。

将总体中若干个单位合并为组,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。抽样时只需群的抽样框,可简化工作量,缺点是估计的精度较差。

参考来源

【1】https://zh.wikipedia.org/wiki/抽樣