分享

抽样方法比较

 raee 2006-11-29

概率抽样

非概率抽样:

概率抽样的原则:(随机性原则)

总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。

不是按照等概率原则,而是根据人们的主观经验或其他条件来抽取样本。常用于探索性研究。

 

简单随机抽样:

按照等概率的原则,直接从含有N个元素的总体中抽取n个元素组成的样本(N>n)。随机数表

偶遇抽样:并非简单随机抽样,概率不等

系统抽样(等距抽样或机械抽样):

把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)

前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。(举例)

判断抽样(立意抽样):抽样标准取决于调查者的主观选择

 

分层抽样(类型抽样):

先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:1、先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。2、先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

 

分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:

以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

以那些有明显分层区分的变量作为分层变量。

 

分层的比例问题:

按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

配额抽样:尽可能的根据那些影响研究变量的各种因素来对总体分层,并找出不同特征的成员在总体中所占的比例。配额抽样实际上要求在抽样前对样本在总体中的分布有准确的了解。

配额抽样与分层抽样:

前者注重的是样本与总体在结构比例上的表面一致性;后者一方面要提高各层间的异质性与同层的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小。

在概率上,前者是按照事先规定的条件,有目的地寻找;后者是客观地、等概率地到各层中进行抽样。

 

整群抽样

抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。

优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。

缺点:样本分布比较集中、代表性相对较差。

一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。

 

分层抽样与整群抽样的区别

分层抽样要求各子群体之间的差异较大,而子群体内部差异较小;整群抽样要求各子群体之间的差异较小,而子群体内部的差异性很大。换句话说,分层抽样是用代表不同子群体的子样本来代表总体中的群体分布;整群抽样是用子群体代表总体,再通过子群体内部样本的分布来反映总体样本的分布。

 

多阶抽样(分段抽样):

按照元素的隶属关系后层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时。

类别与个体之间的平衡问题:

各个抽样阶段中的子总体同质性程度

各层子总体的人数

研究所能提供的人力和经费


缺陷:每级抽样时都会产生误差

措施:增加开头阶段的样本数,同时适当的减少最后阶段的样本数。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多