分享

第六章  抽样

 昵称132254 2011-09-27
第六章  抽样

〖本章学习目的〗
通过本章内容的学习要掌握以下一系列的知识:
抽样的概念、抽样调查的特点;抽样的基本程序;概率抽样的概念及其具体的类型;非概率抽样的概念及其具体的类型。

〖本章学习建议〗
首先把握这一章各节内容之间的关系:
第一节和第二节是本章的基本内容,这两节的内容是学习和掌握后两节内容的必要的基础知识。所以,要花一定的时间和精力把前两节的内容真正搞懂。其中最重要的是抽样的一系列的术语。
在掌握了这两节内容以后,可进入第三和第四节内容的学习。这两节内容的关系是并列的关系。它们是进行抽样调查的两大类方法。在社会调查的工作中都有着重要的地位。
本章的内容在这门课程中属于重要的内容,在全面掌握的基础上应把这一章作为一个非常重要的部分给以高度的重视。

〖本章参考书目〗
袁方主编,《社会研究方法教程》第七章,北京大学大学出版社,1997年版。

〖本章主要知识点〗
本章要掌握的主要知识点有:
抽样调查的特点
参数值和统计值
抽样的基本程序
概率抽样的具体的形式
非概率抽样的具体的形式

〖本章小节〗
抽样是一种从调查对象的总体中抽取一部分调查对旬作为总体代表的程序,抽样调查就是对这些被抽作代表的调查对象所进行的调查。抽样中常用到的要领和术语有:个体与抽样单位,研究总体与调查总体,抽样框,抽样误差,参数值与统计值,置信区间与置信水平等。
与普查相比,抽样调查具有费用低、速度快、应用范围广泛、获得资料丰富和准确度高的优点。
抽样的一般程序是:(1)界定研究总体和调查总体;(2)确定抽样方法和样本规模;(3)进行抽样并对样本作出评估。
抽样分为概率抽样和非概率抽样两大类。概率抽样包括简单随机抽样、等距抽样、分层抽样、整群抽样、多阶段抽样。
尽管非概率抽样具有不能由样本推论总体,无论排除抽样者主观因素影响等局限性,但由于它具有方便简单、省力省钱,并且如果设计得当,也能抽到具有相当代表性的样本等优点。因此,在社会研究中仍在广泛应用,常的非概率抽样方法有:偶遇抽样、配额抽样、主观抽样和滚雪球抽样。
确定样本规模是抽样设计的一个主要方面,应考虑的因素有:(1)研究的精确度要求;(2)总体的性质,包括总体规模和总体内异质程度;(3)抽样方法;(4)可用于调查的人力、财力、物力。

 

 第一节  抽样与抽样调查

〖基本内容〗
由总体中选取一部分代表的过程就是抽样,所选取的这一部分代表称为样本。选取样本的方法分为两大类:一类是依据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择;另一类是依据概论理论,按照随机原则洗选择样本,完全不带调查者的主观意识。前者称为非概率抽样,后者称为概率抽样。在自然科学中,抽样一般是指采用概率抽样方法抽取样本,但在社会研究中,人们也常常把采用非概率抽样的大样本调查包括在内。
抽样调查始于1891年的人口调查,而社会科学中的抽样方法则是与政治选举的预测一起发展起来的。目前,它已被广泛运用于社会的各个领域,并逐渐成为社会调查的主流。与普查相比,抽样调查具有下列的优越性:
1.调查费用较低。当总体包含的研究数目较大时,普查所需要的费用甚巨。而抽样调查,由于调查的仅是总体的一部分,因此,所需要的费用比整体调查要少得多。
2.速度快。调查全部研究对象比调查它的一部分要费时得多。在迅速提供有关信息和掌握变动的社会现象方面,抽样调查具有很大的优越性。
3.应用范围广。由于上述两个特点,抽样调查可广泛用于各个领域、各个部门、各个课题,而不像普查那样只限于统计部门或政府部门。
4.可获得内容丰富的资料。为了节约费用,减少工作量,以及适合各地区的情况,整体调查通常只了解少量项目。抽样调查因调查对象的数目远较普查少,因此,可以设置较多的较复杂的调查项目,并能集中时间和精力作详细的分析。
5.准确性高。普查的实施需要大批调查员,而这些调查员有许多是缺乏经验和专业训练的,这往往会降低调查质量。抽样调查则可以使用少量素质较高的工作人员并对他们进行充分的训练,还可以在实地调查中给予更仔细的检查监督,调查资料的处理亦能较好的完成。因此,与普查相比,抽样调查的资料更准确、更可靠。
抽样调查之所以优于普查,其主要原因于,前者的调查对象数目远较后者的数目为少,它只是作为整体的一小部分。但是,这些优越性的成立必须依据下述假设:(1)部分是含于整体之中的;(2)更重要的是,部分与整体有同样的特征、现象、关系及过程;(3)部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。
抽样调查的关键在于:(1)如何判断一个样本误差的大小。不解决这个问题,我们就无法保证样本推论总体的可靠性。(2)怎样才抽到一个我们所要求的精度的样本。如果,我们无法从理论上和技术上实际抽出这样的样本,那么样本推论总体就毫无意义。

 
〖概念辨析〗
概率抽样和非概率抽样
选取样本的方法分为两大类:一类是依据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择;另一类是依据概论理论,按照随机原则洗选择样本,完全不带调查者的主观意识。前者称为非概率抽样,后者称为概率抽样。在自然科学中,抽样一般是指采用概率抽样方法抽取样本,但在社会研究中,人们也常常把采用非概率抽样的大样本调查包括在内。

〖重点难点分析〗
抽样调查的优点:
1.调查费用较低。当总体包含的研究数目较大时,普查所需要的费用甚巨。而抽样调查,由于调查的仅是总体的一部分,因此,所需要的费用比整体调查要少得多。
2.速度快。调查全部研究对象比调查它的一部分要费时得多。在迅速提供有关信息和掌握变动的社会现象方面,抽样调查具有很大的优越性。
3.应用范围广。由于上述两个特点,抽样调查可广泛用于各个领域、各个部门、各个课题,而不像普查那样只限于统计部门或政府部门。
4.可获得内容丰富的资料。为了节约费用,减少工作量,以及适合各地区的情况,整体调查通常只了解少量项目。抽样调查因调查对象的数目远较普查少,因此,可以设置较多的较复杂的调查项目,并能集中时间和精力作详细的分析。
5.准确性高。普查的实施需要大批调查员,而这些调查员有许多是缺乏经验和专业训练的,这往往会降低调查质量。抽样调查则可以使用少量素质较高的工作人员并对他们进行充分的训练,还可以在实地调查中给予更仔细的检查监督,调查资料的处理亦能较好的完成。因此,与普查相比,抽样调查的资料更准确、更可靠。
抽样调查之所以优于普查,其主要原因于,前者的调查对象数目远较后者的数目为少,它只是作为整体的一小部分。但是,这些优越性的成立必须依据下述假设:(1)部分是含于整体之中的;(2)更重要的是,部分与整体有同样的特征、现象、关系及过程;(3)部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。
抽样调查的关键在于:(1)如何判断一个样本误差的大小。不解决这个问题,我们就无法保证样本推论总体的可靠性。(2)怎样才抽到一个我们所要求的精度的样本。如果,我们无法从理论上和技术上实际抽出这样的样本,那么样本推论总体就毫无意义。

 
第二节? 抽样的术语与程序
〖基本内容〗
一、抽样的术语
(一)个体与抽样单位
个体是收集住处的基本单位,即分析单位。个体可以是某种类型的人(如青年、妇女等),也可以是家庭、组织、社区等。抽样单位往往是多层次的。例如要调查家庭,可先在一个县中抽取若干个乡,然后在由这些乡组成的样本中抽取某些村,最后从这些村组成的样本中抽取家庭样本。这时抽样单位分别是乡、村、家庭三种,分别称为初级抽样单位,次级抽样单位和终极抽样单位。
(二)研究总体与调查总体
研究总体是在理论上明确界定的个体的集合体。调查总体是研究者实际抽取样本的个体的集合体。
(三)抽样框
抽样框又称为抽样范畴,是抽取样本的所有抽样单位的名单。例如要调查某一大学学生政治课学习情况,这时抽样框就是该校全体大学生的花名册。
(四)参数值与统计值
参数值是关于总体中某一变量的综合描述。统计值则是关于样本中某一变量的综合描述。常用的统计值与参数值有平均数、标准差,相关系数等等。抽样调查的重要内容之一就是通过样本统计值推算总体的参数值,从而达到由部分认识总体的目的。
(五)抽样误差
用样本的统计值去推论总体的参数值时,总会存在着偏差,这种偏差就是抽样误差。抽样误差是衡量样本代表性大小的标准,它主要取决于总体的异质性和样本抟含的个体的多少。一般地说,样本所含个体越多,代表性就越高,抽样误差越小,反之则代表性越低,抽样误差越大;总体异质性程度越高,含同样数目的样本的代表性越低,抽样误差越大,反之,代表性越高,抽样误差越小。需要指出的是,抽样中因误抄、计算等人为过失和其他一些因违反随机原则而产生的误差并不是这里所说的抽样的误差。
(六)置信水平与置信区间
置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
二、抽样的基本程序
(一)界定研究总体和调查总体
界定研究总体和调查总体,包括确定调查对象、调查内容、分析单位(或抽样单位)、抽样框等。
在确定了调查总体和抽样单位以后,应将总体按抽样单位划分为各部分,这些部分还必须互不重叠且能合成总体,然后将其毫无遗漏地编制成表,即抽样框。
(二)设计和抽取样本
设计包括两个部分,一是确定样本所含个体数目即样本的大小,二是选择抽样的具体方法。
(三)对样本进行评估
在开始调查之前还应对样本进行评估,评估样本的目的是初步检查样本对于总体的代表性,以免由于前面步骤中的失误使样本偏差太大。评估样本可以采取收集若干容易得到的资料作为总体和样本之间的比较的方法。

〖概念辨析〗
1.参数值与统计值
参数值是关于总体中某一变量的综合描述。统计值则是关于样本中某一变量的综合描述。常用的统计值与参数值有平均数、标准差,相关系数等等。抽样调查的重要内容之一就是通过样本统计值推算总体的参数值,从而达到由部分认识总体的目的。
2.置信水平与置信区间
置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

〖重点难点分析〗
本节的重点和难点是抽样误差的学习和理解
用样本的统计值去推论总体的参数值时,总会存在着偏差,这种偏差就是抽样误差。抽样误差是衡量样本代表性大小的标准,它主要取决于总体的异质性和样本抟含的个体的多少。一般地说,样本所含个体越多,代表性就越高,抽样误差越小,反之则代表性越低,抽样误差越大;总体异质性程度越高,含同样数目的样本的代表性越低,抽样误差越大,反之,代表性越高,抽样误差越小。需要指出的是,抽样中因误抄、计算等人为过失和其他一些因违反随机原则而产生的误差并不是这里所说的抽样的误差。

第三节  概率抽样
〖基本内容〗
概率抽样就是使总体内所有个体具有相同的被抽入样本的概率,这样的样本被称为随机样本,因此,随机样本是由等概率地随机抽取的个体所组成。随机抽样是以概率为依据的,故而能避免抽样过程中的人为误差,保证样本的代表性。在以各种方式抽取的样本中,随机样本的代表性最高。
概率抽样又可以分为简单随机抽样、等距抽样、分层抽样、整群抽样以及结合使用上述两种或两种以上抽样方法的多阶段抽样。
一、简单随机抽样
简单随机抽样又称为纯随机抽样。它是最基本的概率抽样,简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组、排列,使总体中的任何个体都同样有被抽取的平等机会,由此可见,为了保证总体中每一个体进入样本的机会完全相等,首先要保证抽样框的充分性,如果某些个体被漏掉未登,它们就丧失了进入样本的机会,这样一来就破坏了随机原则。
我们日常生活中经常使用的抓阄、抽签等方法都是简单随机抽样。
简单随机样本是概率抽样的理想类型,它从随机样本的抽取到对总体进行推断,有一套健全的规则。但是,当总体所含个体的数目太多时,采取这种抽样方法不仅费时甚多,而且费用太高。
二、等距抽样
简单随机抽样的一个变种是等距抽样,又称系统抽样或机械抽样,这种抽样的具体作法是:
1.将总量的所有个体按一定顺序排列起来。
2.计算抽样距离。抽样距离是由总体所含个体的数目与样本所含的个体数目决定的。假设前者为N个,后者为n个,则抽样距离应是K=N/n。
3.在头K个个体中,用完全随机的方法抽取一个个体,设其所在的位置的序号为K。
一般来说,等距抽样与简单随机抽样一样,要对总体中所有个体进行顺序编号,即要收集总体的名单,但有时也可以不必这样做,只要总体的排列顺序是随机的,就可依已排好的次序从中等距抽取样本。
等距抽样最适用于同质性较高的总体。当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。在这种情况下,一般采用另一种抽样方法,即分层随机抽样。
三、分层随机抽样
(一)分层随机抽样的优点与作用
所谓分层随机抽样就是先将总体依照某一种或某几种特性分为几个子总体,每个子总体称为一层,然后从每一层中随机抽取一个子样本,将这些子样合在一起即为总体的样本。
分层抽样的优点是:
1.当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。
2.分层抽样可以提高总体参数估计的精确度。
3.有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。
4.便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。
(二)分层抽样
分层抽样可分为按比例分层抽样和最优分层抽样。在实际中,通常采用的是按比例分层抽样,因为它较最优分层抽样简单。所谓按比例分层抽样就是要求各层子样本在总体样本中所占比例与本层在总体中所占的比例相同。
分层抽样适用于总体内个体数目较多,结构比较复杂,内部差异较大的情况。
四、整群随机抽样
整群随机抽样又称聚类抽样。所谓整群抽样就是将总体按照某种标准划分为一些子群体,每个子群体作为一个抽样单位,用随机的办法(如简单随机抽样、等距抽样、分层抽样等)从中抽取若干子群,将抽了的子群中所有个体合在一起作为总体的样本。
整群抽样与分层抽样有相似之处,即它们的第一步都是根据某种标准将总体划分为一些子群,但两者的抽样方法完全不同。分层抽样是在所有子群中均要抽取一个子样本,作为总体样本的一部分。而整群抽样则不然,它是抽取若干子群并将抽出的子群中全部个体作为样本,因此总体样本只分布在几个群中。此外,由于抽样方式的不同,导致两者之间划分子群的原则也不相同。在分层抽样中,由于每层均要选取子样本作为总样本的一部分,即在总体样本中每层均有自己的代表,因而它要求层的划分具有较高的代表性,即层之间异质性高,层内则尽可能同质,研究变量的选择与研究问题高度相关。而在整群抽样中,由于只选择某几个子群作为整体的代表,如果子群间差异显著,且每个子群内同质性很高,那么在这种情况下,抽取的子样本显然无法代表总体。
整群抽样在优点在于:它可以通过变换抽样单位扩大抽样的应用范围;它可以节省人、财、物力。
整群抽样的最大缺点是样本分布不均匀,样本的代表性较差。因此与其他抽样方法相比,在样本数相同时,它的抽样误差较大。尽管有这些局限性,但由于实施起来比较方便,而且还可以节约人、财、物力,在大规模范围的调查中,仍常常采用这种方法。在综合考虑调查费用和样本精确度之后,研究者往往会选用整群抽样。
五、多阶段抽样
在上述整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法(如简单随机抽样、分层抽样、等距抽样或再次整群抽样)抽出最终样本,因最终样本的获取经过两次抽样,我们称之为二阶段抽样。同样地,可进行三阶段,四阶段……即多阶段抽样。
采用多阶段抽样,通常在第一阶段使用严格的随机抽样方法,而从第二阶段起开始使用概率比例抽样,因为只有这样才能保证总体样本的随机原则。所谓概率比例抽样是根据每一群所含个体的多少分配样本名额。在上述整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法(如简单随机抽样、分层抽样、等距抽样或再次整群抽样)抽出最终样本,因最终样本的获取经过两次抽样,我们称之为二阶段抽样。同样地,可进行三阶段,四阶段……即多阶段抽样。
多阶段抽样通过采用由多级抽样单位过度到终级抽样单位的方法,解决了终极单位不易获得的抽样匡的问题,并且可以使样本的分布较为集中,从而可以节约大量的人力和经费。它特别适用于调查范围大、单位多、情况复杂的调查对象。

 

〖概念辨析〗
这一节的关键是要搞清楚上述五种抽样方式的区别,而要真正掌握它们的区别,最基本的要从概念上把握它们的区别。
1.简单随机抽样又称为纯随机抽样。它是最基本的概率抽样,简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,即抽样时不进行任何分组、排列,使总体中的任何个体都同样有被抽取的平等机会。
2. 简单随机抽样的一个变种是等距抽样,又称系统抽样或机械抽样,这种抽样的具体作法是:
a.将总量的所有个体按一定顺序排列起来。
b.计算抽样距离。抽样距离是由总体所含个体的数目与样本所含的个体数目决定的。假设前者为N个,后者为n个,则抽样距离应是K=N/n。
c.在头K个个体中,用完全随机的方法抽取一个个体,设其所在的位置的序号为K。
一般来说,等距抽样与简单随机抽样一样,要对总体中所有个体进行顺序编号,即要收集总体的名单,但有时也可以不必这样做,只要总体的排列顺序是随机的,就可依已排好的次序从中等距抽取样本。
3. 所谓分层随机抽样就是先将总体依照某一种或某几种特性分为几个子总体,每个子总体称为一层,然后从每一层中随机抽取一个子样本,将这些子样子合在一起即为总体的样本。
分层抽样可分为按比例分层抽样和最优分层抽样。
4. 整群随机抽样又称聚类抽样。所谓整群抽样就是将总体按照某种标准划分为一些子群体,每个子群体作为一个抽样单位,用随机的办法(如简单随机抽样、等距抽样、分层抽样等)从中抽取若干子群,将抽了的子群中所有个体合在一起作为总体的样本。
5.多阶段抽样
在上述整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法(如简单随机抽样、分层抽样、等距抽样或再次整群抽样)抽出最终样本,因最终样本的获取经过两次抽样,我们称之为二阶段抽样。同样地,可进行三阶段,四阶段……即多阶段抽样。

〖重点难点分析〗
上述这五种抽样方式的特点及其它们的适用情况
简单随机样本是概率抽样的理想类型,它从随机样本的抽取到对总体进行推断,有一套健全的规则。但是,当总体所含个体的数目太多时,采取这种抽样方法不仅费时甚多,而且费用太高。
等距抽样最适用于同质性较高的总体。当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差。在这种情况下,一般采用另一种抽样方法,即分层随机抽样。
分层抽样的优点是:
1.当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。
2.分层抽样可以提高总体参数估计的精确度。
3.有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。
4.便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。
整群抽样在优点在于:它可以通过变换抽样单位扩大抽样的应用范围;它可以节省人、财、物力。
整群抽样的最大缺点是样本分布不均匀,样本的代表性较差。因此与其他抽样方法相比,在样本数相同时,它的抽样误差较大。尽管有这些局限性,但由于实施起来比较方便,而且还可以节约人、财、物力,在大规模范围的调查中,仍常常采用这种方法。在综合考虑调查费用和样本精确度之后,研究者往往会选用整群抽样。
多阶段抽样通过采用由多级抽样单位过度到终级抽样单位的方法,解决了终极单位不易获得的抽样匡的问题,并且可以使样本的分布较为集中,从而可以节约大量的人力和经费。它特别适用于调查范围大、单位多、情况复杂的调查对象。

  第四节? 非概率抽样
〖基本内容〗
随机抽样能够排除调查者的主观影响,抽选出较其他抽样方法更具代表性的样本,并且能够确知和控制抽样误差的大小,从而使由样本推论总体和通过对样本的分析研究达到对总体的全面认识成为可能。但是在很多情况下,这种严格的随机抽样几乎无法进行。此外,有些研究为了符合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。再者,为了保证随机原则,对抽样和操作过程要求严格,实施起来比较麻烦,费时费力。在上述情况下,一般代之以非概率抽样。非概率抽样由于各个个体进入样本的概率是未知的,而且排除不了调查者的主观影响,因而无法说明样本是否体现了总体的结构,用这样的样本推论总体是极不可靠的。但非概率抽样操作方便,省钱省力,统计上也远较概率抽样简单,而且能对调查总体和调查对象有较好的了解,抽样也可获得较大的成功。但是特别应当指出的是,将非概率抽样的结论推论到总体时要极其慎重,否则就容易出现以偏概全的错误。非概率抽样有以下几种类型。
一、偶遇抽样
偶遇抽样又称方便抽样,是指研究者将其在一定时间内、一定环境里所能遇见或接触到的人均选入样本的方法。
偶遇抽样的优点是方便省力,但样本的代表性差,有很大的偶然性。
二、主观抽样
主观抽样的“主观”有两种含义,一种是主观判断的意思,这时主观抽样又称判断抽样或立意抽样,即研究者依据主观判断选取可以代表衷情体的个体作为样本,
主观抽样的第二种含义是“有目的地”选择样本的意思。例如在问卷设计阶段,为检验问题设计是否得当,常有意地选择一些观点差异悬殊的人作为调查对象。
在无法确定总体的边界或因研究者的时间、设备有限而无法进行抽样调查的时候,可以采用这种方法。
三、定额抽样
定额抽样又叫配额抽样,它与分层随机抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样。
定额抽样是一代表总体为目的,因此,必须对总体的性质有充分的了解。一方面由于不可能兼顾总体的众多的属性,而只能考虑其中几种,因此不可能作出很细的分类;另一方面有关总体的分布的最新信息并不容易得到,因而配额的合理性很难保证。这些都会影响定额抽样的样本的代表性。
四、滚雪球抽样
滚雪球抽样是先从几个适合的样本开始,然后通过它们得到更多的样本,这样一步步地扩大样本范围的抽样方法。当调查总体的个体信息不充分时采用这种方法。例如要研究城市的保姆问题,研究者一开始因缺乏总体信息而无法抽样,这时可先通过各种办法,如家庭服务公司、街道居委会或熟人介绍等,找到几个保姆进行调查,并让她们提供所认识的其他保姆的情况。然后再去调查这些保姆并请她们提供自己所认识的保姆,依次类推。

 

〖概念辨析〗
要搞清楚这四种抽样方式的区别:
偶遇抽样又称方便抽样,是指研究者将其在一定时间内、一定环境里所能遇见或接触到的人均选入样本的方法。
主观抽样的“主观”有两种含义,一种是主观判断的意思,这时主观抽样又称判断抽样或立意抽样,即研究者依据主观判断选取可以代表衷情体的个体作为样本,
主观抽样的第二种含义是“有目的地”选择样本的意思。例如在问卷设计阶段,为检验问题设计是否得当,常有意地选择一些观点差异悬殊的人作为调查对象。
定额抽样
定额抽样又叫配额抽样,它与分层随机抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样。
滚雪球抽样是先从几个适合的样本开始,然后通过它们得到更多的样本,这样一步步地扩大样本范围的抽样方法。

〖重点难点分析〗
这四种抽样方式的特点和适用性
偶遇抽样  偶遇抽样的优点是方便省力,但样本的代表性差,有很大的偶然性。
主观抽样  在无法确定总体的边界或因研究者的时间、设备有限而无法进行抽样调查的时候,可以采用这种方法。
定额抽样是一代表总体为目的,因此,必须对总体的性质有充分的了解。一方面由于不可能兼顾总体的众多的属性,而只能考虑其中几种,因此不可能作出很细的分类;另一方面有关总体的分布的最新信息并不容易得到,因而配额的合理性很难保证。这些都会影响定额抽样的样本的代表性。
滚雪球抽样??? 当调查总体的个体信息不充分时采用这种方法。

  第五节  样本大小

〖基本内容〗
样本大小又称样本容量,指的是样本所含个体数量的多少。样本的大小不仅影响其自身的代表性,而且还直接影响到调查的费用和人力的花费。太大的样本会浪费人力、财力,增加工作量;太小的样本则会降低调查的效果。因此,样本大小“适当”是非常重要的。适当的样本依研究目的、总体性质、客观条件而定。而客观条件就是能够用于这项研究的人力、财力、时间。样本大小的确定是对这三方面综合考虑的结果。
样本容量指的是样本中所包括的样本单位的个数。如,从一个学校的学生中抽选样本,每个样本中有30个学生,则我们说,样本容量为30。
统计学中把容量少于30的样本称为小样本,把容量大于30的样本称为大样本。 对样本的代表性,不同研究有不同的要求,这种要求一般用精确度来衡量,某研究所要求的精确度就是这项研究能允许样本估计量有多大的误差。社会研究常选用的误差界限是5%。
影响样本代表性的误差分为两类,第一类是随机误差,其中包括抽样误差,它是由于样本范围与总体范围的不同产生的误差。第二类误差是系统误差,它主要是由于抽样方法的不科学所致。因此,如果采用严格的概率抽样,就可以消除样本的系统误差。样本的大小与抽样误差密切相关,样本越小,与总体差异越大,误差越大。因此可以得出下述两个结论,第一,样本的大小视研究所要求的精确度而定,对样本的精确度要求越高,第二,在一定的精确度要求下,总体越大则样本亦应越大。

〖概念辨析〗
样本容量??? 样本容量指的是样本中所包括的样本单位的个数。如,从一个学校的学生中抽选样本,每个样本中有三十个学生,则我们说,样本容量为三十。
大样本和小样本?? 统计学中把容量少于30的样本称为小样本,把容量大于30的样本称为大样本。
〖重点难点分析〗
影响样本代表性的误差:
影响样本代表性的误差分为两类,第一类是随机误差,其中包括抽样误差,它是由于样本范围与总体范围的不同产生的误差。第二类误差是系统误差,它主要是由于抽样方法的不科学所致。因此,如果采用严格的概率抽样,就可以消除样本的系统误差。样本的大小与抽样误差密切相关,样本越小,与总体差异越大,误差越大。因此可以得出下述两个结论,第一,样本的大小视研究所要求的精确度而定,对样本的精确度要求越高,第二,在一定的精确度要求下,总体越大则样本亦应越大。

 


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多