教育研究的有目的有计划地认识教育现象,探索教育规律的活动,具有很强的探索性。为了揭示教育现象与过程发展的规律,选取的研究对象必须是有典型代表意义的,才能保证研究结果的可靠性。如何选择有代表性的研究对象,即取样问题,就成为考虑研究计划时很重要的一环。善于进行科学的取样,也是科学研究的基本要求。 ㈠总体、样本、取样的基本概念 总体,即研究对象的全体。凡是在某一相同性质上结合起来的许多个别事物的集体,当它成为统计研究对象时,就叫做总体,是一定时空范围内研究对象的全部总和。 样本,是从总体中抽取的、对总体有一定代表性的一部分个体,也称样组。它是能够代表总体的一定数量的基本观测单位。样本中所包含的个体的数量称为样本容量。 取样,是遵循一定的规则,从一个总体中抽取有代表性的一定数量的个体进行研究的过程。目的在于:用一个样本去推断关于这个总体的信息及一般性结论,从样本的特征推断总体,从而对相应的研究作出结论。 为什么要在一个总体中抽取样本进行研究?这是由于教育研究对象的特点和取样本身的基本特点所决定的。 教育科学研究对象是数以万计的儿童乃至成人。由于研究课题的不同,被研究的儿童范围也是不同的。如果你研究的是个别人或少数人,不存在取样的问题,因为对象总体已成为你的研究直接对象。但是教育研究绝大多数课题涉及对象是比较广泛的,比如研究幼儿学习习惯的现状和特点,我国幼儿就有几千万名,限于研究者的时间、精力、人力和物力,要对上千万的幼儿进行逐一研究然后得出结论是非常困难的,事实上也是不必要的。取样,以概率论的大数定律作为理论基础,是根据部分样本的实际资料对全部总体的数量特征做出推论估计。由于是按随机原则从全部调查总体中抽取样本单位,而且抽样推断的抽样误差可以事先计算并加以控制,从而保证了研究结果的准确性和研究的可靠性,并使研究有一定的深度,提高了研究的效率。 在我们的教育研究实际工作中,由于不掌握取样方法而造成时间、精力、人力和物力以及数据资源的浪费,造成的对问卷调查泛滥的抵触情绪等,这种例子是很多的。有人误以为用行政命令手段,样本越大越好。如果一个研究只需要选取500人作为样本就可以推断出总体情况,就不需要搞上万人。人多,抽样误差减少,可是过失误差又增大。 ㈡选择样本的基本要求 为了保证取样的水平,应遵循以下四个方面的基本要求。 ⒈明确规定总体 要从内涵和外延两方面明确总体界限。 研究的目的、课题性质决定总体的内容。如“弱智幼儿智能特点的研究”,总体就是所有的弱智儿童。 研究目的决定了总体的范围。研究者准备将研究成果推广到什么样的范围,就应在该范围内抽样。这就要区分是城市幼儿园,还是农村幼儿园,是示范园还一般园。从某一总体抽取样本,经过研究获得的结果只能推广到这一总体中去。 ⒉取样的随机性 要尽可能使每个被抽取的个体具有均等机会,也就是说使被抽取的任何个体与个体之间是彼此独立的,在选择上没有联系。这里不存在任何选择的标准,不带任何有意义的万分,从而尽可能使样本保持和总体有相同的结构。 ⒊取样的代表性 要尽可能使抽取的样本代表总体。如某某市对幼儿园的幼儿的非智力因素水平进行调查研究,全市15万在园幼儿,可以从中抽取800名幼儿来说明15万幼儿的非智力水平,因此,这800名幼儿的代表性就显得非常重要了。只有样本具有代表性,那么由样本特征推断的总体特征才有一般性,对总体的研究成果才有推广价值。样本的代表性正是由部分推断整体做法的理论根据。 取样的偏差将导致结论的无效。如有研究某大学学生课余休闲和爱好,利用晚自习时间到图书馆发放问卷,问卷回收率90%以上,结论是:65%大学生晚上都是在图书馆度过的。这一结论由于取样的偏差而带来误差。 为了保证样本的代表性,抽样时,首先要明确规定抽样的总体。总体所有特性为:①必须包括于样本之中。如要研究特殊幼儿,就得规定“特殊幼儿”的总体范围:“幼儿”包括哪些年龄的孩子;“特殊”指的是哪几方面的,如智力、身体生理缺陷、行为异常或智力超常等。②必须十分注意总体的明确界限:是否包括边缘范围的人。如在规定“幼儿园孩子”这个总体时,要注意包括上特殊幼儿园的孩子以及超过一般年龄范围而又在幼儿园学习的孩子等。③要弄清总体中各种成份所占的比例。其次,要估计和计算样本所需要的合适数量。确定样本的大小,应力求以较小的样本取得尽可能可靠的结果,以使样本既具有代表性,又不必耗费过多。 要使取样有代表性,还必须对取样的偏差进行正确估计。取样误差是指样本的指标数值与总体的指标数值之间所存在的离差。这种差异值越小,就说明抽取的样本能比较正确地反映总体。因此,为了保证取样的代表性,研究者人分析影响误差大小的因素,通过计算取样的标准误差将误差值测定出来,并努力使误差控制在最低的程度。 ⒋合理的样本容量 要科学地确定样本的大小,既要满足统计学上要求,又要考虑实际上收集资料的可能性,并使误差减到最低限度。一般说来,样本容量与样本代表性呈正相关,大的样本更具有代表性,研究结果可能更有一般性。 样本大小取决于以下诸方面因素:⑴研究的不同类型。⑵预定分析的精确程度。⑶允许误差的大小。⑷总体的同质性。⑸研究者的时间、人力和物力。⑹取样的方法等。在研究中,如果要求的精确度高,允许的误差值小,总体的异质性很在,许多未控制因素会混淆研究结果,或研究的因变量在测量上的信度较低时,就要考虑使用较大的样本。 根据以上分析,结合长期教育研究的实践经验,提供以下取样大小的参考值。 描述研究、调查研究:总体的10%。除少数情况,调查研究的样本容量一般不能少于100。 相关、比较研究的满意样本每组至少30。 实验研究:条件控制较严密的研究,如心理学实验,每组15人;条件控制不严密的教育实验,最好一个自然教学班,不少于30人。 必须指出的是,不能绝对地理解“总体越大,样本容量就越大”。不是绝对地按比例取样。据国外有的学者对总体与样本容量关系的研究也说明了这一点。见下表 从给定的总体确定样本大小一览表
抽样的样本是否有代表性,最后还要通过结果的检验来证明。由样本得到的结果必须作统计学上的显著性检验。例如,在某种实验研究中,实验班成绩高于对比班成绩,那么这种差异是否真实呢?这就必须做实验结果的显著性检验,目的是说明由实验样本所取得的结论。如果样本具有代表性,那么这种结论也适用于总体,因而具有一般性。而某种统计量的计算和各种不同的显著性检验,如平均数、标准差、相关系数有及u检验、t检验、x2检验等等,都有各自的标准来估计样本可能产生的误差,样本容量大小将会影响上述误差和由样本估计总体的真实价值。 ㈢取样的基本方法 取样的方法我种多样,要根据研究目的和条件灵活选用。 ⒈简单随机取样 按照概率论的原理,抽样时要尽可能使总体中的每一个基本观测单位都有均等的机会,有被抽中的可能。简单随机取样,优点是:可以保证全部标识的代表性;能够确定抽样误差的理论值,并且简单易行。这是在总体异质性不是很大而且所抽样本较小时经常采用的一种形式。局限是:当样本规模小时,样本的代表性差。 简单随机取样有两种方式: ⑴抽签。把总体的每个观测单位依次编上号码并做成签,放进一个器皿加以充分混合后,每次从中抽取一个,记下号码,然后把抽取的签再放回器皿中,再次摇动和抽取,如此反复,直到取够样本所需数目为止。 ⑵随机数目表。随机数目表是一种严格制作的由许多数目字组成的表,数字随机排列,操作时,首先随机确定一个表上取数的“起点”,然后按表上所示的数号取样。 ⒉系统随机取样 系统随机取样,也叫等距抽样、机械抽样。先将总体各个观测单位按某一标志顺序排列编号成数量相等的组,使组数与取样娄相同。然后从每组中依事先规定的机械次序抽取对象。 抽样比率的计算公式:K=N/n(K:抽样比率;N:总体数;n:样本数)。 例如,某一研究要从1000名幼儿中抽取100人作为样本,抽样比率为:K=1000/100=10。按幼儿名册或学号,从1至10中选出第一个样本单位,比如这个号码是5,然后作等距抽样,5,15,25,......,直到100为止。 系统随机取样,由于能在总体的整个范围内有系统地抽取样本,因此与简单随机抽样相比较,抽样误差要小一些。如果按其总体的每个观测单位按照某种性质特征的变异度大小或增减程度依次编号,进行系统抽样,其结果常与分层抽样差别不大,但又有比分层抽样设计更简单的优点。所以抽样调查中常被采用。 系统随机取样,要考虑研究总体的情况。如果总体存在周期性变化,如考试试卷,男生单号,女生双号,那么,很可能出现样本的系统误差,抽取的样本只有一个性别。 系统随机抽样使样本分配均衡,更具有代表性,抽样误差较简单随机抽样小,操作也简单,实际运用较广。 ⒊分层随机取样 分层抽样也叫做类型抽样或配额抽样。它是将总体按一定标准,即单位属性特征(变异度的大小)分成若干层次或类别,然后根据事先确定的样本大小及其各层或各类在总体中所占的比例提取一定数目的样本单位。即按总体中具有各类特征的对象所占的比例,在总体中随机抽取同样比例的样组成分的取样方法。如对某校800个学生的学习态度进行调查,拟抽取十分之二的学生作为样本。首先按成绩评定标准将学生分成优(160)、良(320)、中(240)、差(80)四层。然后用简单随机抽样在四层中按比例分别抽取样本,从优等中抽取160×2÷10=32(人);从良等中抽取320×2÷10=64(人);从中等中抽取240×2÷10=48(人);从差等中抽取决80×2÷10=16(人)。这160人组成了分层随机抽样的样本。 适用条件及特点:当已知研究总体由不同性质的几个部分组成,要使抽取的样本能客观反映总体的各个层面、不同类型的观测单位,因而获取的样本更具有代表性。分几层,如何分层,要根据已有研究进行。 采用分层取样的步骤: ⑴了解总体中个体特征的差别,按特征差异分组,计算每一类别在总体中所占的比例。 ⑵根据各组在总体中所占比例,分配各组中每一类别的人数。 ⑶最后从总体的不同类别的对象中按规定人数在各组中随机抽取样本。 分层抽样是将已知的将会直接影响研究结果的特征,如分数,智力等,按不同的水平分层,然后进行类型取样。 ⒋整群随机取样 把一个个整体,如幼儿或班级编号然后随机、机械或类型取样方法进行抽取,它不是从整体中逐个地抽取对象,而是抽取一个或几个单位整群作为样本。 教育实验中,考虑到教师和幼儿的配合等问题,有意地选定研究班级而不打乱原教学单位,所以它是常用的方法。但是必须看到,整群抽样所获得的样本,由于样本分布不均匀,比如存在学习成绩、智力水平、性别等差异,一般说,代表性不如个别取样,在统计推论上存在一定缺陷。因此,我们在选定研究幼儿园和班级时,必须十分谨慎。比如幼儿园的尖子班,对一般幼儿园的普通班是不具代表性的。因此,在这样的班级中获得的研究结果,对类似幼儿园类似班来说是适用的,但要向一般幼儿园普通班推广,就会遇到困难。 抽样的标准、方法以及抽样大小是否适合,关系到研究工作的进程,特别是研究方法的准确性、科学性,是研究工作开始时必须妥善解决的一个重要问题。另外,还应该根据研究课题性质特点选择不同取样方法。无论何种取样的方法,都会产生一定的抽样误差,研究人员尽量排除主观因素干扰,保证样本能客观、全面地反映总体,并能通过一定的计算检验样本的代表性程度。 |
|