wallance / 统计 / 测验的信度

分享

   

测验的信度

2007-07-11  wallance

测验的信度

     任何测量都必须具有客观性和可靠性,即测量结果不能随测量者、时间、地点的变化而变化,作为测量、测验的可靠性问题就是测验的信度问题。
(一)真分数理论
1
、测验误差
    
所谓测验误差,是指由与测量目标无关的变因所引起的不准确和不一致的效应。测量误差主要有抽样误差随机误差系统误差

 

 

    由于随机误差是无规律的,不会倾向于任何方向,因此,当测量次数足够多时,随机误差就会相互抵销。用 表示随机误差,则 。如果用 表示系统误差,则
2
、真分数
    
所谓真分数,就是测量中不存在随机误差时的真值或客观值。但是,实际测量是不可能没有误差的。再精确的测量也不可避免地会有误差,所以,作为间接测量的教育测量可能包含着较大的误差。真分数也只是一个理论上的概念。人们可能永远也无法确切地知道真分数,而只能借助一些方法对它进行估计。从操作上看,所谓真分数,就是无数次测量的平均值。通常,可以假定:测验的实际得分X是真分数T与测量误差E之和。即X=T+E
    
实际得分X既是真分数T的函数,也是测量误差E的函数。真分数理论的又一假设是:真分数与误差相互独立。即:

    
真分数是测量中不存在随机误差时的真值,因而可以完全反映出一组人的不同水平。如果真分数与误差存在相关,那么,误差就可以部分地反映出一组人的不同水平,为此,真分数也就不成其为真分数,误差也就不成其为误差了。
    
在上述假设的基础上,可以证明:实际得分的方差等于真分数的方差与误差方差之和。即

(二)信度的概念
1
、信度定义
    
信度是反映测验成绩在不同条件下的一致性、连续性程度的指标,定义为真分数方差与所得分数方差的比例,即 为信度系数。
    
该定义的意义在于指出了在所得分数的变异中有多大比例是由真分数所决定,有多大比例是由误差所决定。从而反映出测验受随机误差影响的程度,进而反映测验的可靠程度。信度系数的另一含义是实际得分X与真分数T的相关系数的平方,即 ,由于真分数是一个不能确定的理论概念,信度也只是一个理论概念,因而只能通过一些方法估计信度。
2
、信度的种类与估计

    
1稳定性信度——跨时间的一致性

    信度估计的实质是需要对受测者在测验上的真分数进行估计,真分数定义为无数次施测的平均分,但对一个人施测无数次同一测验是不可能的。所以, 我们通过计算一组人两次施测之间的相关来对真分数的变异和误差变异进行估计。当然,考察稳定性信度,必须具备两个条件。其一,所测量的特质应该是相对比较稳定的,其二,练习和遗忘效应可忽略不计。可以证明某测验两次施测分数之间地相关即为该测验信度。
    
假设有一组人在某测验上两次施测的分数,并且:

   
 则, ,第i名受测者的第一次得分
    
,第i名受测者的第二次得分
    
  
  即,两次施测的相关系数可以作为信度的估计值。

    2等值性信度——跨形式的一致性

    等值性信度主要考察两份内容相似的测验之间的一致性,即两份试卷是否可以互相替代,为排除施测先后的影响,可将受测者分为二组,一组先做试卷A再做试卷B。另一组先做试卷B再做试卷A。然后计算AB之间的相关系数,并进行显著性检验。当然,相关系数具有显著性是两份试卷等值的最低限度条件,并不成为真正等值的充分条件。在对测验进行等值性信度考察以前,应首先对测验的内容、形式、长度等是否一致进行定性考察。在这些基于经验的定性考察以前,作出定量分析是没有意义的。

    3分半信度

    在许多情况下,由于练习效应不能忽略,因而很难进行两次施测。为此,常用办法是将一份测验施测后,将题目分成二半,将这二半看成是最短时间内的两次施测,并计算相关系数作为信度的估计。也就是说,把这二半看成是两个子测验。
    
分半的方法很多,通常按测验题目的奇偶序分半,一般奇偶分半以最小的题目划分,以保证一半中均能包含各种类型、各种内容的题目。
    
一次测验的题目越多,可靠性就越高。由于在计算分半信度时,测验的长度只是原测验长度的一半,所以需对其进行校正。校正公式为: 为校正前的分半相关。稍作推论,可得到校正公式的一般形式: K为原来长度与缩短后长度的比例(可以是小数)。
    
分半信度的另一种形式: 为两半分数的方差, 为测验总分的方差。

    4同质性信度——内在一致性信度

    同质性信度反映了一份测验中跨项目之间的一致性,即反映测验是否测量单一的心理特质。反映测验内在一致性的同质性信度可以用测验项目之间相关系数的平均数来表示,即把一个项目看成是一个子测验。由此,可以得到:
 
    式中,k为项目数, 为所有项目相互相关的平均值。
    
经推导得到: 为第I项目的得分方差, 为总分方差。
    
当项目0.1记分时, 为第i项目通过率.

3、信度的几点讨论
    
1)测验团体的同质性
    
与所有相关系数一样,信度系数受到分数分布范围的影响,分布范围越广,变异越大,相关也就越高,而分数的分布范围受到测验团体的同质性的影响。测者水平越接近,在测验分数的变异中,随机误差的影响越重要,信度就会降低。受测者水平越不一致,测验总变异中,随机误差的比例就减小,信度就提高。
    
2)长度与信度
    

    
由此,对一个信度较低的测验,只要增加其长度,就能使信度增加到我们的期望值。
    
如例题

    例题:由50个项目组成的测验,信度为0.75,增加多少项目就能取得0.9的信度?
    
    
即增加项目后的测验,其长度是原测验的3倍。因此,只要增加100年项目,就可达到0.9的信度值。

    3)难度与信度
    
应该说,难度对信度估计没有直接影响,但是,测验难度影响到分数分布的范围,当题目太易或太难时,分数范围就会缩小。所以,为了达到一定的信度,测验应有一个适当的难度。对选择题而言,如果项目过难,将增加猜测的比例,从而增加随机误差,进而减少信度。
    
4)信度与测量误差
    
由真分数理论,信度主要反映了随机误差对测验的影响程度。因此,信度可以对测验的测量误差作出数量化的估计。
    
由于存在着测量误差,一个测验分数并不能对应于所要测量的特质空间上的一点,而是对应一个区域或一个范围。信度反映了这一区域的大小,信度较高时,测验分数对应一个较小的区域。
    
测验分数可构成一个分数空间,这一分数空间与所测量的特质空间形成对应关系。信度反映了这种对应关系的强弱,当 =1.0时,分数空间上的一点严格对应特质空间上的一点。 ≠1时,分数空间上的一点对应特质空间上的一个区域,信度越低,区域越大。
    
根据误差理论,真分数的95%置信区间为:
    
为标准误差,即测量误差的标准差。
    
经证明, 为测量信度, 为实得分数标准差。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多

    ×
    ×

    ¥.00

    微信或支付宝扫码支付:

    开通即同意《个图VIP服务协议》

    全部>>