分享

考试的测量学基础知识(八):效度

 昵称21189171 2017-06-12

  传统意义上,效度(validity)是指一项测试测量到了它所想要测量的东西的程度。由于效度反映的是测验的正确与有效性,效度被认为是测量工具本身的一项特征,因此效度的检验可说是测验开发最关键的步骤。

  随着测量理论和实践的发展,效度概念近些年发生了很大变化,从单一的相关系数指标到三元分立(内容效度、效标关联效度、构念效度),最终发展成为内涵丰富、一元多维的整体概念系统。效度整体观(the unified conception of validity)研究的代表人物是美国学者Sam Messick,他对教育考试的效度问题进行了长期而卓有成效的研究。Messick(1989)认为,“经验证据和理论依据在多大程度上支持基于测试分数或其他评估方式所作出的推断或采取的行动是充分和适当的,对这个问题的综合、评价性判断就是效度”。事实上,Messick不仅发展了效度的概念,更重要的是为效度验证(validation)研究提供了具体指导。

  《心理与教育测量标准》(Standards for Educational and Psychological Testing)也基本持同样的观点:“效度指证据和理论支持从测验分数得出的推断的程度;”“效度验证(validation)就是搜集证据来科学合理地论证测验的解释是恰当的。所谓测验的解释,是关于测验所要测量的构念(construct)或概念(concept)的解释。”

  效度是一个统整的概念,但检视或确认效度的标准/证据来源却是多方面的。Bachman(2004)认为,效验论证包括两个步骤:第一,提出效度验证观点,即试图对测试分数做哪些解释和使用;第二,收集有关证据支持所提议的解释与使用。《心理与教育测量标准》给出了五项证据来源,已经成为近几年心理与教育测量效度研究的主要依据。该标准指出,在效度论证过程中可搜集测验内容、内部结构、反应过程、与其他变量相关、测验后果五项证据来源。基于测验内容的证据主要是指考核内容与欲测构念之间是否匹配,即测验题目在知识点和认知层次要求上与测验要求的吻合性;基于内部结构的证据是指对测验内部结构本身的检验,与题目的同质性有关,可以通过内部一致性信度、因素分析、多维尺度分析和结构方程模型等方法来评价;基于反应过程的证据主要是基于对考生反应过程的观察,检验考生在回答题目时是否使用或表现出测验开发者所要求使用或表现的能力或策略,出声思维是搜集这一证据的主要方法;与其他变量相关的证据主要是指在该测验上的得分与测量同一构念的相近测验上得分的相关程度,相关分析与回归分析是常用的方法;基于测验后果的证据是指与测试项目有关的后果是积极的还是消极的,也可称之为测验的反拨作用。

供稿:关丹丹








    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多