考试的测量学基础知识（十一）：等值

昵称21189171 2017-06-12

展开全文

　　等值（Equating）是一种在两个或多个测验版本的分数之间建立相互关系的过程，即将测量同一特质的不同测验版本的分数置于同一尺度上，使得参加不同测验版本的考生的分数可以直接相比，从而实现跨测验版本考生评价的公平性。其过程既包括分数的等值，也包括题目参数的等值。测验等值在不同版本测验的分数间建立起了直接链接，其目的是使测验的分数可互换使用，就好像它们来自同一个测验那样。

　　等值是标准化测验中非常必要的一个部分。考试项目不断产生新的测验试卷版本，使用这些不同的版本则要求分数量表的意义能够保持稳定。尽管这些版本构想相同，也往往基于相同的测验规范或测验蓝图，但是版本的差异总会多少带来一些统计特性上的差异。例如，一个测验比另一个测验难，如果不做调整，参加较难测验的考生得分就会较低。为公平起见，有必要运用等值消除测验版本间不想要的难度差异对分数所带来的影响，使得考生无论参加哪个版本的测验，等值后分数的意义都一样。

　　严格来讲，在两个不同版本的测验之间等值必须具备一定条件：

　　（1）同质性，即两个测验测量相同的构想（潜在特质、技能或者能力）；

　　（2）等信度，即两个测验具有相同的信度；

　　（3）对称性，即把Y测验的分数等值到X测验的等值函数应该是把X测验的分数等值到Y测验的等值函数的反函数；

　　（4）公平性，即对于考生而言参加哪个版本的测验应该没有区别；

　　（5）跨样本不变性，即不管对于来自总体的哪个样本，用来链接X分数和Y分数的等值函数一样。

　　当某个考试项目推出新的版本，要确保新版本上的分数量尺与旧版本上的分数具有相同意义时，等值也是最重要的工作。例如，纸笔考试与计算机化考试，它们具有相同的测量构念、相同的考试大纲和相同的组卷蓝图，只是由于测验形式的变化可能会导致试题的统计特征有所变化。为了确保对所有考生公平，无论考生接受哪种形式的测试，都应该获得具有相同意义的分数。事实上，通过等值证明新版本考试分数与原有版本考试分数可替换使用，也可看作是新版本考试的一种效度证据。

供稿：关丹丹

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：昵称21189171 > 《中国考试》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多