分享

教育测评的未来发展趋势

 凡人sypls 2019-07-15
78-11日,上海市教育考试院举办“K-12科学测评研究项目上海研讨会,国际教育评价协会(IAEA)主席、美国ETS著名专家Randy E.Bennett率领美方工作组一行四人全程参加会议,并在会议期间做了测评的将来主题的演讲。Randy对教育测评未来十年的发展趋势所做的分析,很值得我们学习和借鉴。

 1.新技术在测评中的应用

 新的技术在教育测量方面所发挥的作用,正在越来越凸显出来,只要看看当下一些主要的教育测评项目比如OECDPISA测试等,就能明白。新技术的应用,不仅能更有效地考查传统意义上所定义的那些能力,还能考查传统测评方式无法企及的新能力,并且能够收集和挖掘在线学习活动蕴含的大数据。另外,新技术让收集和分析在线学习大数据成为可能。

 2.测评新的构念

 在测量领域,一个众所周知的事实就是:我们能测的信息,远远少于在学习的活动中所涉及到的多样化的信息。但随着社会的发展,各方所需要的人才规格也越来越多样化,需要通过测评将具有各种特质的人区分和辨别出来。对个体来说,问题解决的过程和能力、社会情绪方面的坚毅性、社会意识和自我意识等等,都是新的构念;从群体的角度看,学习的环境因素、社会和学校对教育的支持、合作学习等,也是新的构念。我们既需要关注新构念的测评结果在多大程度上用于重要决策,例如高校招生或者对学校进行问责,还要关注新构念的测评在多大程度上用于形成性评价。

 3.将测评建立在更深层次的认知和学习模型的基础之上

 测评将建立在更深层次的认知学习和学习模型的基础之上,比如说我们现在所开展的K-12科学测评项目,就是建立在认知学习、学习进阶等前沿理论的基础上所进行的探索。这样的测评将对考试设计和试题命制提供更多参考,对学生学习能力发展的测评也将更有意义。

 4.充分利用更复杂的测评任务

 一个学科中具有熟练水平特征的活动通常包含多样化的问题情境,但受限于测量任务,测量过程往往仅针对其中的某些内容,有很多信息并没有体现出来。比如说有的孩子动手能力很强,在制作方面很有天赋,但他的文化课成绩一般,而现有的通过文化课测评的方式,就很难将他动手方面的特点测量出来。为了弥补传统测量中的这些缺憾,人们设计出了通过论文、实验、作品集等方式来考查学生的学科能力。近年来,开始提倡甚至利用模拟任务或教育游戏等对学生进行测评。当然,测评任务越复杂,考试的覆盖面、公平性,考试开发、命题和评分的成本,考生时间消耗等方面的问题就越大。为此,可以尝试设计结构化的任务、采用更高级的考试开发工具、采取自动评分等。

 5.测评更加个性化

 接受教育和测评的学生,具有不同的学习水平和学历、不同的学习背景和兴趣,采取整齐划一的测评手段和方法,显然不能将这些学生的学习状况精准地测量出来。个性化的测评有几个主要的维度:一是普惠性,比如采取盲文试卷、大字号试卷等,让残疾的学生能够和普通学生一样便捷地参加测试。还有的在测评的过程中,允许学生使用自己的计算机来参与测评,避免因为不熟悉集中提供的计算机而导致测量的误差;二是自适应性测量,也就是把考生的能力与试题的难题相匹配,测评试卷因人而异,具有很鲜明的个性特色;三是让学生自己选择测评的试题,根据学生的选择以及作答情况对学生的学习状况给出评价。在一些学科的终结性评价中,老师会让学生选择是写论文形式的开卷考试,还是常规测评的闭卷考试,就是如此。四是让学生选择考什么,即选择自己的测评目标和课程标准。新高考改革中让学生在六门课中选择三门课,就体现出这一点。

 6.测评是为了促进学习

 长期以来,教育测评为政策制定或行政决策提供信息,从而间接地提升学生的学习效果。然而,教育测评的价值受到越来越多的质疑,如有人认为它浪费了教学时间,有人甚至觉得它对考生有害。未来,教育测评不但要更好地考查学生能力,还应该设计一些能够指导学生学习的任务,帮助学生通过考试学习一些重要的内容,通过为学生提供质性评价来鼓励学生反思解决问题的过程。

 7.测评应更好地考虑学生的背景

 大规模的终结性考试往往是通过“去背景化”的试题对学生能力进行推断,忽视了学生所处的社会、学习和教学环境。好的测评应该结合学生背景判断学生的真实能力。未来可以尝试创造电子化学习环境,并将测评嵌入其中,成为“嵌入式”测评,以使测评结果更加合理可行。

 8.将测评“嵌入”在教学的不同环节和阶段

 “嵌入”式测评,更能体现真实的学习情境,可以通过2种方式实现:第一种是对学生在学校或其他学习环境中不同时间段的表现进行随机抽样,形成大数据记录,这种测评方式可以是描述性的,即只展示学生在做什么或学习什么,也可以是推断性的,即推断出学生知道什么或能做什么;第二种是选择特定时间在课程中插入一系列预先设计的活动,对学生在课堂上的反应进行记录,这种测评方式对学生的行为抽样进行预先设计,因此比较聚焦,对学生知识和能力的推断也更加可靠。在理想的情况下,最好将这2种“嵌入式”测评方式结合起来。需要注意的是,“嵌入式”测评可能引发隐私问题。

 9.采用自动评分技术

 借助自动评分技术,可以提高评分效率,还能够采用更加复杂的测评任务,从而向考生提供更详细的反馈信息。自动评分用于形成性评价完全可行,但用于高利害性考试则需要谨慎,因为其算法类似于“黑箱子”,无法检测,而且很多自动评分技术的原理只是基于相关性分析进行预测,并没有考虑构念,有些考生可能因此投机取巧获得比实际能力高的分数。对此,在应用自动评分技术之前,需要向相关方面充分解释算法原理;此外还应该确保算法模型与考试的构念相契合。

 10.把新技术整合到建模和分析中

 在线学习和评估导致新数据类型的出现,包括考生各种类型的活动、延续时间等,这些都是非常有用的信息。传统的心理测量学模型只适用于比较简单的数据处理,当我们拥有越来越多来自在线学习和在线测评的新型数据,尤其是过程性数据,就需要综合教育数据挖掘技术、学习分析技术、教育测量学、统计学等领域的最新成果,这些都应该在建模和分析时加以考虑。

 11.提供更加有效的分数报告

 分数报告是考生作为用户体验的重要组成部分,能够体现出测评的正面影响机制。然而,相对于测评的其他环节,如自适应测试、模拟任务、自动评分等,分数报告的革新还比较缓慢。未来的分数报告应该以简明、直观、生动的方式反馈给学生,还能对学生的表现进行重现,同时支持学生与分数报告的互动等。

未来教育测评不会改变的几个方面

 (2019-07-20 06:17:57)

转载

 此前的博文中提到,在上海市教育考试院举办的“K-12科学测评研究项目”研讨会上,ETS教育测评专家Randy(任迪)做了题为“测评的将来”的主题演讲,对教育测评未来十年的发展趋势做了11个方面可能发生改变的预测。与此同时,他还在报告中指出,虽然测评的很多方面都在发生改变,但也有一些方面在未来是不大可能变化的。

 Randy认为,以下四个方面在未来不大会发生变化:

 1.测量的基本特征不会变

 测量包括四个方面的基本特征:一是通过测量任务的设计、测量项目的编制和实施测量,来收集关于考生学力方面的证据;二是把通过测量观测到的证据与考生个体、群体、或者组织机构等特征联系起来,并进行有意义的特征描述;三是将测量的结果以分数报告的形式公布出来,在教育决策的过程中应用测量的结果;四是对测量的效度进行分析和评估。即评价证据收集的机会、特征,评估决策的质量和所带来的各方面的影响,反过来对测量本身进行审视。

 2.测量针对的重大社会问题不会改变

 测量针对的社会重大问题始终包括:收集教育体制有效性的材料;监测主要的社会群体之间教育水平、教育成就上的差距;为学生个人提供资源分配的信息支持(如通过测量发布各类学校的录取分数控制线,等等);促进学生的学习和教师的教学,以及学校整体教育质量的提升。

 3.测量潜在的社会价值不会改变

 这些社会价值包括效度、公平性、可比性和可重复性。所谓可重复性,就是信度或再来一次给我看看,就拿上海的新高考改革来说,连续三年的本科线都在402分左右,就体现出了很好的可比性和信度,考生和家长心里有数了,就不会有很多的焦虑。

 4.形成性评估和总结性评估的差别不会改变

 形成性评估是在学习的过程中不断收集相关的学习证据,并对学生的学习情况做出评价;总结性评估则是在一个阶段的学习任务完成之后,通过特定的测量形式所进行的评估,如期末考试、中考、高考等等。近些年来,人们对形成性评估有了更多的关注,于是就有人提出可以用学习过程中收集到的测量的量化数据来完全替代总结性的评估,Randy认为,这两种评估方式各有特点,不可能用一种取代另一种。

 之所以形成性评估不可能取代总结性评估,是因为:第一,地区之间、学校之间、班级和班级之间的学生群体、学习状况差异都很大,由此采集出来的测量数据差异也很大,这些差异巨大的数据在进行比较的时候难度很大;第二,好的测量应该不和具体的学生、学校有太密切的联系,所采集出来的数据要具有相对客观性,在这方面,形成性评估显然做不到,而总计性评估就能体现的很好;第三,因为形成性评估和学生、家庭、学校等有密切的关联,所以容易带来隐私是否会泄露等问题,一旦数据使用不当,就会导致公众对测评机构的不信任;第四,持续不断地收集学生和老师的过程性的数据,有可能会遏制他们在教与学的过程中接受挑战的态度与习惯。特别是那些把测量的结果与教师的升迁、任期、奖金等相关联起来的时候,会增加各方面的焦虑和不满。

     测评随着时代的发展不断变化是必然的,但其中也有一些恒常性和不变性,来保证测评在社会变革的洪流中有序改变。测评如此,很多领域也是如此。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多