分享

学科素养测评如何为学生发展提供驱动力?

 vivi只这心 2019-01-07

编辑整理丨Blair

 

11月11日,由新学说主办的“国际学校发展大会”(VIS)圆满落幕。在以“国际学校质量评估与保障”为主题的主会场上,北京大学中国教育财政科学研究所教育测量与评价中心主任黄晓婷以《学科素养测评的国际经验与发展趋势》为题,发表了精彩演讲,以下为精彩回顾:

 

北京大学中国教育财政科学研究所教育测量与评价中心主任黄晓婷

 

黄晓婷为美国加州大学伯克利分校教育学博士,现任北京大学中国教育财政科学研究所副研究员,教育评价中心主任,主要研究方向为测量学研究和其他量化研究。在此次演讲中,黄晓婷对学科素养测评进行了深入的分析。

  

何为“素养”?

OECD提出“素养” 的概念:“素养不仅是知识与技能。它是在具体情境中,通过利用和调动心理、社会资源(包括技能和态度),以满足复杂需要的能力。

 

欧盟的核心素养框架

美国的核心素养模型

我国的核心素养框架


如何测评学生的学科素养?以PISA为例

PISA (Programme for International Student Assessment)


最广泛的参与:到2015年,PISA已经有70多个国家和地区参与,是国际上规模最大的标准化考试。


测试对象:PISA不是按照年级抽样,而是按照年龄抽样,针对年龄15岁3个月到16岁2个月的学生。

 

PISA测试的3种学科素养

科学素养:作为公民参与科技相关的事务的能力,解决社会生活中与科学技术相关问题,并有科学的意识,会科学反思


阅读素养:为实现个人目标,发展个人的知识和潜能,有效地参与社会生活,而理解、运用和反思书面材料的能力。


数学素养:人们在各种情境下提出数学问题、运用数学知识和解释数学结果的能力,这些能力能够帮助个体理解数学在社会生活中的作用,并且做出好的决策和判断,成为一个具有建设性、 参与性、反思能力的公民。

 

PISA科学素养的测试框架

在社会生活背景下的科学能力、知识和态度

社会生活背景

 

三种能力(COMPETENCY)

第一,科学地解释现象的能力;第二,设计和评估科学研究方法的能力,其中包括:找出要解决的问题是什么、甄别哪些问题可以用科学方法进行研究、提出合适的研究方法、评估当前研究所用方法的科学性、解释和评估当前的研究是如何保证数据的信度、客观性和结论的可推广性;第三是解释数据和论据的能力。

 

三种知识(KNOWLEDGE)

内容(content):科学事实和理论

过程(procedural):科学研究的方法,特别是数据采集、分析、解读

认知(epistemic):科学的认知方法,假设、观察、模型、理论、事实


与科学相关的态度

1、调查学生对于以下三方面的态度:对科学技术的兴趣、环境意识和对科学的研究方法的价值认同

2、通过问卷进行调查,结果不计入总分

3、部分国家出现能力高分,态度低分

 

基于“科学素养”框架的测试蓝图


PISA的命题和组卷过程

由专业命题人员和部分参与国的专家根据测试框架编题

1. 题目的总量约为实际测试的4倍

2. 第一轮审核修改(item paneling)

3. 小规模试测,测试后保留1/2左右在难度和内容上符合要求的题目

4. 参与国家和地区进行翻译、本土化

5. 通过第一轮试测的题目进行大规模试测,在所有参与的国家和地区抽样1000名左右,依据这次试测数据,技术试题的各项指数,审核试题的国际可比性

6. 根据测试蓝图和试测结果,选择内容和难度适宜、具有国际可比性的性能良好的题目,组成最终测试的试卷

 

题本设计

题目多,但是测试时间有限。2015年之前,组成13个题本(testlet);2015年计算机考试,共产生396种组合。同时,为了实现不同题本间可比,每个题目均包含一定数量的与其他题目相同的题目,每个题本力求内容、难度、性别和地域偏向的平衡。

 

测试结果分析

1、用项目反应理论(item response theory)估算学生能力

2、为什么不使用原始分? 不同测试之间成绩不可比

 

素养水平的等级划分

分值的含义:通过试测数据分析和专家组对题目内容的质性分析,设定合格、优秀的分数标准和能力标准。

例如,2015年,各国/地区平均约有7.7%的学生达到优秀;新加坡的优秀率为24.2%,台湾15.4%,芬兰14.3%。

 

追踪学生素养的发展变化

1、IRT分值转换到平均分为500,方差为100的标准分

·后期数据分析发现,相差一个年级平均相差40分

2、跨年度等值

· 连续两轮考试中,使用将近一半的共同题

· 使用IRT的等值方法

· 最后从IRT分值换算到标准分

 

发展趋势

首先,以“素养”为核心的质量观越来越深入人心;其次,除学科素养外,越来越多的研究者尝试开发“跨学科素养的测试”;再次,测量理论(项目反应理论,IRT)的应用更为广泛;最后,It技术、大数据与人工智能在“素养测评”中的应用更为广泛。

 

服务于学生发展的“素养”测评

1、认知理论方面的基础研究还不足

2、需要与课程、教学紧密结合

3、更适合用作低厉害的发展性评估

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多