分享

刘钧燕|探索基于核心素养的义务教育阶段考试评价

 叶老师YP 2022-07-12 发布于湖北

刘钧燕.探索基于核心素养的义务教育阶段考试评价[J].全球教育展望,2022(5):106-116.

Image

摘要  2022年4月,我国颁布了最新版的《义务教育课程方案》和16个学科的课程标准,进一步明确了新形势下“培养什么人、怎样培养人、为谁培养人”。新版课程标准有两大关键突破:凝练了课程核心素养,凸显学科育人价值;研制了学业质量标准,明确育人要求。新课程的落地,除了新教学之外,还需要实施新评价,积极探索如何基于课程标准合理测评学生的核心素养:应依据学业质量标准合理设定评价目标;注重情境在考试命题中的关键作用;加强基于真实情境的开放性题目设计;探索跨学科试题命制;探索非书面测试方式;依据学业质量标准着力研制评分标准。

关键词  核心素养;学业质量标准;考试评价;情境

作者简介  

刘钧燕/华东师范大学课程与教学研究所副研究员  (上海  200062)

2022年4月,我国颁布了最新版的《义务教育课程方案》和16个学科的课程标准,进一步明确新形势下“培养什么人、怎样培养人、为谁培养人”。这是自2001年颁布《义务教育课程设置实验方案》和18个学科的课程标准(实验稿),2011年修订各学科(小学科学除外)课程标准(2011年版)以来的又一次重要修订。

自2001年的课程标准实验稿开始,课程标准逐渐取代了之前的教学大纲,成为教材编写、教学、考试命题和评价的依据,推动了新课程在全国的推进和实施。但2001年的课程标准实验稿及修订后的2011年版课程标准,主要是对学习内容与阶段性学习结果的描述,属于内容标准范畴,规范了“学什么”,而没有明确学生应“学到什么程度”[1]。2022年版课程标准则规定了义务教育课程的性质、课程理念、核心素养与课程目标、课程内容、学业质量、课程实施,实现了内容标准与学业质量标准的有效统整,进一步彰显了课程的育人价值和时代特色,体现了核心素养时代的育人要求。

课程标准能不能真正发挥作用,关键在于它是不是教材编写、教学实施、考试评价的直接依据。2022年版课程标准的落地,除了新教学之外,还需要实施新评价,探索如何基于课程标准合理测评学生的核心素养。        

一、新课标的两大关键突破

Image

2022年版课程标准有两大关键突破:一是各学科基于学科本质凝练了课程核心素养,凸显学科育人价值;二是各学科以课程核心素养培养为宗旨,基于各个学段的学生身心特点,研制了学业质量标准,明确育人要求。

1. 凝练了课程核心素养,凸显学科育人价值

新版课程标准首次凝练了义务教育课程核心素养,凸显了学科育人价值。2014年,教育部《关于全面深化课程改革落实立德树人根本任务的意见》明确要求“依据学生发展核心素养体系,进一步明确各学段、各学科具体的育人目标和任务,完善高校和中小学课程教学有关标准”[2]。在本轮课标修订工作中,16个学科积极落实党的教育方针,依据“培养有理想、有本领、有担当的时代新人”的义务教育育人总目标,在反思学科本质的基础上,凝练了本学科的课程核心素养,是课程育人价值的集中体现,是学生通过本学科课程学习而逐步形成的正确价值观、必备品格和关键能力。例如,道德与法治学科基于义务教育的育人目标、中国学生发展核心素养以及课程性质,提出了五大核心素养:政治认同、道德修养、法治观念、健全人格和责任意识[3]

与普通高中课程标准(除语文学科外)对学科核心素养进行三到六个水平的划分不同,义务教育阶段的课程核心素养不划分水平,但部分学科明确了课程核心素养的学段表现或特征,如道德与法治学科区分了小学和初中的学段表现;英语学科区分了3—4年级、5—6年级、7—9年级三个学段的特征。

2. 制定了学业质量标准,明确育人要求

新版课程标准还研制了基于课程核心素养的学业质量标准,明确了新时期义务教育阶段的育人要求。学业质量描绘了学生在完成各学段教育或结束义务教育时应该具备的各种核心素养,以及在这些素养上应该达到的学段特征。它以该学科的课程核心素养为主要维度,结合课程内容,对学生学业成就表现进行整体刻画,以反映课程目标的达成度。

学业质量标准通常是从问题情境、知识内容、思维方式、实践活动和价值观念等维度进行综合描述。例如,《义务教育地理课程标准(2022年版)》对“地球的表层”部分的学业质量做了如下表述:

学生在不同的情境中,对于从各种媒体中获取的地球表层环境的信息,能够初步从系统、动态的角度,简要分析、概括地球表层自然环境与人文环境的主要特征,以及环境要素的时空分布和变化特点(综合思维、区域认知)……[4]

该片段描述了完成初中地理学科“地球的表层”部分课程的学习后,学生应具备综合思维和区域认知的核心素养,在不同的情境中,对于地球表层环境的相关信息,能通过简要分析的方法,概括相关内容(地球表层自然环境与人文环境的主要特征,以及环境要素的时空分布和变化特点)。

与普通高中课程标准的学业质量分水平不同,为彰显义务教育的基础性,减轻学生学业负担,义务教育学业质量不区分水平,只分学段明确基本标准。对于六三制,学段划分为学段一(1—2年级)、学段二(3—4年级)、学段三(5—6年级)、学段四(7—9年级);若是五四制,则学段划分为学段一(1—2年级)、学段二(3—5年级)、学段三(6—7年级)、学段四(8—9年级)。

表1  分学段的学校质量标准

Image

注:上表以六三制为例,1代表1—2年级的该素养特征;2代表3—4年级该素养特征;3代表5—6年级该素养特征;4代表7—9年级该素养特征。

学业质量本质上是一种表现标准,从学习结果的角度刻画了学生学业成就表现,明确了每个阶段的学生应“学到什么程度”,改变了以知识点为纲,以识记、理解和应用等掌握程度为质量水平的学业质量观,引导树立了科学的学业质量观[5]。因此,学业质量标准应成为基于核心素养的考试评价的主要依据。      

二、对既有考试评价的反思

Image

根据对结果解释的不同,考试分为常模参照考试和标准参照考试两种。常模参照考试以学生所在群体的平均分为参照标准(即常模),根据其在群体中的相对位置来报告评价结果。常模参照考试关注的不是个体学生知识或能力的绝对水平,而是其在所属群体中的相对位置。标准参照考试是将每个学生的分数与预先设定的标准进行比较,对其做出是否达标或达到什么程度的判断,不考虑其他学生分数。标准参照考试常用来检验学习效果,了解个体学生对一定范围内容的掌握是否达标或达到什么程度。从功能来看,常模参照更适用于选拔性考试,标准参照则更适用于合格性考试。[6]

一直以来,义务教育阶段学校大多采用常模参照考试,更关注学生的相对排名。尽管有关部门三令五申,“严禁以任何形式、方式公布学生考试成绩及排名”[7],“不得有考试排名等行为”[8],依据考试分数进行班级甚至年级排名的现象依然隐秘地存在,在初中阶段尤甚,学生和家长一如既往地追求排名竞争,加重了学生学业负担,刺激了社会的教育焦虑。

义务教育旨在保障每位儿童、少年的受教育权利,提高国民素质,具有全纳性、全面性和基础性的属性,义务教育课程旨在培养有理想、有本领、有担当的时代新人,为学生适应未来社会的学习与发展奠定基础。从本质上,义务教育阶段的考试(除中考外)不承担选拔任务,而是检验学生是否达到义务教育阶段课程标准的要求。因此,义务教育阶段的考试评价应采用标准参照模式,参照课程标准进行。

此外,长期以来考试命题通常采用双向细目表的形式。双向细目表的一个维度是待考察的课程内容,另一个维度是掌握水平(常见的是识记、理解、应用),命题者需要确定不同内容在不同掌握水平上的题目数量、难度以及题型等以完成命题任务。其背后的依据是布鲁姆(Bloom)的教育目标分类学,学科知识体系被分解为零散的知识点,学生对这些知识点的掌握程度成为预期学习目标[9]。这种考试评价首先关注的是碎片化知识的学习和孤立技能的习得,强调确定性解题过程和标准答案,评价任务高度抽象,脱离真实生活。学生在这种教学和考试评价方式下习得和巩固的学科知识或技能,难以迁移到现实生活中。

与新课程、新教学相适应的考试评价必须超越对知识点机械回忆、对技能简单操练式的考察,变革基于双向细目表的命题形式[10],围绕学生核心素养的发展,重点关注学生综合运用(跨)学科的知识技能、过程方法,情感态度价值观,创造性解决不确定性的、复杂的现实问题的能力[11]    

三、探索基于核心素养的考试评价

Image

2022年版课程方案明确要求“全面推进基于核心素养的考试评价,强化考试评价与课程标准、教学的一致性,促进'教—学—评’有机衔接”[12]。推进考试评价改革,探索基于课程标准合理测评学生的核心素养,应重点关注以下工作。

1. 依据学业质量标准合理设定评价目标

有效开展考试评价首先要科学合理地设定评价目标。摈弃以知识点为纲,以掌握程度为质量水平的学业质量观;摈弃对学生考试结果相对排名的追逐,在素养导向下,义务教育阶段的考试评价重在检验学生是否达到课程标准的要求。因此,评价目标的设定应依据课标文本中的学业质量标准。

学生核心素养的培养和发展是一个连续的过程,在日常学习中,它以不同年级、单元或主题的课程内容和教学活动为载体,但义务教育阶段的学业质量标准是一种整体刻画,分学段呈现学生在完成某学段教育时应具备的核心素养及其学段特征。因此,在设定某一次考试的评价目标时,并不能直接拿来主义地使用学业质量标准,而需要审慎地处理学段学业质量标准与具体单元或模块的内容标准及学业要求之间的关系。建议将课标中按学段呈现的内容标准层层细化为年级内容标准、单元内容标准等等,同时研制出相应的表现标准,以作为评价目标的依据。[13]

此外,设定评价目标时也应兼顾学生学情。学业质量标准是统一的,但不同地区、不同学校、不同班级的学生学情存在差异,在确定具体的评价目标时,应充分考虑参加当前考试的学生群体的整体学情。同时,学生个体之间存在差异,即便是同班学习完全相同的课程内容,不同学生也会在学业成就上表现出差异,因此,制定评价目标时也要兼顾学生在核心素养以及学业质量标准表现上的个体差异[14][15]

2. 注重情境在考试命题中的关键作用

根据OECD的定义,核心素养“不只是知识与技能,而是在特定情境中,通过利用和调动心理社会资源(包括技能和态度),以满足复杂需要的能力”[16]。可见,核心素养是三维目标的整合与提升,是学生“在面对复杂的、不确定的现实生活情境时,能够综合运用特定学习方式所孕育出来的(跨)学科观念、思维模式和探究技能,结构化的(跨)学科知识和技能,世界观、人生观和价值观在内的动力系统,分析情境、提出问题、解决问题、交流结果过程中表现出来的综合性品质”[17]。因此,与生活紧密关联的真实情境是学生核心素养培养和发展的重要载体,真实情境的深度学习是核心素养落地的必要条件,教学从关注碎片化学科知识技能的习得,转向关注复杂、不确定性真实问题的解决。

同时,情境也是核心素养表现的载体,是核心素养测评的关键要素。归根结底,核心素养是学生个体的内在品质或综合特征,是潜在、不外显、无法直接观测的。学生的核心素养及其水平必须通过他们在不同结构化和复杂程度情境下的测评任务中的表现来推测。问题情境越真实,越贴近学生的生活实际,越容易激发学生的素养表现。[18]

以下面这道国际学生评估项目(PISA)的数学样题为例。这道题如果抹去演唱会观众席的情境,它就是一道乘除法计算题,大部分学生能轻松地解题目。从数学到数学,被过于人为地简化和抽象,缺少和现实生活的链接,这样简单“操练”巩固的学科知识和技能难以迁移到现实生活中。演唱会观众席这样一个真实的生活情境能刺激学生结合现实生活的思考和作答反应,引发学生核心素养表现:学生结合生活实际,经过对情境的审慎思维和判断,通过问题情境的数学化表征过程,将该情境中的问题转化为数学问题,进而通过数学求解过程运算得到数学结果,然后再还原到情境中对结果进行阐释。通过学生在完成该真实情境的评价任务时的思考过程和结果,可以推测其具备的核心素养及特征。

Image

许多大型国际教育评价项目,如国际阅读素养进展研究项目(PIRLS)、美国国家教育进展评估(NAEP)和PISA都在测试情境的定义与分类方面做了大量探索。以PISA为例,其阅读、数学、科学等领域的试题都有不同的情境分类(如表2所示)[19]。例如,PISA阅读测试的情境有个人、教育、公共、和职业四大类,试题会选用密切联系生活的文本素材,尽可能为考生还原真实生活中发生的这四大类情境。结合具体的运用领域,PISA还给出了情境的具体细化。以PISA 2012科学领域为例,在健康、自然资源、环境、灾难和科技前沿这五大主要运用领域,情境进一步具体化为表3所示。[20]PISA明确了每一种情境的内涵,并给出了相应的样例,为命题者提供了富有操作性的指导。[21]

表2  PISA不同领域试题的情境分类

Image    

表3  PISA 2012科学测评的情境分类

Image    

依据学业质量标准的考试评价,应注重情境在考试命题中的关键作用。以情境创设为突破口,对考试立意和指向进行适度重构,由考察学生是否掌握了特定学科的课程内容转向关注学生能运用学到的知识技能做什么,关注学生在不同情境中提出、分析和解决问题的能力。参照国际经验,结合学科内容及教学实际,整体设计学科考试评价的情境,明确学科情境分类及内涵,进而基于真实情境,积极创设能够引发核心素养表现的评价任务。

3. 加强基于真实情境的开放性题目设计

素养导向的教学重在培养和提升学生的核心素养,从而帮助学生在各种复杂的现实情境下整合学到的知识、技能、过程、方法、态度和价值观等合理有效地解决各种挑战性的真实任务。与之相匹配,考试评价就要合理有效地考察学生在现实的生活情境中解决错综复杂问题的能力及综合性品质。现实生活是多元、复杂、充满不确定性的,生活中的问题很多并没有标准的解决方法,而有些可能有多种处理方案。传统的考试评价是知识取向,追求知识的确定性与准确度,强调答案的唯一性,这显然是与现实脱节的。[22]因此,应加强基于真实情境的开放性试题的设计,以更有效地收集学生在核心素养上的具体表现。

以下面两道语文阅读题的对比为例。试题1以杨绛先生的人生经历创设了情境,但设问方式以及给出的具体范围使得该问题实质上是个封闭式问题,与简单的古诗文默写题并无差异,不能给予学生相对开放的思考空间,也无法更多地采集学生的核心素养表现。

试题2的材料同样是关于杨绛先生的经历,但与试题1不同,它是一个开放性试题。学生作答时,需要从阅读材料中筛选出有效的信息,并且不仅需要理解材料文本的表层语义,更需要审慎思考文本背后的隐藏信息,还需要能结合个体背景知识、调动语言实践经验、语文积累对文本信息做出合理推论。通过学生作答该开放性试题的过程与结果,可以有效地推测学生语文核心素养的发展状况。

Image

命制基于真实情境的开放性试题,而不是只按照解题套路机械地输出知识内容的客观题,这具有一定的挑战性。一道良好的开放性试题应该能为学生提供开放的思考空间,刺激学生充分调动积累的知识、技能,有效地选择适当的策略方法,基于情境对问题任务进行解构再结构,促进学生采用适当的方法完成试题中的任务。

4. 探索跨学科试题命制

现实生活错综交织,要培养学生在真实情境中的问题解决能力及综合性品质,应在日常教学中要重视跨学科主题学习活动的开展。2022年版义务教育课程方案就明确要求“各门课程用不少于10%的课时设计跨学科主题学习”。[23]相应地,考试评价也应积极探索跨学科试题的命制。

跨学科试题是核心素养导向的考试评价的一个重要探索方向。基于综合的、现实情境的跨学科任务,能激发学生思考,引发学生综合运用多学科的知识技能,审慎地分析情境,建立情境、知识和可能结果的关联,最终合理地解决问题、完成任务。通过学生的作答过程和结果,能推测学生发现问题、辨析概念、建立关系和解决问题的能力,考察学生在相关学科课程学习中习得的学科观念、知识技能、价值观念等。[24][25]

跨学科试题通常是开放性的主观题,以题组的形式出现,基于同一情境,设置多道小题。试题的跨学科性可以体现在情境创设、设问、作答要求等元素中,如表4所示,其层次逐步提升。

表4  试题跨学科的层次

Image   注:√表示跨学科,×表示分学科

层次一:试题的情境是跨学科的,但设问是分学科的,每个小题的任务的所属学科范畴清晰,学生作答时采用不同学科的知识对应完成不同小题的任务。这是比较容易操作的跨学科命题方式,也是目前实践中最常见的跨学科命题方式。

层次二:试题的情境是跨学科的,并且设问也是跨学科的,不同小题考察的任务之间的学科范畴难以清晰地区分,需要借助积累,从不同学科角度进行整体分析,但学生作答仍主要是分学科的。

层次三:试题的情境是跨学科的,设问是跨学科的,学生作答也需要跨学科,不同小题之间无法清晰地区分学科范畴,并且学生作答过程需要充分调动各个学科的知识、技能、方法,从不同学科角度进行综合分析并解决问题。这类属于多学科交融解决型试题,在实践中比较难操作,无论题目命制、学生分析作答、评分标准开发都有很大挑战性。

5. 探索非书面测试方式

2022年版课程方案要求“因时因事因人选择评价方式和手段,增强评价适宜性、有效性”[26]。书面纸笔测试是实践中普遍采用的评价方式,基于核心素养的评价还应积极探索非书面的测试方式,推进行为导向、成果导向、结果导向的表现评价,对学生在真实情境中的典型行为表现进行评价。[27]建议在准确把握课程核心素养内涵及其特征的基础上,结合学科课程内容,学生发展水平,积极创设真实情境的非书面测试任务,记录学生在真实任务中的动手操作、行为表现、作品展示、口头报告等[28],收集学生的表现信息,并基于良好的评分标准进行评价,进而推测学生的核心素养水平。

《深化新时代教育评价改革总体方案》明确要求要完善德育评价、强化体育评价、改进美育评价、加强劳动教育评价,旨在通过改革学生评价,促进德智体美劳全面发展[29],这些学科的核心素养中有些更适合用非书面的方式来考察。以劳动学科为例,其课程核心素养包括劳动观念、劳动能力、劳动习惯和品质、劳动精神[30],要考察学生在这四个核心素养方面的发展状况,除了传统的纸笔考试题,应更多采用表现性评价方式。应结合真实生活情境,创设与学生发展阶段相匹配的生活化的劳动任务,借助任务要求关联核心素养,通过任务成果或作品的分析来考察学生掌握的劳动知识,通过行为观察过程性记录来监测学生的劳动技能和劳动习惯,通过成果或作品分析来推测学生的劳动创新。

6. 依据学业质量标准着力研制评分标准

核心素养导向的考试评价还有一个不可或缺的关键环节——如何从学生的作答表现来推断其所具备的核心素养,即如何评分。根据具体的评价任务,需结合课程内容,依据学业质量标准,研制等级性评分标准,包括评价框架、主要特征和表现样例[31](如表5所示)。

表5  评分标准示例

Image

评价框架应基于每个具体评价任务涉及的课程内容,意图测量的核心素养构建,列明所要测量的核心素养的关键维度和指标。主要特征是指在框架所界定的维度和指标上,学生在解决任务中所表现出来的具体特征。评价框架和主要特征结合起来,实质上是要建立所测的核心素养与学生在具体任务中的实际表现之间的关联,以客观地评测学生在完成任务过程中所展现的知识、技能,以及背后的思维特征、探究方式的水平或层次。表现样例是学生作答表现的例子,以样例展示不同水平学生在该任务上的作答表现,使评价框架和主要特征的描述具象化,便于阅卷老师理解评分标准从而操作。

好的评分标准既要能有效地测量学生在完成具体任务中体现出的核心素养,还要能有效鉴别不同学生核心素养表现特征的差异,因为个体差异的存在是考试评价的前提假设之一。[32]良好的评分标准,能够较为明晰而准确地揭示不同水平的学生其核心素养表现的实质特征和变化,进而揭示学生的特定时间段内的学习结果和进步情况,从而有助于教师基于评价结果,更有针对性地开展教育教学工作,有利于鞭策学生自我反思,分析取得的进步和尚存的不足,运用评价结果改进学习,明确后续学习的重点,实现以评促教、以评促学,从而进一步提升核心素养。

参考文献: 

Image

Image

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多