分享

专题 | 系统调整:语文教育评价对核心素养发展诉求的回应

 张福涛lu70kpm9 2020-03-04
作者

叶丽新/华东师范大学教师教育学院副研究员,教育学博士,硕士生导师


2001年,我国启动了第八次基础教育课程改革。伴随2017年版普通高中课程方案和各学科课程标准的颁布,我国迈入了“全面深化基础教育课程改革” 的阶段。这一阶段的课程改革,最为突出的标识是将“课程发展的逻辑起点”由“学科内容”调整为“核心素养”。

当下和未来较长一段时间里,如何让“中国学生发展核心素养”和 “学科核心素养”落地,是我国基础教育领域的重大课题。其中,“通过教育考试和评价改革,促进核心素养的落地是关键环节”。的确,无论是从 “课程目标、课程内容、课程实施、课程评价” 这样的课程要素构成来看,还是从既有的经验和教训来看,这一轮基于“核心素养”的课程改革,如果没有与之匹配的评价体系,那么“核心素养”可能沦为一时的热词。因此,在探讨核心素养语境下如何“教”的同时,必须深入思考核心素养语境下如何“评价”的问题。

一、“核心素养”语境下语文教育评价需明确的前提认识

核心素养的提出,自然地会给语文教育评价带来一些新的问题,譬如“一般核心素养测评和语文学科核心素养测评是什么关系” “语文学科核心素养是否可以直接测评”等。对此,可以作出如下回答。

(一)一般核心素养测评和语文学科核心素养测评可分可合

从目前既有的理论和实践来看,一般核心素养的测评有两种情况:一是专门测评一般核心素养;二是一般核心素养与其他课程整合在一起测评。前者如国际学生评估项目(Program for International Student Assessment,PISA)在阅读、数学和科学测评之外,有专门的“问题解决”(2012)和 “合作问题解决能力”(2015)测评;后者,一定程度上需要各课程领域根据课程特色,自觉地整合考虑。我国《普通高中语文课程标准(2017版)》(以下简称《课程标准》)“评价建议”中指出“评价时要充分考虑语文实践活动的特点,注意考查学生在活动中表现出来的参与程度、思维特征,以及沟通合作、解决问题、批判创新等能力……”这样的建议便是在语文课程测评中适时关联一般核心素养。本文所说的核心素养语境下的语文教育评价,是立足语文课程,在语文学科核心素养测评中有机关联一般核心素养要素。

(二)语文学科核心素养依然要通过语文学习活动来考查

在“学科核心素养”的界定和阐释中,《课程标准》指明:“语文学科核心素养是学生在积极的语言实践活动中积累与构建起来,并在真实的语言运用情境中表现出来的语言能力及其品质。”“课程目标”部分,《课程标准》的相关表述为:“学生通过阅读与鉴赏、表达与交流、梳理与探究等语文学习活动,在语言建构与运用、思维发展与提升、审美鉴赏与创造、文化传承与理解几个方面都获得进一步的发展……”“评价建议”部分,《课程标准》指明:“……应围绕阅读与鉴赏、表达与交流、梳理与探究等学习活动,在具体的语文学习情境和活动任务中,全面考查学生核心素养的发展情况。”概括而言,语文课程中,学生一般核心素养、语文学科核心素养,还是需要通过“阅读与鉴赏、表达与交流、梳理与探究”等语文学习活动考查的。

明晰了以上两个前提认识,便可正式启动思考核心素养语境下语文教育评价应如何调整。

二、语文教育评价系统调整的框架和思路

为了取得可见的实践效果和获得可持续性发展,核心素养语境下的语文教育评价需作出系统调整。其间有两个要点:一是从全局出发形成调整的“系统框架”;二是各个环节、局部的“调整思路”都要有针对性。

“系统框架”需兼顾当前语文教育评价改革的需要与评价领域的常规问题(或基本环节)来确立。无论何时,“评价”总会涉及“评价什么” “如何评价” 这样的基本问题。其中,“如何评价”又包括中观的“评价途径和类型”与微观的“任务设计、实施和反馈”两个层面。核心素养语境下的语文教育评价,也需要从这些角度考虑应作出哪些调整。“调整思路”可以通过比较核心素养理念下的培养目标和当前语文教育评价的现状,明确语文教育评价各环节需要调整的内容、方向。

综合而言,当前语文教育评价可关注图1所示的系统调整框架和思路。以下逐一探讨各层面的实践切入点。

图1语文教育评价系统调整的框架与思路

(一)充分理解和全面考虑评价“领域”

“测量的第一个阶段,要回答一个问题:‘我们测量的是什么’?我们需要用一个‘标签’来识别‘构念’(construct)。更重要的是,我们需要为这个‘构念’界定‘领域’(domain),即根据关于这个‘构念’的理论和相关知识识别一些可操作的指标(operational indicators)。”对于我国目前的语文教育评价来说,测量的“构念”可指向语文学科核心素养;我们可以为其界定的“领域”,即“一些可操作的指标”可包括“阅读与鉴赏、表达与交流、梳理与探究”(高中),或“识字与写字、阅读、写作、口语交际、综合性学习”(目前义务教育课程标准中的学习领域)。到这一步,操作性还不够,还要为阅读、写作等领域找到更加具体的操作指标或任务设计的切入点。

根据测量理论,测量“领域”的选择和理解至关重要,这会影响测量的内容效度和结构效度。从这个意义上讲,核心素养语境下,测评什么和不测评什么需仔细推敲,这直接关涉所测评的是不是学生核心素养的相关表现。

反观实践,在测评领域的选择和理解上,存在着一些差异和落差。譬如,以2018年我国东西南北中16个地区的语文中考试题来看:有4份试卷不考名著阅读;有4份试卷考到了名著阅读,但只考信息记忆;有4份试卷兼顾考查名著阅读中的记忆和理解能力;有4份试卷中的名著阅读题则专门考查理解或理解以上层级的能力(注:与地区发达与否没有必然关系)。再如,有些地方规定写作只考记叙文写作,有些地方会考到不同文体。这些差异汇总起来,就代表了对测量“构念”不同的理解,对测量“领域”不同的选择和理解。部分选择,恐怕与语文学科核心素养、核心素养这些“构念”并不匹配。高考语文(全国卷1)文学类文本阅读和实用类文本阅读由选考改为必考,则反映了对语文测量“构念”和“领域”的认识在发展。当下,根据对核心素养、语文学科核心素养的理解,结合国际测评经验,有必要从不同角度思考语文测评“领域”。

其一,原本被边缘化,但核心素养语境下需重视的部分。譬如,口语交际。进入21世纪,各个国家和地区在制订核心素养体系时,不约而同地高度重视沟通交流能力。沟通交流能力主要对应于母语课程中的口语交际能力,各个国家和地区的母语课程标准对此都有具体、详细的要求。纵观我国语文课程发展史,语文教学大纲或课程标准层面一直都有关于听说或口语交际的相关要求,但口语交际教学一直处于语文教学实践的边缘。当下,重视口语交际,既符合语文学科本体规律,又能呼应核心素养培养要求。2017版高中语文课程标准中的学业质量标准,虽然篇幅有限,但还是有关于口语交际的学习结果要求:能敏锐地感受交际对象的语言特点和情感特征,迅速判断其表达的正误与恰当程度,察觉其言外之意和隐含的情感倾向;能根据具体的语境和表达的目的、要求,运用口头语言,文从字顺、准确生动地表达自己的真情实感。乐于与他人分享自己的学习经验……。这是四级水平中的要求,是高校考试招生录取的要求。然而现实中,学生不敢交流、不善交流的情况还较为普遍。因此,核心素养语境下,应该给予曾经被忽视的口语交际教学和评价更多的关注。

其二,原本就有,但可以略作调整、拓展的部分。譬如,阅读后的写作。已有的相关实践主要是为了引导学生积累写作素材或借鉴所读文章的写法,以促进写作。这样一种取向本身是有意义的。不过我们不能忽略部分学生写作中存在的这样一种现象:追求好词好句,追求“旁征博引”,却不善于好好分析、说理。对此,我们不妨重视另一种取向的“读写结合”,即通过写来表达对所读内容的理解、思考、评论等。在2017版高中语文课程标准中,每一个任务群的学习要求和教学提示中都提出了“写作”要求,具体形式有:写概要或提要、读书笔记、作品评介、调查报告、文学评论、学术性小论文等。这些内容需要引起我们的重视。这一类任务,可以从不同角度观察到学生阅读、写作以及批判性思维能力的发展情况。这一脉的“读写结合”,在国外被称为“通过写作学习” (writing to learn)或“实质性写作”(substantive writing)等。

其三,原本没有正式提出,需要新研究的测评“领域”。譬如,整本书阅读、思辨性读写等。对于这些较新的“领域”,首先,要加深对这些“领域”的内涵、目标的理解,“在教师开始评估学生的批判性思维能力前,他们自己先要有这些能力。否则,他们没有立场来评估他们学生的思维。”其次,要考虑这些新领域如何和已有的阅读、写作等测评领域融合。

以上从三个方面谈了如何通过精选和深入理解测评“领域”来尽可能逼近“核心素养”取向的评价。不过,这里所提及的一些测评“领域”,可能超越了我们印象中的“考试”范围;按照这样的思路,也许我们的“考试”会不堪重负;有些内容,现在似乎也不具备考试的条件。事实上,核心素养语境下,语文教育评价改革需要走出狭隘的“考试”意义上的评价观,同时丰富对于“考试”的认识。

(二)有针对性地选择和规划评价类型

核心素养或学科核心素养“是复杂的理论,对既有测评理论和实践提出了严峻的挑战”。对于这样难测的“构念”,克服困难的途径有两条。一是研究并发展纸笔考试,精心选择测试领域,精心设计题目。这一方面,高利害考试命题者和测量与评价领域的研究者正在努力推进。二是广大语文教师可在日常教学中扎实地丰富评价的途径和类型。

2003版高中语文课程标准和2011版义务教育语文课程标准中早已提出应恰当运用多种评价方式,只是没有达到期待的实践效果。在当下核心素养语境下,它们又赢得了人们的高度关注。当然,此时的关注会有些更加明确的着力点。

1.进一步加强形成性评价在评价体系中的地位

美国在2010年颁布各州共同核心标准(Common Core State Standards, CCSS)后,联邦政府共拨款3.62亿美元给两个评估联盟,即“大学及职业准备评价合作伙伴”(Partnership for Assessment of Readiness for College and Careers,PARCC)和“智慧平衡评价联盟”(Smarter Balanced Assessment Consortium,SBAC),要求他们制订基于CCSS的学业评估体系。其比较突出的一个共同点是都承诺“评估体系将由一种用于问责目的的总结性(年末)评估和用于整个学年的形成性评估组合而成”。从我们的视角来看,相对于中高考这些高利害、选拔性考试而言,这里所说的学年末的总结性评估和贯穿学年的形成性评估,都是广义的形成性评估。美国通过形成性评估来落实基于美国“21世纪技能”(可以理解为美国版核心素养)的新课程标准CCSS的力度,由此可见一斑。

为什么要如此重视形成性评价?测量与评价领域,基本已经形成了定论,形成性评价和终结性评价,有着各自的功能,任何好的评价方案都需要这两种评价。这本是评价实践领域应有的常态。在核心素养语境下,更需要兼顾这两类评估,因为素养的形成是累积的过程,需要长时间、多角度的观察。

反观实践,似乎我们日常教学中从来不缺“评价”,不过日常评价很多时候是高利害性质的终结性考试的“附庸”。核心素养语境下,形成性评价需要丰富样式。

2.有针对性地大力使用表现性评价

“基于核心素养的课程改革驱动着评价体系的变革,促使我们必须超越传统的只注重‘双基’的客观纸笔测验,采用并丰富‘能检测学生的认知思维和推理能力以及运用知识去解决真实、有意义的问题的能力’的表现性评价。

我们对表现性评价概念并不陌生,其先于核心素养概念出现。当下的着力点是更加准确地理解表现性评价,更有针对性和更大幅度地运用表现性评价。需要特别指出的是,表现性评价任务是相对于“有固定答案的标准化测试而言的”,它可以用纸笔形式实施,也可以用非纸笔形式实施。

表1表现性评价的类型

表1中的任务都属于表现性任务,这些任务类型可以衍生出可大可小、可深可浅的具体任务,如一次考试的一个题目、一个小型研究项目等。不同规模的表现性评价任务可以组合使用。无论任务规模如何,采用什么形式实施,表现性任务的关键是背后有较为明确的指向:我希望我的学生发展哪些重要的认知技能或特质?(例如,以书面形式有效地沟通,利用原始资料和参考资料分析问题);我希望我的学生发展什么样的社交和情感技能或特质?(例如,独立工作,与他人合作,对自己的能力有信心,认真负责);我希望我的学生发展什么元认知技能?(例如,反思他们的写作过程,评估研究策略的成效,回顾他们的进展);我希望他们能解决什么类型的问题?(例如,研究解决没有唯一正确答案的问题);我希望我的学生能够应用哪些概念和原则?(例如了解因果关系)。

表现性评价的关键是指向高阶思维技能,让学生建构自己的反应。这就涉及“如何评价”更微观和操作层面的问题,也就是如何设计任务与如何对学生的反应作出反馈。

(三)优化任务设计并重点关注评价反馈

将上文的思考延续至任务设计层面,首先要努力做到两点:一是切实为核心素养语境下产生的新领域或既有领域的新方向设计任务;二是着力设计有针对性的表现性任务。其后要从命题技术角度考虑核心素养语境下的测评任务有何特点。

指向核心素养的测评任务有何特征?当前提及最多的属性是“情境化”“综合性”等。用2017版语文课程标准中的话语来说即“以具体情境为载体”“设计典型任务”。关于这两点,笔者已经专门撰文论述,此处强调三点:其一,不应给纸笔考试,尤其高利害考试过多的压力,日常教学过程是实施这类任务更为广阔的天地;其二,不应为了“情境”而“情境”,为了“综合”而“综合”,任务设计需有明晰的意图,如前文表现性任务反思清单所提示的那样;其三,应多元、立体地理解“情境”,语文学习内容本身构筑起了一定的情境,不必时时添加“小明”这样的人物和事件因素,除非能调动学生的学习兴趣,或情境中隐含着问题,有助于学生体验发现问题、提出问题、分析问题的环节等。

与任务设计同等重要的,是完成任务后的评价反馈环节。课堂教学中的评价反馈、课后的作业及试题的评价反馈,要特别关注以下三点。

首先,聚焦学生“表现”。前文已述及,指向核心素养的评价应以表现性任务为主。往前追溯,其实经典的迪克(Walter Dick)和凯里(Lou Carry)教学设计模型已经强调在识别目标阶段要 “写出表现目标(performance objective)”,即教学目标应描述学生在完成一个单位的学习后,能做什么。为了保证评价的效度,这种关注学生“表现”的意图应该延续到评价反馈环节。2017版高中语文课程标准呈现了学业质量标准,“学业质量标准将核心素养和教学内容有机地连接起来”。“学业质量是学生在完成本学科课程学习后的学业成就表现”,“学业质量标准”本质上是“表现”标准。因此,在日常的教学评价反馈、作业和试题评价反馈中,应该走出标准答案、采点给分的模式,而关注学生实际“能做什么”,在这个过程中,可以适当参考学业质量标准的水平描述。

其次,区分表现差异。表现性评价会用到很多“开放性”题目或任务。目前存在的一种误区是,将某些开放题的评分建议简化为一句笼统的“言之成理即可”,这样的评分方法会降低测试效度,无法有效地实现诊断功能。教师还是要对学生反应的实质差异作出专业的判断。

为了纵向把握学生个体发展过程中的变化,横向把握学生与学生之间的发展差异,评价反馈的关键之一是区分学生的表现差异,给学生提供有针对性的反馈。这在课堂中体现为教师给出有针对性的评价和指导;在考试阅卷中,体现为根据分层标准赋分,让分数具有较强的解释力。相比而言,后者是更迫切需要解决的问题,良好的试题评分方法也能带动日常教学评价语的发展。

分层赋分需要用到分层评分标准,其基本构成要素为:水平层级、各水平层级描述语及回答样例。前两个要素,可以参考学业质量标准的样式,其中难点是如何分层描述学生对于特定题目的反应表现。从目前的研究和实践来看,有两种方式:一是命题阶段就有意识地根据一定的理论框架(如“可观察的学习成果结构”,Structure of the Observed Learning Outcome,SOLO)设计题目并设置评分标准;二是“采用归纳方式,通过分析学生对开放性任务的各种反应,揭示不同个体的关键特征和理解方式,归纳为不同类型或等级,作为当前任务的评分标准”。当然,实际操作中,两条路径通常是融合使用的,同时还需要准确把握测量目标,对相关的学科内容和学习过程有较为深入的认识。

再次,适当开发类型化评分工具。主观题的分层评分标准,开发成本较高。在日常教学中,可以适当开发一些类型化的评分标准(也叫评价量表、评分规则等)。譬如口语交际的评价量表、各种类型写作的评价量表、整本书阅读过程中的任务评价量表等。这些评分标准,通常采用分项评分标准(也叫分析式评分量表),即以表格形式分项分等级描述可能的表现。师生运用时,可以较为具体地诊断特定方面当前的表现水平状态,并且能够通过评分标准中更高层级的质量描述语,明晰下一阶段的努力方向。

类型化评分标准的开发需要一定的研究积累和时间投入,但从长远来看有诸多好处:能减轻教师写评语的工作量;能增强反馈的系统性和针对性,目前“因语言笼统而指导性弱是通病”;在研发这些评分标准的过程中,教师的评价素养和学科知识素养等都能获得一定的提升;运用甚至让学生参与评分标准的设定,“有利于培养学生的元认知意识,最终提高教育者需要关注的高层次思维技能”。“让学生开始参与评估工具开发的有效方法是向他们提供两个例子,好的和不好的,要求他们讨论两者差异。

三、语文教育评价系统调整的品质追求

综上,本文在兼顾核心素养培育需求和反思语文教育评价既有问题的基础上,尝试勾勒了核心素养语境下语文教育评价可能的系统调整框架和思路。

最后,必须强调:核心素养的培育不是一蹴而就的,指向核心素养培育的教学和评价改革也不是一蹴而就的,愈是如此,愈要有一定的全局观,整体考虑改革路径。同时,语文教育评价之“系统调整”应具备如下三个品质。其一,完整性,即评价什么——评价领域的选择,如何评价——评价类型的选择和规划以及评价任务的设计,如何反馈——评价标准的开发和运用,这几个层面和环节同等重要,每一个环节和层面都需要着力研究。其二,丰富性,即评价什么、如何评价和如何反馈,每个环节或层面内部应该保持足够的丰富性。评价领域应该涉及语文学习内部的各个领域;评价的类型应该兼顾过程性评价和终结性评价,标准化测试和表现性评价;反馈环节应该关注学生知识、技能、情感等方面的具体表现。其三,一致性,即评价什么、如何评价、如何反馈,这几个环节、层面必须保持内在一致性,引发、聚焦学生指向核心素养的具体表现。

只有保障语文教育评价改革的完整性、内部一致性和语文评价体系的丰富性,让语文评价各个层面、环节一起作出相应调整,彼此呼应、形成合力,才能让学生获得符合语文学科规律的学习经历和符合未来发展需要的语文学习结果,核心素养才能在语文课程体系中真正落地。

疫情之下 | 《中国教育学刊》致广大读者的一封信


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多