分享

义务教育国家评测,欧洲朋友这么做

 天下知仓 2018-01-14
公众号:菲尔麦德  

国家评测作为辅助教育决策的重要工具,在欧洲历经几十年发展,已被越来越多国家采用。相较而言,我国在使用国家评测监控教育质量、帮助学生学习方面的实践才刚刚起步,了解并借鉴欧洲各国国家评测的制度设计、测评对象和内容选择、测试工具及其结果运用等方面的特点对我国来说是非常必要的。请看菲尔麦德教育科技中心整理的评介文章。

国家评测作为学生评估的一种形式,是由国家设置并集中管理的标准化学业成就测试,其环节包括统一设计测试、准备测试的内容和工具、管理测试过程、诊释测试结果并根据结果采取相应措施。国家评测一般由全国性的或中央的官方机构组织进行,基于全国样本,参与者在平等、相似的条件下参加测试。

国家评测是测量教育成就、辅助教育决策的一种重要工具。在欧洲,国家评测随着国家相关政策的演变而逐渐发展起来。早期欧洲国家评测发展缓慢,应用范围较小,主要目的在于建立一个标准化的评估方法,决定学生在一个教育阶段结束时是否获得毕业资格证书及分流情况。

20世纪90年代以后,由于教育分权化改革,欧洲各国的教育系统都呈现出地方分权和学校自治的趋势,各国需要建立标准化的评估制度来监控整个教育系统,国家测试开始快速发展起来。

21世纪初,由于国家测试在监督和改善教育质量、提高教育系统的效率和有效性上能够发挥很大作用,因此,越发受到欧洲大多数国家的重视。一些国家专门制定了教育质量标准,国家测试则基于这些标准衡量教育质量。与此同时,国家测试也开始关注如何帮助学生更好地学习,使学生能通过国家测试了解自身的需求,从而配合相应的教学工作。

上述发展显示了欧洲国家评测的趋势,即将教育系统的外部标准化评价与内部评价、自我评价结合起来,目的是将传统的自上而下的监测模式与学校级别的从下而上的学生评估方式结合在一起,使教育质量得到更有效的控制和提升。

1
欧洲各国国家评测的制度设计
- 菲尔麦德 -

(一)评测的目标

在欧洲,国家评测从最初用于决定学生毕业和分流,到近十年用于监控整个教育系统,促进改善教育质量,其目标不断扩展。结合国家评测在学生、学校及整个教育系统层面上的应用,评测的目标可以分为如下三类:

1.决定学生的求学生涯

这类国家测试一般在特定教育阶段结束时进行,测试结果作为决定是否给学生颁发证书、学生是否可以升学、评定学生等级的依据,是一种总结性评价。半数欧洲国家有至少一种国家测试的主要目的是证书的颁发,例如,比利时(法语区)和波兰在小学教育结束时会举行以颁发毕业证书为目的的国家测试。另外,卢森堡、马耳他、荷兰等国也有以选拔或分流学生为目的的国家测试,例如,荷兰小学教育结束后的CITO测试,为学生选择中学提供了重要信息。

2.明确学生的学习需求和相应的教学策略

这类国家测试的主要目的是通过测试明确个体学生的学习需要,根据测试结果确定个性化的教学和辅导方式来帮助学生更好地学习,是一种形成性评价。尽管这类测试的应用范围远不如第一类测试,但这种标准化测试非常有利于提高学生的学习效果和学业成就。欧洲有12个国家或地区组织这种形成性评估为目的的国家测试,包括法国、比利时(法语区)、瑞典、英国(英格兰和苏格兰)、丹麦、爱尔兰、塞浦路斯、卢森堡、匈牙利、冰岛、挪威等国。

3.监测、评估学校和教育系统

这类国家测试通过标准化评估,监测和评估学校与整个教育系统。欧洲一半以上的国家实行这类测试,例如,英国(英格兰)、奥地利、拉脱维亚、匈牙利等国。这类测试的目的在于评价学校表现及其教育效率,包括进行教学质量评估,比较各个学校的工作绩效,检验学校的教育政策或教育实践效力,有时也用于教师工作绩效的评估。而在另一些国家,例如,法国、芬兰、英国(苏格兰)、比利时(弗拉芒语区)、爱沙尼亚、爱尔兰、西班牙、立陶宛、罗马尼亚等国,这类国家测试更为关注监测整个教育系统,评估特定教育阶段的教育政策效力。以监测学校为目的的国家测试一般要求所有学生都必须参加,而关注整个系统的测试只需要一个具有代表性的样本即可。

一般情况下,不同的国家评测具有不同的目标,有时同一项国家测试包含上述三类目标中的几种。例如,在意大利、爱沙尼亚、爱尔兰、拉脱维亚、波兰、葡萄牙,以颁发资格证书为目的的国家测试也被用于监测教育系统;在比利时(法语区)、奥地利、斯洛文尼亚,以判断个体的学习需求为目的的国家测试也被用于监测教学成果。

(二)评测的管理机构

欧洲各国国家测试的管理机构主要有三种类型:

  • 一是教育部内部的一个单位或机构

  • 二是由教育部设立但独立于教育部的公共机构

  • 三是受政府委托的大学或研究机构

第一,教育部的相关职能部门。在欧洲有10个国家的国家测试由教育部内部的某个单位或机构直接负责管理,如丹麦、卢森堡、马耳他、葡萄牙等。一般来说,学校老师、专家或大学的教职人员也会参与其中,但在丹麦和马耳他,某些与学生利益直接相关的测试则由教育部单独组织和管理。

第二,独立于教育行政部门的专职机构。在欧洲最为常见的是由独立于教育部之外的专门机构来负责国家测试,例如,意大利的国家教育系统评价研究所、芬兰的国家教育委员会等。一般这些机构管理的国家测试主要用于评估教育系统,有时也会负责某些学生资格证书的颁发。

第三,受政府委托的大学或研究机构。还有一些国家测试由教育部门委托给其他类型的机构负责,但受委托机构仍受教育部门的监管,例如,比利时(弗拉芒语区)、瑞典和挪威(证书资格测试除外)等国的国家测试由大学管理;马耳他的中学资格证书测试由以马耳他大学为基础的测试委员会负责;荷兰的国家测试中央管理委员会虽由教育部创立,但之后进行了私有化,受政府委托实施国家测试,相关的经费由政府提供。

2
各国国家评测的对象和内容选择
- 菲尔麦德 -

(一)评测的对象

由于欧洲各国义务教育阶段的结构和年限不尽相同,加上教育政策的关注点也有差异,各国实施国家测试时有的连续测试多个年级,而有的只在关键年级进行测试。

在丹麦、马耳他、英国(苏格兰),义务教育阶段的每一年都进行国家测试,而英国(英格兰)和法国的国家测试涉及的年级也相当广泛,包括六、七个年级。高频率的测试能够获得学生的最新学习情况,但也因此减少了有效教学时间,给日常教学造成压力,增加了学生和教师的负担。因此,越来越多的国家开始采用测试关键年级的模式。

“关键年级”多指小学或初中阶段的最后一年或倒数第二年,也就是某个特定教育阶段将近结束时。此时施测可以判断学生完成该阶段教育时的学业成就。也有一些“关键年级”测试是在人学的第一年或入学前实施,这时施测一般是为了确定学生学习需求或诊断学生的学习能力是否存在缺陷。至今测试关键年级已成为欧洲各国国家测试的主导模式,大部分欧洲国家在整个义务教育阶段,只在2一3个年级中进行国家测试。

(二)评测的内容

国家测试一般以总课程为基础,与各科的国家教学标准紧密联系,以便了解学生是否达到国家课程目标,评估和监测规定课程的实施情况。但国家测试基于课程这一事实并不意味着测试仅限于考察学生对各学科知识的掌握情况。从21世纪开始,欧洲各国的课程由强调学科知识的掌握转向强调相应的能力培养,国家测试也开始强调评估学生与各学科相对应的能力,甚至超出单一学科范围的一般能力。因此,国家测试有对应特定学科和不完全基于学科两种情况,对应特定学科的国家测试又可以分为仅测试核心学科和测试大部分学科或所有学科两种,而不完全基于学科的国家测试则是考察交叉学科或基于多种学科的一般能力。

1.仅测试核心学科

一些欧洲国家的国家测试仅限定在2到3门核心学科,一般是语言应用和数学,有时外语和科学也包含在内。例如,斯洛伐克的“全国九年级学生毕业测试”仅包括语言应用和数学,而德国的“中学修业证明”考试、奥地利的“教育标准测试”、斯洛文尼亚的“国家评估(6年级)”、冰岛的“全国协调考试”,除了这两门学科之外还测试外语。

2.测试大部分学科

还有一些国家测试涉及学生学习的大部分学科,少数在义务教育结束时实施的国家测试甚至会将所有学科作为测试内容。这种情况下,多数国家组织测试时会考虑,在涵盖更多学科的前提下不过分增加师生的负担,因此,通常有三种组织测试学科的策略:

  • 一是不同年份轮流测不同的科目,这种策略在以监测为目的的国家测试中最经常使用。例如,法国小学和中学结束时的国家测试,以五年一个循环的方式轮流测试除艺术和体育以外所有的学科。比利时(法语区)在“学生成绩的外部评价”测试中以三年一个循环的方式轮流测试各个学科。

  • 二是采取固定科目和轮换科目相结合的方式。例如,爱沙尼亚的六年级标准化样本测试除了固定的爱沙尼亚语、俄语、数学之外,还有一门学科由教育与研究部在每次测试前一个月公布。

  • 三是采取必考科目和可选科目相结合的方式,例如,荷兰的CITO考试由三门必修学科和一门选修学科组成。

3.测试交叉学科或基于多种学科的一般能力

不仅欧洲各国的课程开始重视能力,在整个欧洲层面上也开始强调学生应该掌握一些在社会生存中必不可少的知识技能,2006年12月《欧洲议会和理事会提案》中界定了八种终生学习的核心技能,但目前多数国家测试只能评估这八种技能中可以直接与学科相对应的三种,即用母语和非母语交流的能力、数学能力、科学和技术的基本能力。在这样的背景下,不完全基于学科的国家测试也开始发展起来,出现了一些考察交叉学科能力或基于多种学科的一般能力的测试。例如,芬兰的“学习成果国家评估”,考察基础教育中的交叉学科内容,包括人的成长、文化认同和国际精神、媒体和通讯技能、公民参与意识和企业家精神、对环境的责任感、可持续发展、安全和交通等。

3
各国国家评测工具的特征
- 菲尔麦德 -

在欧洲,各国的国家评测以纸笔测试最常见,但也有少数口头测试甚至实践任务。评测的工具一般有试卷和背景问卷,其中试卷是所有国家评测必备的工具,用于获取学生相关学业能力的信息。随着测量方法和信息通讯技术的不断发展,各国国家评测的工具也越发表现出新的特征。

第一,设计不同的试卷编排方式。

国家测试中学生回答的试卷有不同的编排方式:所有学生回答相同的问题,不同的学生回答不同的问题。前一种测试试卷的设计和施测都非常简单,大多数国家测试都采用这种方式,后一种设计也开始被越来越多的国家采用,具体又有三种不同的方式:一是在相同难度水平上设计几套平行试卷,这种设计主要是为了防止不同地区不同学校施测时间不同的情况下测试内容泄露问题;二是矩阵抽样设计,这种设计是为了在不增加学生负担的前提下,保证知识和技能的覆盖范围,学生样本符合统计学要求;三是根据个体能力水平或需求选择相应的试题,主要是考虑学生个人学习情况不同及个人需求的差异,例如,英国(英格兰)学生在14岁时参加的“国家总课程评估”则提供了四种不同等级的数学测试,由教师根据学生能力水平进行选择,而丹麦国家测试中使用计算机自适应测试,每个学生回答由计算机程序选择的适应自身能力水平的试题。

第二,利用背景问卷收集信息。

背景问卷并不是所有国家测试都会使用到,英国(苏格兰)、法国、芬兰、比利时(法语和弗拉芒语区)、爱尔兰、西班牙等13个国家或地区以监测为目的的测试中使用了背景问卷。背景问卷一般包括校长(或学校行政人员)问卷、教师问卷、家长问卷、学生问卷。背景问卷收集的信息包括接受测试学生的社会经济背景、学习动机、经济来源,所在学校的风气,教师的教学经历、专业发展、教学方法等。这些信息可以用于分析影响学生成绩的学校、教师和家庭因素。

第三,发挥信息通讯技术在评测中的作用。

目前欧洲国家测试中信息通讯技术的应用越来越多,利用电脑、专门的软件或互联网等技术,实现计算机测试、自动评分等模式。一种是以荷兰和挪威等国家为代表,采用传统的上机测试模式,测试中试题材料的呈现方式更为多样化,同时还可以直接借助软件进行评分,大大节省评分和录人成绩的时间;另一种则是丹麦国家测试中使用的更为先进的计算机自适应测试,这种测试利用计算机软件,根据学生的作答情况即时估计学生的能力水平,从而为每个参与测试的学生选择最适合的试题,真正实现个性化测试。但第二种测试对技术的要求很高,不仅硬件上要求计算机有足够的系统容量和稳定性,在试题设计上也必须要具备一定数量和质量的题库,因此目前在欧洲国家测试中这种技术的应用还是极少数。

4
各国国家评测的结果运用
- 菲尔麦德 -

国家评测的结果主要运用在学生层面、学校层面、地方和国家教育系统三个层面,结果的运用不仅与学生、学校的发展有密切关系,也对地方和国家教育政策的调整产生不同层度的影响。

(一)学生层面

第一,决定学生的学习生涯。

在欧洲有16个国家或地区的国家测试与学生的利益密切相关,根据学生在国家测试中的成绩是否达到一定标准,并结合学生在学年内的表现或者期末测试成绩,将做出三种与后续学习生涯相关的决定:

  • 一是是否授予小学或者初中教育结业证书

  • 二是决定学生在什么类型的学校继续接受教育

  • 三是进行能力分组,决定学生后续学习的课程或所在班级

尽管还参考学生的其它表现,但国家测试的成绩仍是决定学生学习生涯的最主要依据。例如,比利时(法语区)的小学毕业国家测试是学生能否从小学毕业并升人初中的最重要依据;波兰初中教育结束时,学生进人更高阶段学业所依据的成绩中的50%是国家测试成绩,如果成绩不好则可能转人短期的职业教育;罗马尼亚学生在初中教育阶段最后两年的四门科目上获得的平均分将作为学生继续接受高中教育或者转人职业学校的一个决定性因素。另外,只有马耳他的国家测试作为学生能力分组的依据,马耳他的学生从小学五年级开始就必须参加多个测试,测试的结果将作为学生是否能继续下一门课学习的条件之一,并且规定学校必须使用这个测试结果将五年级与六年级的学生按能力分组。

第二,确定学生的学习需要。

有约三分之一的欧洲国家使用国家测试来确定学生个体的学习需要。此时,国家测试的结果中不仅需要报告分数,还需要提供关于学生学业能力的较全面、细致的诊断信息。教师会根据学生的测试结果制定教学目标,采取适当的教学策略。而学生可以根据国家测试结果调整他们的学习方法,与父母进行交流。例如,在法国,“诊断性评估”测试的结果能帮助教师发现一些需要进行补救教学的学生,并据此对他们的学业进行个别辅导;在塞浦路斯,小学结束时的国家测试会确定学生是否存在阅读和数学上的功能性文盲,如果学生被鉴定为有这种缺陷,那么在初中教育阶段学生就会接受额外的辅导以及专门设计的教学项目。

(二)学校层面

欧洲三分之二的国家的国家评测会提供学校层面的测试结果。学校层面的结果运用有两种较为普遍的做法:其一是给各个学校提供国家评测的全国标准,各个学校通过比较国家标准和自己学校的表现发现差距,寻求改进;其二是为学校提供关于国家评测结果的综合信息,让学校了解本校在整个国家水平中的相对位置。而各个学校的结果除了分别报告给学校之外,多数欧洲国家一般不会公开学校结果,以免学校因为国家测试的压力影响了正常教学时间安排。

国家测试结果一方面用于帮助学校了解本校的教育质量并采取措施加以改善。例如,英国(英格兰和苏格兰)、比利时(法语区)、爱沙尼亚、匈牙利、斯洛文尼亚、冰岛等8国规定了在校内评估中使用国家测试结果的规范和建议;匈牙利自2008年起要求在国家测试中取得低成就的学校必须找到原因并且实施相应的补救计划。在学校改进的同时,政府方面会提供一定的帮助,例如,英国(英格兰和苏格兰)的国家政府以及地方当局会给学校提供国家测试成绩评估的指标体系,比利时(法语区)的教育监察员与教育顾问会协助学校展开必要的内部分析工作。

另一方面,国家测试的结果也影响对校长或学校的评估和审核。例如,在瑞典、英国(英格兰和苏格兰)、马耳他、荷兰、葡萄牙、罗马尼亚等8个国家,在针对校长或学校的外部评价中会考虑学生在国家级测试中取得的成就;匈牙利的学校督察官会将学校在国家基本能力评估测试中的结果纳人到学校的评估报告中;葡萄牙小学阶段的标准化测试中取得较差成绩的学校被要求提交一份改进规划,并且详细制定出时间进程。

(三)地方和国家教育系统层面

在欧洲的许多国家,特别是在北欧国家,地方当局在教育领域拥有很大权力和职责。丹麦公布义务教育结束时所进行的毕业测试的地区性结果,其它一些国家和地区,不会统一报告地区层面的测试结果,但地区可以根据学校层面或学生层面的结果自主进行地区结果的统计。在约一半的欧洲国家中,地方当局都能够直接或间接地获得它们当地在国家测试中的系统性结果汇总,并根据结果调整当地的教育政策。例如,在意大利测试结果被用于确定地方的教师与校长继续培训的内容。

在欧洲几乎所有国家,中央政府或国家最高教育管理机构都会对国家测试的结果在整个教育系统层面上进行统计,并且作为国家系统报告的一部分发表。全国的测试结果报告常常会比较测试结果随时间变化的趋势,分析可能影响学生成绩水平的背景因素,例如,人口特征、学校的基础设施、教师资源等。

这些报告的作用主要有两方面:一是用于支持国家或者最高层的责任机构做决策;二是让家长与公众更好地了解国家教育系统,让各方人士关注学生以及学校成就水平。其中,最主要的是第一个作用,不少国家测试的结果引发了国家教育政策在某些方面的改进。例如,芬兰根据测试结果改变了特定科目的时间配置;比利时、爱沙尼亚、拉脱维亚、立陶宛、罗马尼亚根据国家测试的结果调整了国家课程中某些学科的内容;葡萄牙为了提高国家整体成绩水平而发起了数学行动计划和葡萄牙语计划;西班牙部分国家测试结果被纳人到教育法规中,以对抗学业失败并减少辍学率;挪威的一份教育质量白皮书提出应该将国家测试的结果作为一个根本依据,为取得较差结果的学校提供支持。

5
对我国开展国家评测的启示
- 菲尔麦德 -

在欧洲,国家层面的学生评测有几十年的发展历史,目前已被大多数国家采用。在开展国家评测的过程中,各个国家的设计者和使用者都在不断地反思和改进国家评测的理念和方法。欧洲各个国家的这些探索和经验,可为我国正在起步的国家层面基础教育质量监测与评估工作提供借鉴。

(一)谨慎使用满足多重目的的国家测试

前文已经提到欧洲国家测试目的包括:传统的确定学生学业成就的目的、日益重要的监测整个学校或者教育系统的目的。尽管有时为了达到不同的目的而开发不同的测试,但更常见的情况是开发一个测试服务于多种不同的目的。例如,用于证明学生的学业成就测试结果,或者以发展评价为目的的测试可能也会被用在学校以及教育系统的监测;或者基于样本施测的测试结果,本来是用于监测整个教育系统的成绩,可能最后也会反馈给参与的学校,帮助它们改善其教学质量。

虽然使用一个测试来满足多种目的能够节约成本,但在满足每个目的所要求的信息不相同的情况下,这种做法是不合适的,其测验结果可能是不准确的。因此,在测试目的和测试设计、结果的运用上需要谨慎地匹配起来。

(二)平衡对测试数据的需要与过度测试的风险

政策制定者以及教育专业人员一直关注怎样才能既跟进学生学习的最新情况,同时又能防止测试对师生造成的潜在消极影响,特别是测试对有效教学时间及学习动机的影响。因此,一方面,要控制义务教育阶段学生参加国家测试的数量,另一方面,通常用于监测目的的测试,可以采用矩阵抽样设计,这样既能提供集体学业成就的有效监测数据,同时又不会增加学生与教师的负担。

(三)减少国家测试时教学的消极影响

由于国家测试通常对学生成就的评估只包含了课程的很小一部分,这样可能会导致教师使教学适应或局限于测试所涵盖的课程部分,或者当测试对学生有高利害关系时过分强调应试技能。因此,以监测为目的的国家测试可以考虑拓宽每年测试的学科,或连续几年为一个周期,轮流测试不同学科。另外,还可以减少仅仅考察单一学科知识的情况,采取“能力导向”的测试方法,测试某些跨学科的核心技能。

(四)在高利害情境下整合国家测试与其他评估手段

一些国家测试对学生有重大意义,因为这个结果将用于决定学生接下来的学习生涯。在这样的情况下,国家测试的结果可以与其他评估结合起来考虑,包括日常持续性的教师评估以及内部测试。这种方法让教师对学生的学习生涯决策有一定发言权。它还能集合多个评估工具的优势,弥补国家测试仅简单反映学生在特定时间内少数领域上的表现这一缺陷。

(五)充分使用测试结果改善并监控学校教育质量

除了国家测试结果在国家教育政策制定方面的应用外,还可以更多地应用在监控和改善学校的教育质量上。目前在我国,由于相应的国家测试尚不成熟,其结果还无法作为一个学校问责的依据,从而影响资源分配。使用国家测试监控学校教育质量、改进教学、帮助学生更好地学习,应该是未来我国国家测试发展的方向。

(六)在不同层面上采用不同的结果公布策略

从欧洲国家测试结果的公布策略来看,从中央政府到个体层面,结果的公开程度越来越低。国家层面的结果应该向公众公开,使公众了解本国教育系统的运行状况及学生的学业成就水平;而地方层面和学校层面的结果的公开就要考虑到利害关系,可以采取一定的策略,例如,分别向各个地方政府或各学校报告本地区或本校的结果,并提供一个标准作为参考;而学生个体层面的结果,以监测为目的的测试个体结果没有意义,而决定学生学习生涯的测试结果应该作为隐私加以保密,用于学生、教师促进学习和教学效果。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多