课程评价：类型和模式

天高海清 2016-01-14

展开全文

[摘要] 20世纪中叶以后，随着评价一跃成为引人注目的研究领域，课程专家相继开发出各种评价类型和模式，极大地丰富了评价的内涵。本文着重介绍了形成性评价与总结性评价、内部人员评价与外部人员评价、过程评价与结果评价、目标本位评价和目标游离评价，以及4种具有代表性的课程评价模式。

[关键词] 课程评价　课程评价模式　模式化研究

评价（evaluation）是人类常见的一种特殊的认识活动。可以说，每个人都经常地评价着社会的各种现象，评价着他人，也评价着自身。评价的目的在于通过分析发现存在的不足以及造成这种不足的原因，以便作出相应的改进，使人类活动日趋完善。课程评价是教育领域中教师、教育管理工作者或有关人员经常进行的一种特殊认识活动，其目的在于对课程作出各种决策，保证课程的有效性、合理性。

一、课程评价的类型

传统的课程评价类型比较单一，主要局限于对结果的评价，即往往以结果来判断课程的效果和价值。这种评价明显存在着缺陷。20世纪中叶以后，随着评价一跃成为引人注目的研究领域，课程专家相继开发出各种评价类型，极大地丰富了评价的内涵。

根据评价时间的不同，可把评价分为形成性评价与总结性评价；根据评价者身份的不同，可把评价分为内部人员评价与外部人员评价；根据评价者的注意力是集中在课程与教学实施的过程还是结果，可把评价分为过程评价与结果评价；根据评价与目标的关系，可把评价分为目标本位评价和目标游离评价。

（一）形成性评价与总结性评价

形成性评价（formative evaluation）是指为改进现行课程计划或为正在进行的课程与教学活动提供反馈信息而从事的评价，它是一种过程评价。一般而言，形成性评价不以区分评价对象的优良程度为目的，不重视对被评对象进行分等鉴定。总结性评价(summative evaluation)是在课程实施或进行以后关于其效果的评价，是一种事后评价。它与分等鉴定、作出关于学习者个体的决策等相联系。

形成性评价与总结性评价都是为了检验某个对象的价值。有时即便是同一个评价，在一个需求者看来是形成性的，而在另一个需求者看来则可能是总结性的。两者的区别在评价的目的、时机、评价听取人、使用评价结果的方法。形成性评价最主要的目的，在探明计划或活动的问题或失当之处，以便为修订或改进提供证据。着重于分析、比较、诊断、改进。总结性评价的直接目的是作出关于课程效果的判断，从而区别优劣和等级。形成性评价直接指向正在进行的活动，是在过程中进行的评价，一般不涉及活动的全部过程。总结性评价是在计划实施之后或课程与教学活动结束以后，通常是对全过程的考察。形成性评价是一种为内部人员采用的评价，而总结性评价是外部导向的评价，为的是满足某些外界听取人或决策者的需要，评价结果主要供外部人员使用。

与形成性评价、总结性评价相关的还有诊断性评价（diagnostic evaluation）。诊断性评价是在课程计划开始之前，对准备、需要、条件、不利因素的一种评价。诊断性评价的目的，不是给课程计划贴标签、下结论，证明其“行”与“不行”或“好”与“不好”，而是根据诊断结果设计一些“长善救失”的措施，最大限度地发挥课程计划的长处或优势，努力改善课程及其实施。

（二）内部人员评价与外部人员评价

这是依据评价者的身份所作的分类，这种分类的标准是看评价者是课程开发、设计的单位或个人，还是未参与其中的单位和个人。前者是内部人员评价（insider evaluation）,其主要目的在于改进课程开发、设计的过程，首要任务是弄清预先设定的目标是否已经实现。后者是外部人员评价（outsider evaluation）,外部人员评价主要有两种方式：通过测试等手段评价课程的产品、由外部人员对课程过程进行观察。形成性评价基本是一种内部人员评价，总结性评价则基本是一种外部人员评价。

内部人员评价可以有效地帮助课程开发、设计人员改进课程实施和教学活动，但如果处理不当，则容易出现盲目的情况。外部评价可能更容易满足教育消费者的需要，但它并不能总是满意地推动学校教育实践的改进，往往对教师造成压力和威胁，反而不利于课程的改进。所以，在实际的课程评价中需要把这两种评价类型有机地结合起来运用，它们是互为补充的。

（三）过程评价与结果评价

结果评价(outcome evaluation)是一种“底线式的或清算结帐式的评价”，[1]也是一种传统的、常用的评价形式。狭义的结果评价指学科目标实现结果的评价，着重考察各学科是否达成预定的学科目标。广义的结果评价指根据课程实施的结果来判断课程的价值和效果。结果评价中的结果通常都是以操作性的方式来界定的。从评价的目的看，结果评价主要在于了解课程计划对学生所产生的结果，但也可用于掌握受课程计划影响，教师和行政人员产生的结果。结果评价采用的基本方法是通过对前测与后测之间、实验组与控制组之间的差异来作出判断。不少人认为结果评价能提供确定课程对学生所产生的结果的可靠信息，因而在实践中乐此不疲。但也有人对此不以为然，认为结果评价只关注结果不关注过程，乃为暗箱式的评价(back-box evaluation)。

过程评价(process evaluation)是对课程计划实施过程的评价。打个比方说，如果想评价斧头这一工具，你可能会研究刀刃的设计、重量的分布、所用的合金钢、斧柄木头的质量、使用的方法、影响使用的情况等等，或只研究一位好斧匠用其砍物的数量与速度。那么，后一种方法属于结果评价，前一种方法就是过程评价。类推至课程评价，过程评价的旨趣在于课程计划所包括的特定内容、课程内容的正确性和组织方式、课程计划实施过程中的影响因素及其相互作用等等。

（四）目标本位评价和目标游离评价

目标本位评价(goal-based evaluation)是以目标为基础进行评价，旨在测定教育目标在课程与教学中究竟被实现了多少。教育目标是指学生行为的改变，因此，评价最终是考察这些行为改变究竟实际发生到什么程度。目标本位评价的典型代表是泰勒的评价模式和布卢姆的评价体系。目标本位的评价要点明确、重点突出、操作性强，为判明学生学业的进展提供了有用的帮助，实践中运用广泛，在课程评价中至今仍占有重要的地位。但目标本位评价过分强调目标，往往窄化评价的内容，忽略教室生活的丰富意义，压抑教学的自主性，是一种狭隘的评价观。

目标游离评价(goal-free evaluation)正是针对目标本位评价的缺陷而提出的一种评价类型，它要求脱离预定目标，重视课程与教学的所有结果，包括非预期结果。目标游离评价的倡导者提出，事先不应把课程的目的、目标告诉评价者，而应当让评价者全面地收集关于课程实际结果的各种信息，不管这些结果是预期的还是非预期的，积极的还是消极的，这样才能真正对课程作出正确的判断。他们认为目的本位评价容易受计划的目的的限制，因而也就太容易使计划受使用者和设计者的影响。而且正式规定的目的，往往内容狭窄，易于简单化、表面化。严格按目的行事往往会大大地限制评价的范围及其深远的意义。采用目标游离评价则评价重点由“计划想干什么”转变为“计划实际干了什么”，评价者就可以在没有偏见的情况下自由地肯定其优点。

但也有学者对目标游离评价提出批评，指责它简单地以评价者的目的替代计划管理者的目的，另外评价者毕竟还应有判断赞成或不赞成的准则。还有学者觉得，在理论上目标游离评价似乎是可行的，但却不切实际。即使评价对象很明确，要了解评价的情境依然需要花费大量的时间。缺乏对目的的预知，目标游离评价者要么会陷入盲目，要么会形成一家之见。盲目和一家之见显然比预定目标更主观。[2]所以，虽然目标游离评价对许多评价者的工作都产生了影响，但由于涉及管理人员地位、评价者职责等方面的重要变化，以及理论自身的不完善，使之未能在实际评价中得到广泛的应用。

二、课程评价的模式

（一）课程评价的模式化研究

在科学研究中，模式被看成是对某一过程或某一系统的简化与微缩式表征，目的在于使人们能够形象地把握那些难以直接观察或过于抽象复杂的事物或对象。评价模式是在一定理论指导下对评价者干些什么的描述，或是对他们应该做些什么的规定。通常，评价者关心的是确定事物或事态的价值或现状。评价模式有两表达方式。一为指令性的，这是最常见的。它有相对固定的评价程序，对评价的基本范围、内容、过程和程序有明确的规定或指令；一为描述性的，包括一些说明或概括性论述，是对评价活动的描述、预测和解释。

课程评价模式是评价者依据一定的教育理念、课程思想建立的系统化、整体化课程评价体系，它对课程的评价活动作了基本的规定或概括性的说明。推动课程评价的模式化研究，根本动力源于20世纪60年代以后课程评价领域自身的发展、繁荣，层出不穷的课程评价思想、方法上的联系和理论上的辩护，试图以一种系统化、整体化的方式研究、界说课程评价问题。人们选取不同的研究视角，提出了具有不同课程理念和价值取向的课程评价模式。

下面，我们将重点介绍一些具有典型性的课程评价模式。不过，需要说明的是，对某个或某些学者提出的课程评价模式是单指他或他们某一篇或某几篇论文的观点呢，还是更为广泛地指他或他们在各个时期的研究成果整体，学术界一向有争论，因为许多模式建立者的观点会随时间的推移而发生变化。本文是把模式看成是由某一特定的模式建立者在特定时期提出的协调一致的观点。此外，虽然有些课程评价模式表现出一种广泛的包容性，声称自己确定的是各个派别或各个方面都认为是良好的、合适的。但这样的模式恐怕很少。每一种模式都可能存在相对的价值性质、适用范围，也都可能存在缺乏支持的局限性和理解上的不确定性。一个模式的建立者当然希望开发一套完整而实用的评价体系，但研究表明学者们对评价关键问题和评价活动而规定、说明的看法是随时间动态地变化的。所以，课程评价的模式化研究是课程改革和课程评价发展过程的一部分，这种发展将会更多地满足对评价的迫切需要，而不是去寻求一个绝对的、最终的评价体系。

（二）课程评价模式的取向

课程评价是一项复杂的工作，涉及价值判断的过程和结果，并且受到不同价值取向的影响。也就是说不论评价者对评价对象作出何种决定，他们在评价时必然会反映出某种基本的取向。比较典型的取向有：技术取向、实用取向和批判取向。[3]

技术取向的课程评价模式侧重于控制，把课程当作一种“产品”，可以根据一些预先确定的准则或其他标准加以评价。技术取向的课程评价模式有3个基本要求：第一，对课程目标形成一致的看法；第二，明确、详尽地说明课程结果；第三，广泛选择收集资料的方法，借此确定课程目标的达成度。技术取向课程评价模式的支持者认为，评价者能够收集到可靠的资料，并使教育工作者对课程计划、课程实施活动的效能作出良好的判断。有很多种课程评价模式可以归入技术取向之列，泰勒的目标达成模式是最为典型的，其他的还有普罗沃斯的差别模式、斯太克的外貌模式、斯塔夫尔比姆的CIPP模式等。

实用取向的课程评价模式侧重于“自然性”与“适应性”，“自然性”即以课程活动而不是课程目的为主，“适应性”即不受预先计划和设计的限制。实用取向的课程评价把课程当作一种“过程”和“实践”，评价的意义在于判断这种过程和实践如何使所有参与者达到臻善的程度。评价主要不是依靠外部人员的判断，而是有赖于参与者及其“个人”知识。实用取向的课程评价模式也有3点基本要求：第一，描述特定情境下的创新活动；第二，记录一系列现象、判断和反应；第三，对评价结果的报告采取一种适合评价委托人的方式进行。可归入实用取向的课程评价模式有：阐明性模式、应答模式、鉴赏模式。

批判取向的课程评价模式侧重于“解放”（emancipation）,即从针对实践工作者工作进行的外来评价中解放出来。评价不只是一项技术活动，也是一项政治批判活动。课程评价不是课程建构过程中的独立部分，参与者应有绝对的控制和发言权。批判模式是典型的批判取向的课程评价模式。

（三）有代表性的课程评价模式

1．目标达成模式

目标达成模式（goal-attainment model）的评价，旨在确定课程方案达成目标的程度，由美国课程评价专家泰勒（R.W.Tyler）倡导，他在20世纪30年代所进行的“ 八年研究”，便运用了这一模式。泰勒认为，教育的目的在于改变学生的行为，评价就是要衡量学生行为实际发生变化的程度，通过预先规定行为目标设计课程、评价课程。

目标达成模式的评价程序包括如下步骤：⑴拟定一般目标或具体目标；⑵将目标加以分类；⑶用行为术语界定目标；⑷确定应用目标的情境；⑸发展或选择测量目标的技术；⑹收集学生的行为表现资料；⑺将收集到的资料与行为目标比较。

目标达成模式是一种较客观并有一定效率的评价模式，是评价领域技术上的一次进步。后来课程评价模式的发展都与这一传统性模式有关。该模式也极大地影响了许多教育学者的评价研究。哈蒙德(R.L.Hammond)、梅特费塞尔( N.S.Metfessel)、迈克尔(W.B.Michael)等评价专家都接受了泰勒模式的基本精神，就连美国著名的评价学者克龙巴赫（J、Cronbach）也深受泰勒目标达成模式的影响。布鲁姆（B.S. Bloom）的教育目标分类学说显然也以泰勒的评价要点为基础。

目标达成模式的优点，在于把评价与测验作了区分，提出课程评价的目的不仅仅是评价学生的优劣，还在于改进课程开发，这一观点揭示了评价的本质。这一模式结构紧凑、操作性强，也是它在课程评价理论中占有重要地位的重要方面。不过，该模式亦有一定的局限性，由于受到预定目标的束缚，忽略了未预期的目标，更忽略了丰富的互动的课程教学历程。

2．外貌模式

外貌模式(countenance model)由美国教育评价专家斯太克（R.E.Stake）于1967年提出。他是在批评泰勒目标达成模式基础上提出外貌评价模式的。他认为已有的课程评价不注意前提条件和相互作用，不注意多种可能的结果，只重视传统的测验，强调个别学生分数的信度和预测效度，忽视先在因素、过程因素和结果因素三者的关系。斯太克建立在对目标达成模式批判基础上形成的外貌模式，也为后来的回应模式开辟了道路。

斯太克提出，课程评价既需要描述，也需要评判。描述包括两类材料：打算做的(intents)和观察到的(observation)。评判包括两个方面：根据计划实现的内容所作的判断和根据实际观察到的情况所作的判断。但不论是描述还是评判，其材料都是建立在3个来源上：⑴前提条件(antecedents)，指教学之前业已存在的可能与结果有关的条件。如学生的兴趣、经验、教师的意愿、课程内容的特点、社会的背景；⑵相互作用(transactions),即教学的过程因素，如师生关系、师生的交往、作用的氛围；⑶结果(outcomes)，就是课程计划实施后的效果，如学生的成绩、态度、动作技能、对教师和学校的影响。

斯太克主张课程评价人员，一方面要收集描述计划实施前提条件的资料，另一方面要收集实际发生现象的“观察”资料，比较、确立两者间的一致性。评价者还要从“打算做的”和“实际观察到的”两个维度，分析各个维度中“前提条件、”“相互作用”、“结果”3者之间逻辑上的可能性和经验上的可能性。

外貌模式是一种对课程进行比较全面评价的模式，它不仅关注课程产生的结果，而且还重点分析产生特定结果的各种条件和所运用的方法。因此，运用这种评价模式可以对课程的全貌进行评价，这比前述的目标达成模式更为周到。但在观察、描述和判断中容易带有主观性，从而影响评价结果的可靠和可信。再者，这种评价所了解和处理的内容繁多，要在实践中应用，未必那么容易。

3．背景—输入—过程—成果模式

背景—输入—过程—成果模式（context-input-process-product）又称CIPP模式，是美国教育评价学家斯塔夫尔比姆(D.L. Stufflebeam)倡导的课程评价模式。该模式于20世纪60年代后期发展起来。当时，以目标、测验和实验设计为定向的评价广为流行，CIPP模式是针对这些评价的缺陷而提出的一种改进方法。斯塔夫尔比姆认为，课程评价不应局限在评定目标达到的程度，课程评价是一种过程，旨在描述、取得及提供有用资料，为判断各种课程计划、课程方案服务。其中，“描述”在于指明作决定所须的各种资料，“取得”即通过收集、组织、分析等过程，得到所须资料，“提供”是依据评价目的，向决策者报告取得的资料，“判断”就是作决定的行动。可见，评价是为了作决定，作决定则意味着进行选择，从而改变行动，促成改革。通过课程评价为决策者提供资料，最终目的在于改革课程。

促进课程改革的决策有4种类型：⑴ 确定目标的决策（计划），⑵设计程序的决策（组织），⑶使用、追踪、改进程序的决策（实施），⑷判断结果并予以反馈的决策（循环）。和上述决策类型相对应，形成背景、输入、过程、结果4种评价。

第一，背景评价。即要确定课程计划实施机构的背景；明确评价对象及其需要；明确满足需要的机会；诊断需要的基本问题；确定一般和具体的目标，并判断目标是否已反映了需要。

背景评价采用的主要方法是系统分析、调查、文献评论、倾听意见、会谈和诊断性测验。

第二，输入评价。旨在确定如何运用资源以达成目标。这里的资源包括材料、设备、程序、方法、人员、环境等。这一步骤要回答，已经确定的目标可行吗？哪些计划可能达成这些目标？每种计划的成本效益如何？每种计划逻辑性、实用性如何？教师有效使用计划，需要多久的训练？如何执行这些计划？有哪些程序？如何妥善安排人员和设备？

输入评价采取的方法是文献调研、访问、试点试验等。

第三，过程评价。主要是通过描述实际过程来确定或预测课程计划本身或实施过程中存在的问题，为计划的设计和实施者提供定期的反馈。过程评价范围涉及实施步骤、教学法和学生的活动。这一步骤要回答诸如有关活动是否按预定计划得到实施，是否在用一种有效的方式利用现有的资源。

从方法层面看，评价者有许多选择，如“通过描述真实过程，持续地与工作人员相互了解，观察其活动，控制活动的潜在的障碍，保持对意外障碍的警惕，获得已确定的决策的特殊信息。”[4]

第四，成果评价。即测量、解释和评判课程结果，帮助课程决策者决定课程计划是否应该终止、修正或继续执行。这里特别重要的是应综合收集与结果有关的各种信息，并与来自背景、输入和过程方面的信息进行比较，以对课程计划的利弊作出妥当的解释，正确引导一系列的再循环决策。

CIPP模式是一个摆脱传统的局限于目标的评价模式，其重点不在引导一项个别研究的进行，而在为决策者提供信息，其目的不在证明而在改良，更好地反映了社会对评价提出的新的要求。但是这种模式实施过程比较复杂，所需要的投入相对也高，操作起来有一定的困难。

4．应答模式

应答模式（responsive model）由斯太克提出，古巴(E.G.Guba)、林肯（Y.S.Lincoln）等进一步发展而成。

应答模式的提出，标志着斯太克完全摆脱了他称之为“预定式评价”（preordinate evaluation）传统的评价模式。1973年，斯太克在提交给“评价的新趋势”讨论会的论文中写道：“我在此推荐应答评价(responsive evaluation)。该方法以牺牲某些测量上的准确性换取评价结果对方案有关人员说来更多的有用性。现有的评价方法多带有预定(preordinate) 性质，即强调目的的表述和客观的测验、由方案执行人员掌握的标准，以及研究性的报告的应用。而应答评价则较少依赖这些正规的信息交流方式，更多地依赖自然接触。”[5]

斯太克认为，课程评价有不同的方法，没有哪一种方法是唯一正确的。但要使评价产生效果，必不可少的一点是，评价应该向听取评价结果的人提供他们所关心的信息，要充分地了解他们所关心的问题。在斯太克看来，“教育评价如果具备3个特点，就是一种应答模式：⑴更关心方案的活动而不是方案的内容，⑵对听取人要求的信息作出反应，⑶根据不同的价值观，报告方案的成败。”[6]

古巴和林肯对应答模式作了进一步的说明，“就是以所有与方案有利害关系或切身利益的人所关心的问题为中心的一种评价。这些问题可以包括：是否应该削减方案预算？是否应实行责任制？教学目标是否达到？新教学计划比旧教学计划是否更为优越？等等。总之，它应该提供对于方案的担心、怀疑、赞成或反对的一切信息”。[7]

应答模式最主要的特点是把问题而不是目标和假设作为评价的先行组织者。问题是在广泛的交谈后形成的，即通过一段熟悉过程，通过与学生、家长、纳税人、方案发起人、方案执行人的交谈，评价者注意到某些现实的或潜在的问题，这些问题组成了继续与上述各方讨论和制定资料收集计划的结构。在此基础上，评价者再进行系统的观察、调查、访问、测验，或其他任何有助于理解并解决有关问题的评价活动。

应答模式有以下实施步骤：⑴评价者与一切跟评价对象有关的人员交谈，获取他们对评价对象的看法；⑵根据获取的信息，确定评价范围；⑶对方案的实施作实地观察；⑷对方案希望达到的目标与实际上取得的成果进行比较；⑸对评价应回答的问题进行理论上的修正；⑹评价者以此为基础设计评价方案；⑺选择收集信息的方法；⑻对收集来的资料进行加工处理；⑼将处理过的信息按需要回答的问题分类；⑽把分类评价结果写成报告；⑾根据评价报告对方案作出全面判断。

应答模式的最大优点，在于它不再单纯从理论出发，而是从关心评价结果的各听取人（audience）的需要出发，确认他们的关注焦点，重视他们的价值观，让他们涉入整个评价过程，甚至于报告形式也需符合他们的需要。事实上，不管什么样的评价，它的理论再高明，方法再先进，但若其结果不能为听众所接受，那么最终是难以产生任何效果的。此外，应答模式回答了所有其他模式希望回答的诸如目标的达成程度、决策、价值判断等问题，较好地适应了多元社会的现实和具有不同观点的评价听取人的需要。其结果也具有相当的弹性和应变性。因此，应答模式的评价受到了广泛的欢迎和好评，一些学者甚至认为该模式是迄今为止所有评价模式中最全面、最有效的。

在课程实践中，究竟应该采用哪一种具体的评价模式，人们的观点并不一致。我们认为每种模式都有其合理内核和不足，有的模式便于操作，但往往只注意近期的可观察到的效果。有的模式比较周全，但实施过程又过于复杂。十全十美的模式是没有的，而且在实践中有时很难说一种评价完全属于哪种模式，往往会涉及二三种不同的模式。所以，需要综合性地、多样化地和有针对性地选用合适的评价模式。

注释

[1] G.J. Posner, Analyzing the Curriculum, New York: McGraw -Hill, Inc,1992,p.235.

[2] See: W.H. Schubert, Curriculum: Perspective, Paradigm, and Possibility, New York: Macmillan Publishing Company,1986,p.272.

[3] 参阅：李子建、黄显华著：《课程：范式、取向和设计》，香港：中文大学出版社，1996年第二版，第383～403页。

[4][5] 瞿葆奎主编：《教育学文集：教育评价》，人民教育出版社，1989年版，第313、325页。

[6]　J.G.Saylor & Others, Curriculum Planning for Better Teaching and Learning ,4th ed., New York: Holt, Rinehart and Winston,1981,p.329.

[7] 钟启泉编著：《现代课程论》，上海教育出版社，1989年版，第355页。

(2004-05-09)