分享

基于课堂观察的 STEM 教学评价:协议、要素与方法

 新用户93938795 2023-08-11 发布于江西

图片

图片

作者

简介

图片

詹泽慧,博士,教授,博士生导师,青年珠江学者,华南师范大学教育信息技术学院,研究方向:STEAM 教育、学习分析、智慧教育、创新创业教育(zhanzehui@m.scnu.edu.cn);

吕思源,硕士研究生,华南师范大学教育信息技术学院,研究方向:STEAM 教育。

摘要:区别于传统讲授式课堂,STEM 课堂具有学科融合性、真实情境性、项目承载性,然而如何对其展开评价一直是个难题。作为循证评价的重要方式,课堂观察可为 STEM 教育质量评估提供可靠的教学实践证据与衡量标准。本文通过分析和比较国际典型的六套 STEM 课堂观察协议(RTOP、OTOP、UTOP、TDOP、COPUS、PORTAAL)发现:在构成要素上,各协议均体现了基于科学探究、先验知识、沟通合作、学科融合的教学方法,发展学生概念思维、批判思维、创新思维与元认知能力的认知目标,倡导自主、民主、互动的课堂文化氛围;在应用情境上,虽然所选协议能够从教学策略、课堂动态、师生互动等方面改善教学,但普遍存在观测学生学习行为不足、忽视技术作用、难以表征实践操作等问题。据此,本文基于探究共同体理论和 TPACK 框架将 STEM 课堂解构为教学存在、社会存在、技术存在三个维度,统摄 STEM 课堂观察的教师行为与学生行为,以学生为中心构建 STEM 课堂观察的 L-PST 双罗盘模型;基于评价设计、证据收集、评价实施三环节构建 STEM 课堂观察评价的三维矩阵,为教师和研究人员理解 STEM 课堂、选取适切的观察视角与评价工具、实施 STEM 课堂教学评价提供思路和借鉴。

关键词:STEM 教育;教学评价;课堂观察;教师专业发展

一、引言

STEM 教育作为跨学科学习的典型范式,是发展学生核心素养的有效手段(刘晟等,2016)。与传统分科教学相比 ,STEM 教育具有学科融合性(Bybee,2013)、真实情境性(English,2016)、项目承载性(Erdogan et al.,2016)等特征,聚焦实际问题,有机整合多学科的知识与技能形成综合性问题解决方案(余胜泉等,2015),将原本孤立、分散的抽象知识与学生的生活经验相联系(秦瑾若等,2017),将知识蕴含于情境化的真实问题中 (张屹等 ,2017),以学生为中心形成连贯有组织的课程结构,在协作探究与具身体验中促进学生主动学习。
然而,STEM 教学评价是学界公认的难题(宋乃庆等,2022;胡艺龄等,2022)。传统的纸笔测试不适用于素养导向的 STEM 教学,强调从证据中获取信息的循证教学评价成为国际 STEM 教育实践的基本遵循(Rosenberg et al.,2018;余胜泉等,2019),为我国 STEM 课堂教学改革提供了思路。课堂观察能够提供直接可靠的教学实践证据与衡量标准,在 STEM 教学评估中备受青睐(Ebert-May et al.,2011)。
目前代表性的课堂观察工具集中在智慧教育领域 ,包括基于信息技术的互动分析编码系统(ITLAS)、改进型弗兰德斯互动分析系统 iFIAS、基于教学活动的课堂教学行为系统(TBAS),但这类工具存在观察视角平面化和片面化的局限,难以反映学科特征、课型特点与教学风格(许娜等 ,2020),无法从整体上还原 STEM 课堂教学全过程。当前我国 STEM 教育评价以引介国际评估框架为主,存在两方面问题:1)理论研究缺乏对课堂观察工具的比较分析,给研究者们选择和借鉴带来困难;2)实践研究停留在本土化框架构建与自我验证阶段,使用范式仍需从国际大规模评估项目中吸收经验。鉴于此,本文以国际典型的 STEM 课堂观察协议为研究对象,对其构成要素与适用情境进行内容分析,总结已有工具的优势与不足,形成 STEM 课堂观察的基本思路,为我国 STEM 课堂教学评价的设计与实施提供参考。

二、研究方法

(一)选择依据

有效的 STEM 课堂观察协议应该体现教与学的理论特征,包括有效教学、课堂动态、教学方法、师生互动等细节(Ebert-May et al.,2011),进而评估具体教学措施实施的准确性与有效性;实践上需要提供可靠的数据与有意义的反馈,供教师理解并改善教学(Lund et al.,2015)。基于此,本文选择六套标准化课堂观察协议进行比较分析(见表 1) ,所选协议需满足三个条件:1)针对 STEM 课堂教学质量评估;2)具备详尽的协议研发文献;3)经过大规模实证数据验证。表 1 列举了协议的基本信息和选择依据。根据数据记录类型的不同,观察协议可分为整体性协议(RTOP、OTOP、UTOP)和分段式协议(TDOP、COPUS、PORTAAL)两类(AAAS,2012)。整体性协议针对课堂教学全过程开展整体性评价,分段式协议要求观察员分时段评估每个观察项目。

图片

(二)分析框架

为揭示协议的构成要素和实践特征,本文从协议构建的有效性、与 STEM 课堂教学的适切性、评价的适用性从三方面分析上述六套协议,分析框架见表 2:1)构建层。参照美国国家科学研究委员会(National Research Council,NRC)提出的评价三角模型,从认知、观察、解释三方面考察协议设计的可靠性(NRC,2001),包括评价目标、理论基础、观察视角、数据收集和分析方法。2)要素层。基于课堂观察的 LICC 范式(崔允漷,2012)和 STEM 课堂的技术特征,选取教师教学、学生学习、课堂文化、技术应用四个维度,对协议的观察项目进行内容分析,挖掘其特征要素。3)应用层。围绕观察主体、评价情境两个维度,明确评价过程关注谁以及何时评价。

图片

三、协议比较

(一)构建层:基于评价三角的协议可靠性分析

评价三角框架为验证工具的科学性和有效性提供了理论模型,即任何一种评估工具的设计都必须考虑三个基本维度(NRC,2001)(见表 3):1)认知。这是实施评价的理论基础,用于确定观察任务需要测量的目标;2)观察,包括与认知相匹配的观察任务描述,收集与认知理论有关的表现性证据;3)解释,指从表现性证据得出合理推论的分析工具和方法,以揭示观察结果如何构成评价结论。在非正式课堂评价中,解释一般由教师依据自身经验,以直观、定性的方式进行;在大规模评估项目中,解释是一种统计模型。在具体评价实践中,认知、观察和解释可以对应理解为评价目标、收集证据和解释证据(赵士果,2013)。

图片
图片

1. 认知维度

认知维度体现了协议构建的理论基础与评价目标。从教学理念看 ,三种整体性协议(RTOP、OTOP、UTOP)主张基于建构主义和合作探究的方法进行教学改革,创设以学生为中心、以活动为基础的新型课堂(MacIsaac et al.,2002)。其中,RTOP 旨在衡量教学改革的有效性,以探究为导向,考察教师探究式教学方法的运用及学生参与探究的过程;UTOP 服务于幼儿园至大学本科阶段的教师培训项目,特别是在 K-12 阶段得到广泛应用,以增值性评价作为选拔优秀教师的标准,重点评估教师课堂支持和促进学生学习机会的程度(Walkington et al.,2011);OTOP 用于确定本科课堂使用哪些基于改革的教学要素,并记录改革后的专业发展对学生行为和职前教师教学实践的影响(Wainwright et al.,2003)。然而,整体性协议难以表征课堂的动态变化,只能捕捉相对粗略的教学措施,无法描述具体的教学过程,且涉及大量的教学质量判断,对教师的评分结果可能因观察者的经验不同而产生差异(Hora,2015)。

三种分段式协议(TDOP、COPUS、PORTAAL)与主动学习导向的本科 STEM 教育改革有关,从教学行为角度揭示课堂的细粒度特征。其中,TDOP 以实践系统理论与分布式认知理论为基础,将观察重点从教师转移至对课堂的全面描述,通过划分课堂实践类别及对应的行为代码衡量教学特征,分析行为主体、技术工具与学习任务间的相互作用(Hora et al.,2013)。COPUS 将互动式教学的实施程度作为衡量主动学习的标准,用于了解师生如何使用课堂时间、确定教师的专业发展需求、验证教学实践调查中教师自我报告的准确性(Smith et al.,2013)。COPUS 采用 TDOP 类似的编码方式,只统计行为频次而无需评级,进而生成可视化的观察结果。PORTAAL 关注教师如何构建课堂经验,帮助教师理解和开展主动学习,基于教育研究的证据确定 21 个在课堂中易于实施且有助于提高学生成绩和逻辑发展能力的主动学习要素(Eddy et al.,2015)。

2. 观察维度

观察维度揭示了协议的观察视角和过程性证据的收集方式。在整体式协议中,RTOP 包含课程设计与实施、教学内容、课堂文化三份分量表共 25 个项目。它基于详细的课堂背景和活动记录,以五点李克特量表 0(没有发生)−4(非常符合)对观察项目评分 ,并注明评分依据供讨论分析。OTOP 归纳了十个改革导向的要素指标,为每个指标提供了描述性陈述和观察重点说明,从教师和学生的行为角度描述课堂现象(“概念的多重表述”除外,该项仅涉及教师行为)。该协议以李克特量表(N/O,1−4)形式表示不同要素出现的频率,其数值是分类型而非分值型数据,N/O 代表“未观察到”,4 代表“经常出现”,同时需要记录详细的课堂背景信息(课堂类型、课程主题、班级规模)、课堂观察笔记和教师访谈内容,用于解读 OTOP 结果。UTOP 包括课堂环境、课程结构、课堂实施和教学内容四个维度 26 个项目,与 RTOP 同为五点李克特量表(1−5)记分式工具。若课堂上某个观察项目未出现或无法判断,可以记录为 NA(不适用,Not Applicable)或者 NK(不确定,Not Known),同时教师还需对每个维度开展五点李克特量表式的整体性评价,与项目评分形成交叉验证。在分段式协议中,TDOP 涵盖六大实践维度共 40 种行为,包括三个基本维度(教学方法、师生对话、教学技术)和三个可选维度(教学策略、认知参与、学生参与度),以 2 分钟为观察间隔,标记单位时间内出现的所有行为代码 ;COPUS 将编码减少到 25 个 ,仅划分“学生行为”和“教师行为”两个必选维度,采用与 TDOP 相似的观察间隔与数据记录方式。PORTAAL 将主动学习的 21 个最佳实践要素归纳为练习、逻辑发展、责任制、减少焦虑四个维度,将课堂分为导入、学生参与、教学环节、汇报环节四个阶段,编制了包含 41 个项目的课堂观察量表,详细记录课堂活动发生的时间、频率和事件的存在与否,依据将观察结果转换为实践要素衡量标准的文档,得出 21 个要素的实施频率。

上述协议的观察维度主要涉及教学策略、教学内容、教学实施、教学评价、学习投入、认知发展、课堂互动、教学技术八项。首先,所有协议都关注教学实施、教学评价和课堂互动。教学实施检查教师在课堂实际使用的教学措施,如提问的策略、开展小组活动的方法、根据学情进行的教学进程调整、讲授学习内容的方式。教学评价考察教师开展学习评估的形式,包括随堂检测、教师提问与反馈、学生反思与自我评价、学生互评与解释答案等形成性评价手段。课堂互动是课堂文化的重要组成部分,旨在衡量不同教学主体间的对话与交互情况,如师生、生生互动的数量和类型。

其次,除 COPUS 外的协议都关注教学策略与认知发展。教学策略评价教师的教学方法选择和组织能力。例如,RTOP、OTOP、UTOP 观察教师是否考虑学生的原有认知结构设计课堂活动,帮助学生建立新旧知识的联结;能否以合作探究的方法创设以学生为中心的课堂结构,促进学生的沟通交流和思维发展。TDOP 将教学方法分为以教师为中心(如讲授、演示、展示问题解决过程等)和以学生为中心(如小组讨论、自主学习、学生展示等)两类。PORTAAL 通过观察教师提供练习的机会、发展学生高阶思维的方式、鼓励学生参与课堂活动的方法,评价教师采用的主动学习策略。COPUS 侧重于评估互动式教学的程度,重点考察课堂的师生行为,略去对具体行为背后隐含的教学策略的记录。尽管认知发展是一项需要高度推理的内敛指标,但上述协议仍在外部观察上做了努力。OTOP 以要素提炼的方式将部分观察项目对应到元认知、发散思维、概念思维等认知层面。基于布鲁姆认知领域的教学目标分类,TDOP 划分了解决问题、创新、联系现实等学生认知需求;PORTAAL 考察了课堂练习与考试难度在认知水平上的一致性,以及课堂中发展的高阶思维类型。RTOP 和 UTOP 虽未将认知发展的观察项目体系化,但把促进学生思维发展的要求融入教学策略与活动设计、教学内容选择、课堂互动实施等项目的评价。COPUS 删除了这一维度,因为研发团队发现难以保证精简协议的同时能可靠地评估学生的认知发展(Lemons et al.,2013)。

除 UTOP 外的五种协议均包含学习投入,评价学生课堂的参与程度。OTOP 描述了与教学改革要素对应的学生行为,评估学生是否积极参与有价值的学习活动,但这种评估方式对观察者要求很高,因为师生行为被包含在同一协议中,且需要将双方行为概念化在同一个精细的层次上测量,难以精准评定(Hora et al.,2013)。为此,TDOP 采用相对粗略的估算方式,通过统计观察员附近有多少学生在积极做笔记或专注于课堂,来反映群体的注意力水平和参与程度。这一方法也被COPUS 沿用。PORTAAL 以“责任感”和“减少焦虑”考察教师鼓励学生参与课堂活动的策略,关注教师促进学生参与上的努力,而非学生的实际参与行为。RTOP 以程序性知识评价学生参与探究性活动的情况,UTOP 聚焦教师行为,并未设立衡量学生参与度的详细项目。

再次,教学内容维度在 RTOP、OTOP、UTOP三种整体性协议中均有体现。一方面,教学内容本身具有很强的连续性,难以在分段式工具中被特定的行为编码概括;另一方面,STEM 课堂的教学内容有别于传统课堂,其认知发展性、概念抽象性、真实情境性都需要单独评价,例如是否选取了学科核心概念,采取了何种概念组织与表达的形式,是否有助于学生理解,能否与其他学科或现实世界相联系,以帮助学生进行知识迁移和创新应用。

最后,教学技术维度在 RTOP、UTOP、TDOP 三种协议中均有提及,其中 RTOP 与 UTOP 只是将技术的使用简化为对“教师是否使用了合适的教学资源”或者“学生能否使用多种方式和工具表达观点”的判断,并未讨论技术赋能 STEM 教学的具体过程;TDOP 重点考虑了课堂中信息技术的类型,将教学技术作为一项单独维度提出,通过分析其与教学方法、认知参与维度中行为的共现关系,评价技术的使用特征。

3. 解释维度

解释维度描述了证据分析和解读的过程。证据分析和解读需要考虑数据收集的可靠性和有效性,同时需要采用合适的统计学模型挖掘数据背后的教育学特征,将过程性数据意义化和可视化。上述协议的信效度检验与数据分析方法见表 4。

图片
图片

协议的可靠性主要通过考察评价者间的一致性来衡量,常用 kappa 系数检验定类数据的一致性。UTOP 使用加权 kappa 系数处理量表的等级式定类数据。TDOP 与 COPUS 使用简单 kappa 系数处理行为编码的绝对定类数据,COPUS 采用 Jaccard 系数验证单个行为编码间的一致性。ICC 组内相关系数适用于定量数据间的一致性验证,PORTAAL 借此处理不同评价者统计的课堂实践百分比数据。RTOP 采用回归分析对 16 组观察者的评估数据进行模型拟合,验证整体协议与各分量表的可靠性。同时,RTOP 和 UTOP 以 Cronbach's α 系数检验量表的内部一致性。OTOP 同为量表式工具,仅以观察者各指标评分相同或相差 1 分的百分比检验评价者间一致性,没有基于标准化的统计模型,也没有对量表进行信度分析,其可靠性还需检验。

协议的有效性分析包括内容效度、标准效度和结构效度。1)内容效度指观察项目与所测量概念或领域的吻合程度,主要取证于各类标准化文件(RTOP) 、 专 家 意 见 征 询 (OTOP、 UTOP、 TDOP、COPUS)或实证研究成果(PORTAAL)。2)标准效度指评估结果与外部标准的关联程度,通常用二者间的相关系数衡量。RTOP 考察了协议得分预测学生成绩提高的能力,得到相关系数为 0.88,表明具有较好的预测效度。UTOP 建立了协议总分与教师增值(与教师相关的学生成绩增益)的相关性,获得教师教学措施与上一年学生成绩增益之间相关性为 r=0.34;预测同一教师所教另一个班级的成绩的相关性为 r=0.26,均高于有效教学评估项目采用的其他工具(Kane et al.,2012)。这表明,UTOP 有助于识别对学生成绩提升有明显帮助的优秀教师。由于不能判断每个要素对学生学业成就的相对重要性,PORTAAL 的结果并非单一的分数,而是教师课堂使用每个要素的平均频率或时间。研发者使用结构方程模型路径分析方法检验 PORTAAL 实践要素与学生考试成绩间的相关性,发现小组活动、随机点名、解释备选答案、小组合作以及回答问题的总时长与考试成绩呈正相关;在考核高阶认知能力的试题中,学生解释答案、独立思考、教师积极反馈等要素也与其考试成绩正相关(Moon et al.,2021)。3)结构效度表示观察项目解释预期测量的某种结构或特质的程度,用于检验理论构建的合理性及其转换为测量项目的可操作性。RTOP 与 UTOP 运用探索性因子分析检验协议的结构效度 ,但均未开展验证性因子分析。TDOP 和 COPUS 旨在客观描述教学过程,并非为评估教学质量提供外部标准,其行为代码也不是为了测量某种潜在构念,因此其有效性检验没有考虑协议的标准效度和结构效度(Hora,2015)。

在数据分析上,RTOP 和 UTOP 是量表式计分工具,需要记录每个项目的分数与协议的整体得分,然后计算平均值、标准差。RTOP 基于大规模评估实践得出不同学段和学科的常模,为衡量教学改革程度提供基准;根据总分,划分出四种课堂类型:传统型教师中心式(0−30)、过渡型教师指导式(31−45)、过渡型局部改革式(46−60);改革型学生主体式(61−100)。UTOP 被证明具有良好的区分度。它借助 T 检验能够分析不同水平教师在具体观察项目上的表现差异。OTOP 的数值是分类型而非分值型数据,用于讨论改革型教学策略的使用频率,使用者需要结合详细的课堂背景信息(课堂类型、课程主题、班级规模)和教师访谈内容,综合描述不同类型课堂(如讲授、实验、演示等)的教学特征。TDOP 利用社会网络分析生成不同行为之间的共现网络图,挖掘教学方法、认知参与和教学技术间的相互作用,分析教学实践系统的核心特征;同时 ,借助差异化公开学习活动(Differentiated Overt Learning Activities,DOLA)框架,捕捉课堂的主动学习行为(Hora,2015)。COPUS 统计不同行为的持续时间,以饼状图直观呈现观察结果。有研究者使用聚类分析处理 COPUS 数据,发现存在三种不同的教学风格:灌输式、互动式、以学生为中心式(Stains et al., 2018)。PORTAAL 通过计算 21 个观察要素出现的平均频率或持续时间及其中位数和四分位数,为教师改善教学实践提供标准。

(二)要素层:STEM 课堂观察项目的内容分析

要素层旨在挖掘 STEM 课堂观察的特征要素,把握 STEM 教学实施与评估的重点。由构建层观察维度可知,上述 STEM 课堂观察协议涵盖教学策略、教学内容、教学实施、教学评价、学习投入、认知发展、课堂互动、教学技术八个方面。崔允漷(2012)构建的面向听评课的课堂观察 LICC(Learning Instruction Curriculum Culture,LICC)范式,将课堂解构为学生学习、教师教学、课程性质、课堂文化四个方面。在参考国内外典型课堂观察框架的基础上,考虑到 STEM 课程性质与教师的教学设计和实施紧密相关,本研究将其并入教师教学维度;基于教育数字化转型的时代要求和 STEM 课堂的技术增强性(余胜泉等,2015),将技术应用作为单独的分析维度。由此,本研究从教师教学、学生学习、课堂文化、技术应用四个评价维度,对六套协议的 147 个观察项目进行内容分析,提炼出 14 项特征要素(见表 5)。

图片

1. 教师教学

教师教学维度考察教师的教学策略、教学内容、教学实施和教学评价的表现,评价教师设计与实施 STEM 课堂教学的能力。具体到观察项目上,上述协议在此维度均强调科学探究与沟通合作两个要素,主要体现在教学策略选择与教学实施过程的评价中。科学探究评价教师能否为学生提供模拟真实科学任务的机会,即能否通过提问、假设、论证、交流、展示等,引导学生主动参与问题解决过程。沟通合作评估教师如何开展课堂互动和促进学生之间的合作学习,观察教师能否为学生提供清晰的合作目标和充分的交流机会,是否允许学生充分表达观点并给予正向反馈与引导,推动学习共同体的形成。其次,先验知识与学科融合被四种协议提及。先验知识关注教师的教学策略与活动选择有无考虑学生的已有知识与概念,调整教学内容使之符合学生的认知发展水平,帮助其建立新旧知识的联结。学科融合是评价教学内容设计的关键指标,体现 STEM 教育的学科融合性与真实情境性,要求教师将教学内容与其他学科及真实世界相关联,基于真实情境讨论问题解决策略,促进学生知识的迁移应用与创新发展。最后,实践操作层面的观察项目不足,即忽视课堂上原型制作、产品测试、模型迭代等环节的评价。只有 TDOP 提出“教师应要求学生产生创造性的想法与产品”,但这一观察项目没有落实到学生思维的可视化与产品化过程,难以体现 STEM 课堂的工程设计与思维元素。

2. 学生学习

学生学习维度包括学习投入和认知发展,评价学生在 STEM 课堂的外显学习行为和可能的思维发展过程。上述协议对学习投入的评价主要通过程序性知识观察学生知识的获取过程,例如,从处理信息、得出结论和评估知识等方面检查学生是否参与了科学探究活动,或者以百分比形式粗略计算学生的参与程度(如高、中、低)。认知发展与学生的课堂参与行为紧密相关,旨在评价课堂对学生高阶思维培养的促进作用,主要包括概念思维、批判思维、创新思维和元认知能力,这与已有研究的观点高度一致(首新等,2021;阙荣辉等,2023)。概念思维是关联性思维 ,是高阶思维发展的基础(朱彩兰等,2023),其培养与陈述性知识的传授密切相关,需要教师的学科知识水平与内容组织能力,包括如何从不同视角对同一概念进行多样化解读,如何组织跨学科主题下的不同概念,能否使用图表或模型帮助学生厘清知识间的本质联系;还需观察学生的观点表达与作品制作有无运用多学科知识解决问题,将所学内容与上位概念联系起来理解。批判思维、创新思维和元认知能力的观察主要关联程序性知识,评价教学活动设计的合理性和学生参与的有效性,关注教学活动是否涉及预测、估计、假设、协商等科学思维方式,或者应用、分析、综合、评价等高阶认知技能;评价学生在课堂中能否基于证据严谨地思考、批判性地审视观点、在建构性对话中生成新的想法,以及能否基于总结和反思活动进行自我调节。

3. 课堂文化

课堂文化维度反映师生共同营造的社会性氛围以及整个教学过程传递的价值观信息。上述协议主要以课堂互动体现这一维度的特征,包括生生互动和师生互动两方面。前者关注学生之间互动的数量和类型,以及教师如何促进这种互动,包括学生参与课堂讨论与小组活动的方式、学生与他人互动的态度(如善于自主表达、能够尊重他人、敢于批判质疑、乐于协商共享);后者关注师生关系和教师营造课堂文化的理念,评价教师是否以“听众”或“顾问”的身份参与,从不可侵犯的权威变为引导学生的交流对象与合作伙伴。整体来看,所有协议都体现了 STEM 课堂文化的自主性与互动性特征,评价课堂是否为学生提供独立思考与自主学习的机会,以及教学过程如何在教师的提问与反馈、学生的思辨与讨论中双向进行。其中,RTOP 和 UTOP 还关注教师是否根据学生的观点和表现调整教学进度、分配课堂时间、有效处理突发情况,评价教师 STEM 课堂管理的质量,为生成式、探索性的学习环境提供保障;TDOP 描述了人机互动与师生互动、生生互动共同构成的课堂互动文化。此外,RTOP、OTOP、PORTAAL 还评价 STEM 课堂的民主性特征,关注减少学习焦虑的教学措施,例如给予学生主动提问的机会、鼓励学生提出不同想法、允许犯错并肯定错误的价值。

4. 技术应用

虽然上述协议的观察项目并未详细讨论技术支持 STEM 课堂教与学的方式,但仍可以从技术应用项目中获得启发。技术应用维度主要考虑学生和教师使用技术两个方面,前者评估技术是否作为学生的认知工具,培养学生运用技术解决问题的能力(余胜泉等,2015),如学生使用多种技术媒介与他人讨论交流;后者评估教师的技术使用行为,判断其是否优化了学生知识建构与能力发展的过程(宋歌等,2022),如教师能否获取并使用适切的教学资源,重点观察教师如何使用技术提高学生学习效果。同时,使用的技术类型也是这一维度的重要评价指标,如 TDOP 列举了教师可能使用的教学技术,包括电子白板、PPT、答题器、演示设备、个人平板、视频、虚拟仿真系统、网站等,但以上分类仍以传统的演示型技术和交互型技术为主,难以充分反映 STEM 课堂的技术增强特征。

(三)应用层:协议的实践特征、优势与局限

正式实施课堂观察应明确不同工具的观察主体和评价情境。观察主体区分了协议的关注对象,即是以教师为主还是以学生为主;评价情境涉及协议的作用类型、适用范围与局限性。六套协议的应用特征见表 6。

图片

1. 观察主体

从观察主体看, UTOP 与 PORTAAL 是典型的以教师行为为焦点的协议,其观察项目仅考察教师可能采用的有效教学措施,没有直接记录课堂中学生的反应。RTOP 与 TDOP 关注教师行为,同时在个别维度观察学生行为。RTOP 在“程序性知识”中考察学生参与科学探究的过程,在“生生互动”中评估学生互动的数量和类型;TDOP 在“师生对话”与“学生参与”中描述学生的主动对话与专注度。上述协议仅有 OTOP 与 COPUS 同时以教师和学生为观察焦点,OTOP 提出不同实践要素对应的课堂学生行为表征;COPUS 特别将“学生行为”置于协议首部,以防观察员习惯性地关注教师行为而忽视课堂的真正主体——学生。

2. 适用性

从作用类型看,RTOP、UTOP、PORTAAL 属于评估性工具,可建立常模以评估课堂教学质量,并在一定程度上预测学生成绩;OTOP、TDOP、COPUS 为描述性工具,观察结果作为一种分类数据,旨在客观描述课堂教学实践。不同的评价目标与内容结构直接影响协议的适用范围。RTOP、OTOP、UTOP 能够评估 STEM 课堂的教学改革程度,是中小学教师专业发展的有效工具。其中,RTOP 面向广泛的教学方法评估与反馈,能衡量各类教改措施的有效性 ,例如引导探究(Blanchard et al.,2010)、协作探究(Cavagnetto et al.,2011),师生对话互动等教学策略(Akkus et al.,2011),以及以学生为中心编制的教学资源(Teasdale et al.,2020)。UTOP 考虑了从探究式教学到讲授式教学的不同教学模式,有助于了解教师教学的优劣势,找出其薄弱环节。OTOP 是职前教师开展教学计划和实践反思的有效工具,能促进其更快适应正式教学工作(Bullock et al.,2012)。TDOP 能描述教学的动态变化,借助社会网络分析厘清不同实践维度内部与之间的关系,从行为、认知、技术三方面挖掘不同学科与课型的教学特征。COPUS 突出学生的课堂主体地位,可用于分析师生互动、直观了解师生如何使用课堂时间;其代码的精简性便于没有观察经验或科学教育研究背景的中小学 STEM 教师、大学教师与教研人员经短期培训后使用。RORTAAL 将主动学习实践解构为课堂可操作性行为,为教师改革课堂实践提供参考框架,有助于主动学习的理解与实施。

3. 局限性

没有一种工具能够满足所有课堂教学评估的需求。上述协议也存在局限,主要体现在协议设计、评价效果与易用性三方面。在协议设计上,RTOP、UTOP、TDOP、PORTAAL 没有充分关注学生行为;COPUS 只考察了学生行为的类型,不评估学生课堂参与的质量。同时,上述协议以学生的积极表现为评价重点,没有考虑学生的抵抗行为或消极反应(Shekhar et al.,2015)。在评估效果上,仅有 TDOP 考虑课堂的动态变化和不同实践维度间的关系。RTOP、OTOP、UTOP 是量表式的静态描述,只给出整体的分值,省略了具体教学行为发生的时间;COPUS 与 PORTAAL虽然同为分段式协议,但其观察间隔的划分多为了统计不同行为课堂出现的频次,没有探索行为间的相互作用。此外,PORTAAL 倾向于描述大型的讲授式课堂,难以反映小型研讨课与实验课的教学特征,因为这类课程的生生互动频次与深度显著增加,还伴随着较多的动手操作环节。

从易用性看,所有协议正式使用前,均需要开展前期培训,以便达到评价者间的一致性。除了 COPUS 与 PORTAAL 的培训时间较短(1.5 h 与 5 h),其余协议都需较高的时间成本。使用手册的不完备也为观察者带来困扰。其中,RTOP 没有为李克特量表的每个级别提供具体描述,不容易解释中间量级的分差。OTOP 需要结合师生两个行为主体对每个维度进行综合评定,在很大程度上依赖详细的现场笔记;协议涉及的元认知、前概念等要素也对观察者的教学经验和理解能力提出了较高要求。UTOP 并未归纳二级维度,试图涵盖众多教学行为的做法可能导致局部评价失焦。TDOP 部分编码的合理性受到质疑,被认为存在冗余(Smith et al.,2013),无法捕捉非编码库中的行为,难以描述真实课堂中学生的参与程度和注意力分布。COPUS 的数据处理方法有待完善,其饼状图是某一行为被勾选的频次除以被勾选行为的总数得到的百分比,用以表示课堂某种行为的时间比例,但这种计算方式容易受编码总数的影响(Lund et al.,2015)。此外,COPUS 教学风格分类难以区分教师形成性评估与反馈的差异,特别是对互动式讲授和以学生为中心的课堂(McConnell et al.,2021)。PORTAAL 的不同要素对应特定的观察项目,数据统计涉及繁琐的数据转换,需要观察员投入更多的时间与精力。

四、特征要素与

评价矩阵

(一)特征要素

基于对六套典型 STEM 课堂观察协议研发范式、构成要素和实践特征的系统分析,结合 STEM 课堂学科融合性、真实情境性、项目承载性的特点,本文以探究共同体框架(Community of Inquiry Framework, COI 框 架 )(Garrison et al.,1999)和 TPACK 框架为理论依据,将 STEM 课堂解构为教学存在(Pedagogical presence)、社会存在(Social presence)、技术存在(Technological presence)三个维度,以完善上述协议实际应用的局限(如对学生学习观测不足、忽视教学技术的作用、课堂实践操作特征不明显等),并基于教师与学生两个观察主体,统摄上述协议在教师教学、学生学习、课堂文化、技术应用四个评价范畴涉及的八个课堂观察维度和观察项目体现的 14 项特征要素,形成 STEM课堂观察的 L-PST(Learning-Pedagogical Social Technological)双罗盘模型(简称 L-PST 模型)(见图 1)。

图片

L-PST 模型以教学存在、社会存在和技术存在三个维度解构 STEM 课堂的教与学行为,同时考虑教师和学生两个观察主体,划分为内外双层罗盘。其中,学生学习是 STEM 课堂的中心,位于模型内环(观察学生行为表现,称为“学生罗盘”),包括学生的认知发展、社会参与、使用技术;教师教学是影响学生学习结果的关键因素,位于模型外环(观察教师行为表现,称为“教师罗盘”),包括教师课堂教学、创设课堂文化、使用技术。

教学存在表征教师对教学系统的设计组织及对学生的引导方式,以促成有价值的学习成果,关注学生认知发展和教师课堂教学。学生认知发展指向实践探究的高阶思维培养,评估学生意义主动建构与迁移创造过程。STEM 课堂的思维培养目标主要包括概念思维、批判思维、创新思维和元认知能力。概念思维旨在评价学科大概念与跨学科知识体系建构;批判思维强调能够基于证据意识进行严谨全面地思考;创新思维重视生成新想法、新方案与新产品的能力;元认知指向学习的监控与调节过程。教师课堂教学评价教师设计、组织与实施 STEM 课堂的能力,涵盖教学策略、教学内容、教学实施、教学评价四个子维度。教学策略以先验知识、协作学习、科学探究、工程实践为评价指标,观察教师是否考虑学生先验知识的影响,是否采用合作探究的教学方法发展学生的认知结构,能否以工程实践活动落实学生的创新想法并提升其动手操作能力。教学内容评价教师如何促进学生对概念的系统性理解,包括学科核心概念与原理的选择、内容表达的抽象化与多样性、将教学内容与其他学科和现实世界关联的有效性。教学实施基于五种教师行为类型(讲授、演示、提问、反馈、指导)(Lund et al.,2015),评价教师组织与实施 STEM 课堂的方式。教学评价观察教师能否有意识地收集学生跨学科实践的表现性证据(学习性评价),根据学习表现进行即时反馈与调整教学,引导学生开展自我评价与学习反思(学习式评价),并基于阶段性学习结果(学习的评价),对学习成效进行合理测评(詹泽慧等,2023)。

社会存在表征学生的社会参与和教师创设的课堂文化,旨在营造促进探究、质疑、分享的主动学习环境。学生社会参与评价学生的课堂参与程度,内涵包括学习投入(如认知投入和社会投入)和情绪表现两个子维度。学习投入基于 TDOP 识别主动学习行为的 ICAP 框架(Chi et al.,2014),分为被动学习、主动学习、建构学习和互动学习四种状态。被动学习指学生只是被动地从教学材料中接受信息(如学生被动地听和看、跟随教师讲解抄写笔记、阅读学习资料);主动学习表示学生积极参与教学,主动使用学习材料(如旋转物体进行观察、自主标注重要句子);建构学习强调学生能超越学习材料生成新的想法与产品(如提出问题与假设、自我评价、构建模型与调试);互动学习指学生在建构性对话中生成新的想法(如整合同伴的观点、与同伴展开辩论)。情绪表现是影响学生社会性参与的决定性特征,可分为消极情绪和积极情绪。上述协议只评价学生的积极参与行为。然而,STEM 课堂上学生往往承担很多面向真实情境的复杂任务,会引发对自身能力的焦虑。因此,还需关注学生对 STEM 教学活动和主动学习策略的抵抗反应,包括学生是否呈现消极的面部表情(被动的、非语言的抵抗)、敷衍地完成任务(部分抵抗)、公开反对参与任务(公开抵抗)。创设课堂文化维度考察交流互动和师生关系。前者考量教师如何为学生营造有助于意义建构的课堂氛围以及引导学生协作的方法,观察学生课堂互动的方式和态度,评价学生是否有自主探索和自主表达的机会和意愿、尊重他人表达的权力、能否基于证据批判性地看待同伴和教师的观点、在协商共享中实现群体智慧的共创。后者考量教师能否作为知识获取的协助者、思维发展的引导者、课堂制度的管理者,为课堂教学创设自主、民主、互动的氛围。

技术存在表征师生在 STEM 课堂的技术应用类型和程度,关注技术赋能教与学的过程。学生使用技术关注技术促进学生主动参与和深度学习的方式,与学习投入的四种状态对应,如学生跟随教师指令在平台查看学习材料(被动型)、使用搜索引擎收集信息(主动型)、设计虚拟仿真模型(建构型)、协作绘制思维导图(互动型)。“教师使用技术”考察课堂的技术资源类型和教师技术应用水平。教学技术类型评估教师是否理解 STEM 课堂的技术特征,能否选用合适的教学工具。基于美国联邦教育部报告的九种 STEM 教育技术赋能方式(Office of Educational Technology,2019),本研究根据表现形式和作用类型将 STEM 课堂常见的技术资源分为动态展示技术(虚拟仿真系统、数据可视化模型等)、课堂交互技术(Kahoot、雨课堂、UMU 平台等)、工程设计技术(图形化编程、开源硬件、激光切割、3D 打印等)、协作共享技术(协作思维导图、项目式数字协同平台)、学习分析技术(学习管理系统、传感器与测量设备等)、人工智能技术(个性化资源推送、ChatGPT 类技术等)六种。教师技术应用水平衡量教师的技术应用适切程度,涉及缺乏应用(教师很少/不愿意在 STEM 课堂使用技术)、浅层应用(以教师为中心使用技术,如基于技术简单呈现教学内容)、深度应用(以学生为中心使用技术,如基于技术促进学生的项目式学习和个性化学习)、过度应用(技术使用的目的含糊、效果不佳,如使用超出学生认知水平的复杂技术,阻碍正常的教学进程)四个层级(Jen et al.,2016)。

总体而言,STEM 课堂观察的特征要素须体现 STEM 教育的学科融合性、真实情境性与项目承载性。在学科融合性上,教学内容维度强调对学科核心概念选取、内容本质抽象、跨学科迁移等学科整合属性的评价;认知发展维度强调观察学生概念思维的发展。真实情境性由教学设计维度的先验知识要素和教学内容维度的联系现实要素表征,评价教师能否考虑学生原有认知结构,围绕社会生活创设问题情境,从而强化学生概念的迁移应用与情境性生成,推动创新思维的发展。项目承载性体现在教学策略维度下的协作学习、科学探究、工程实践,考察教师开展项目式教学的设计能力,以学生社会参与和教师创设的课堂文化维度评价项目式学习的实施程度。整个教学过程中,观察者还需要考察教师是否实施了多元的教学评价措施,并评估技术对教与学过程的影响。

(二)三维矩阵

本文结合典型 STEM 课堂观察协议的应用特征,以评价三角理论为框架,构建了 STEM 课堂观察评价的三维矩阵(见图 2)。评价三角理论的三个要素彼此关联,形成 STEM 课堂观察实施的三个方面:

图片

一是认知维度与观察维度构成的课堂观察设计层。观察者依据教育教学理论,确定评价目标与内容,从 STEM 课堂观察特征要素中选取对应视角,使用已有协议或自行编制整体性或分段式工具。例如,考察教师行为对学生参与度的影响,可基于教师教学的五种教学实施行为,结合其他子维度的特征要素进行扩展,如教师讲授行为可以包括陈述板书(L1)、联系旧知(先验知识,L2),教师提问可包含提出封闭性问题(Q1)、联系日常生活提出开放性问题(关联现实,Q2);学生学习投入可基于被动、主动、建构、互动四个层级划分。

二是观察维度和解释维度构成的教学证据收集层。观察者基于观察内容与数据分析要求,详细记录课堂教学过程,并将其量化为可处理的教学数据。在此过程中,观察者需先接受培训,基于观察指标的评价依据,包括设计目的、评价重点、行为表征、程度说明等,帮助教师和教研员理解 STEM 课堂评价的重点;其次,使用评价工具开展课堂观察与证据收集,除核心行为数据,辅助性的质性材料,如课堂过程的描述性笔记、教师访谈、课堂背景等信息,也可作为数据解读的参考;最后,分析评价者间的信度,证明数据的可靠性与可用性。

三是认知维度与解释维度构成的教学评价实施层。观察者借助多元的解释方法将教学数据转化为可理解的评价结果,以评价目标涉及的认知理论为基础解读教学证据,得出可靠的推理与结论。例如,量表式计分工具可用于计算不同项目与维度得分的平均值、标准差,分析教师不同指标的表现水平,提出改进建议;T 检验可用于比较教师群体在哪些教学维度或项目上存在显著差异,证明干预的有效性或总结教师专业发展的经验;相关分析或回归分析可用于建立评价结果与教师增值、学生成绩等方面的联系,探讨影响课堂教学质量的关键因素,验证评价工具的可预测性;分段式工具可用于描述性统计不同行为编码出现的频次,从整体上评价课堂教学特征;社会网络分析或滞后序列分析可用于考察不同行为间的共现关系或因果关系,可视化隐性的关键行为序列;行为数据聚类可用于挖掘可能的教学模式与教学风格。此外,观察者还可结合不同类型的工具,如利用 RTOP 评估教学质量,用 COPUS 分析互动特征等,探讨优质课堂与传统课堂的教学行为差异(Lund et al.,2015)。

五、结语

证据导向的评价能够兼顾过程与结果,实现以评定教、以评促学的双重目的(詹泽慧等,2022)。本文立足 STEM 教育的循证评价理念,以课堂观察为方法,从理论构建、项目分析、实践应用三方面系统梳理和分析国际典型的 STEM 课堂观察协议,明确 STEM 课堂观察维度的构成要素;结合实证研究与大规模评估项目,分析不同工具在教学策略评估、教学实践识别、课堂互动分析、教师能力选拔等方面的适用性,以及在学生参与行为与认知发展观测、教学技术使用、实践操作特征挖掘等方面的局限。在此基础上 ,本文以探究共同体理论和 TPACK 框架为依据,将 STEM 课堂解构为教学存在、社会存在、技术存在三个维度,围绕教师和学生两个观察主体,形成 STEM 课堂观察的 L-PST 双罗盘模型;以学生学习为中心,以教师教学、课堂文化和教学技术为关键,从六个一级维度八个二级维度 44 个观察要点解构 STEM 课堂观察的特征要素;基于评价三角理论,从评价设计、证据收集、评价实施三方面构建 STEM 课堂观察评价的三维矩阵,旨在为当前 STEM 课堂教学评价提供系统化方法。STEM 课堂教学评价是一个复杂、精细的过程,尤其是教与学的动态评估依赖于大量的教学证据(余胜泉等,2019)。因此,尽管课堂观察在提供直接证据上具有优势,但仍需整合其他评价方法挖掘外显行为背后隐含的认知与情感因素。

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

声明

 本刊投稿网址:https://openedu.,不向作者收取任何费用。

图片

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多