分享

Solo评价理论简介李英杰

 灵藏阁 2015-02-02

     今天我想从五个方面介绍solo。首先是solo的基本理论介绍,第二是solo和布卢姆的比较,第三是各学科应用solo的试题分析,第四是利用solo编制测试题目的步骤,最后想说一下对solo分类的特点分析。

一、solo认知评价系统介绍

Solo是英文“structure of the observed learning outcomes”首字母的缩写。意思为“可观测的学习结果的结构”。他是由香港大学教育心理学教授比格斯(Biggs,John B.)先生和Collis,Kevin F.在研究皮亚杰认知发展阶段理论的过程中于1982年提出的。它吸取了皮亚杰认知发展理论中的合理因素,同时对皮亚杰的理论进行了修正和发展,从关注儿童认知发展的阶段,转向关注儿童对问题的反应中所表现出来的思维结构。

首先,关于认知发展的阶段。

solo是基于皮亚杰的认知发展阶段理论提出的,大家都知道,皮亚杰把儿童的认知发展划分了四个阶段,分别是感知运算阶段、前运算阶段、具体运算阶段、形式运算阶段。比格斯在皮亚杰的这个理论的基础上,又作了进一步的研究。他将人类的认知发展划分为5种类型,分别是:感觉运动方式(开始于出生后)、形象方式(开始于2岁后)、具体符号方式(开始于6、7岁)、形式方式(开始于15、16岁)、和后形式方式(可能开始于22岁左右)。与皮亚杰的理论相比,它最大的突破在于提出了后形式方式(postformal),用来描述学生中一般能观察到的认知成长以外的变化。皮亚杰的理论只解释了儿童从出生直到青年早期的认知发展过程,而成年以后的认知功能可能与青少年早期存在差异,为此,Biggs等人提出了后形式方式,用来说明成年以后的认知功能方式的变化。

 

其次,各个认知发展阶段中学生的发展水平。

Biggs等人认为,皮亚杰的认知发展理论是对总体认知结构发展的阶段划分(也就是指划分出了几个认知发展的阶段),但是总体认知结构是一个纯理论性的概念,是不可以直接检测的,Biggs称之为“假设的认知结构(hypothetical cognitive structure)”,英文的缩写为HCS。为了能够直接检测学生的认知发展水平,在皮亚杰认知发展阶段论的基础上,Biggs提出,在总体认知结构发展的每一个阶段,都还会有几个不同的水平。这些水平可以通过学生在回答某个具体问题时所表现出来的思维结构的复杂性来体现,它是可以直接检测的,Biggs称之为“可观测的学习结果的结构(structure of the observed learning outcome)”,英文缩写即SOLO。这种根据学生在问题回答中思维结构的复杂性判断学生认知发展水平的评价方法就称为SOLO分类评价法。

具体来说,在每一个认知发展的阶段中,都可能会包含从低到高五个不同的层次[1]:这五个层次是按照思维结构的复杂程度不同划分的。

前结构(pre-structure):完全错误或者不相关的答案。学生没有所面对问题的相关知识,或者没有真正理解问题,所以他的回答是完全错误的,或者与所问的问题完全不相关的;或者使用了与问题要求相比过于简单的方式回答问题。

单一结构(uni-structure):对所给问题涉及的某一个相关信息的使用。学生只抓住或者使用了回答问题所需要的几个方面的信息之一,然后就直接跳回了问题。或者仅仅是靠记忆进行的回答,不存在理解。

多元结构(multi-structure):对所给问题的多个相关信息的连续使用。学生抓住或者使用了回答问题所需要的所有方面或者其中的几个方面的信息,甚至能够在其中建立起两两之间的相互联系,但是对于这些方面或者方面对的使用仍然是孤立的,没有形成所有方面的有机联系。

关联结构(relational):对所给问题的全部相关信息进行综合,并形成一个唯一的结论或者概括。学生能够抓住并使用回答问题所需要的所有方面的信息,并且能够将这些方面进行综合和概括,形成一个统一的整体。这个水平就是一般意义上的对问题的充分理解,表现为能回答或解决较为复杂的具体问题。但是这个水平的学生在回答问题中所使用的信息仍然是问题中直接相关的,不会使用到问题没有直接涉及到,但是与问题本身有联系的其他信息,不会将问题至于更一般的、更广阔的情境中进行考虑或者对问题提出质疑。

拓展结构(extended abstract):对各种相互影响系统的综合使用,以形成一个对问题的反应。学生能够在关联的基础上,联系与问题相关的所有影响系统(包括问题中没有直接提到,但是有影响的系统),将问题置于一个更为广阔的情境中,对问题进行全面的思考以及更高水平的概括和归纳。这个水平的反应最终可能形成一个一般的假设、开放性的答案或者形成一个新的主题或者领域,这一层次的学生表现出更强的钻研和创造意识。但是,并不是每个人,在每个领域上都可以达到拓展水平。

此外,Biggs还指出,虽然总体认知发展阶段决定了学生对具体问题反应的最好水平,但是,由于学生在具体问题上的反应还会受到学习动机、既有知识、表现欲望等因素的影响,所以根据皮亚杰的分类法给学生贴标签,认定其总体认知发展阶段对于实际教学的反馈作用并不是很明显,学生在不同的学科领域、不同的题目上都可能处于不同的发展阶段。例如在数学上,学生可能处于一个较高的水平,但是在语文上,他就可能处于一个较低的水平上。甚至是在某一道题目上学生可以处于一个水平,在另外一道题目上又处于另一个水平。

根据SOLO分类评价理论的这些基本设想,学生在具体问题中表现的思维结构的复杂性是不同,他们可能会出现“前结构”、“单一”、“多元”、“关联”、“拓展”五个不同的水平,其中的每个水平都表征了学生在回答问题时不同的思维结构。另外,由于SOLO分类评价理论关注学生在回答问题时表现出来的思维结构,较少受到具体知识点的影响,因此,我们可以相信,将solo理论应用于学业能力测试中可能会在一定程度上提高测试的信度和效度。

例如,要求学生结合文本内容分析某一个文学作品中的人物形象

前结构的学生可能会仅仅根据文本中的某一句话就对人物的形象进行错误的解释,可能会脱离开文本凭自己的经验想象人物的形象,也可能会仅仅用好或者坏给人物下一个定义。

单一结构的学生可能会忽略掉人物本身性格的复杂性,只要他能够从文本中找到人物的某一个方面的特点,他就会马上断定,人物的形象就仅仅是这一个方面。

多元水平的学生可能会从文本中找出多个细节,都能反映人物某一个或者几个方面的特点,但是,他们不能将这些细节进行有机的整合,在综合考虑的基础上得出人物的整体形象特点,他们对人物形象的解释是零散的,片段的。

关联水平的学生能够抓住文章中表现人物性格的各个细节,并且能够将这些细节进行有机的整合,在综合考虑的基础上对人物做出全面的分析,归纳出人物的整体形象特点。

拓展结构水平的学生不仅能够像关联水平的学生一样对人物的形象进行整体的分析,而且他还能够结合人物当时所处的社会环境和心理状态,从历史的角度对人物的形象进行客观的分析。

 

二、solo理论与布鲁姆的比较

结合一个地理的例子来说。

例:为什么靠海的山峰迎风面比背风面湿润多雨?

对于这道题目,学生有七个很典型的答案。

1、Dunno

2、因为它在靠海的一面下雨多

3、因为当我们去我们位于海滩上的小木屋的时候,那里总是比来这里的山路上湿润。从不会错。我认为我们应该搬家;让我们的小木屋更方面打猎,而不是钓鱼。另外,我讨厌下雨。

4、因为海风首先吹着山峰靠海的一面

5、海上的湿空气,例如雾等使它湿润。它首先达到靠海的一面,所以就下雨了,并且所有的潮湿都落到了靠海的一面,背海的一面就没有了。

6、因为常刮的风是来自于海上的海风。他们从海上携带了水分,当他们遇到山,他们被压迫上升并且由于高处气温低而变冷。这就使水分凝结在上升的方向形成雨。同时,当风通过山的另一面时,他们已经变得干燥了。

7、只要常刮的风是从海上来的,那么这个结论就是正确的。它们把从海里蒸发的水蒸气携带到山的斜坡上,使空气团上升、变冷。变冷造成水蒸气的凝结,并且变得越来越重,甚至比空气还重,水滴积聚成雨。这不仅能使风变得干燥,还有可能产生风的腐蚀作用。这就像加拿大洛矶山脉东坡一样,如果那里没有山,在海滨和内陆之间就可能没有区别了。他全部是依靠地理特征和常刮的风和气温条件。如果这些变化了,那么能量交换就会不一样了,也会导致一个非常不一样的类型。

 

如果采用布卢姆的评价办法,虽然大部分老师都可能会同意这些反映在质量上是逐步变好的。他们也呈现出越长、使用的观点越多的答案,质量会更好的倾向。这是和采用solo评价的方式结果一样的。但是布卢姆是采用简单的按点给分的办法,这可能会丧失一些东西。如果这道题目是10分的,布卢姆评价一般会用7分来评价答案的点是否齐全,另外3分用于评价学生回答的质量(比如学生的答案是否通顺等)。在这种评分中,教师给出的最高分只能是9分——没有人会得到10分,甚至是他自己。在我们平常的考试中,我们也很容易发现,很少有人能得到满分。

如果采用布卢姆的评价方式评价,教师对于最后一个答案的评价可能是:

噢,天哪!他甚至质疑这个题目是否真实。并且他还提到了一些课堂中没有学过的内容。我可以看见这个学生使用了5个或者最多6个观点,好的,6分。但是他比前一个回答又好,一个好的表达的奖励:8分。

对于学生的这些答案,教师可能会给学生一个分数,例如5分或者6分,但是通过这种布卢姆的评价,学生仅仅是知道了自己得了多少分,或者知道自己在全班中处于一个什么样的位置。这对于他发现自己学习中的劣势,进一步改进自己的学习,对于教师了解学生的学习情况,改进自己的教学是没有太大帮助的。为了更好的进行教学,让学生了解他们为什么被这样评价是十分必要的,他们可以更清楚地理解他们怎样才能提高自己的反应水平。

Solo评价正是在这方面具有优势,如果采用solo评价的方式,那么教师对于最后一个答案的评价可能是:

学生运用了各种线索,并且在各种线索之间建立了相互的联系对题目进行解释。并且超出题目之外,形成了一个新的认识,他的这个反应达到了拓展的水平。

对第4个回答的评价可能是:这个学生只抓住了问题的一个线索,并且对这个线索的使用是正确的,因此它达到了单一的水平。

对于第5个回答的评价可能是:学生抓住了问题的几个方面的线索,但是还不完全,并且对于他抓住的这几个线索,学生并不能将他们之间建立联系,形成一个整体。因此这个回答是属于多元水平的。

通过教师这样的一种评价,学生可以清楚地明白自己的水平是什么样的,下一步需要进行什么样的努力和改进。也知道什么样的回答是比较好的。并且这样的评价并不是对学生错与对的简单判断,而是对学生表现水平的分析,它允许学生是半对的,例如,第4和第5个回答就属于半对的,教师并不简单的告诉学生得了多少分,而是也告诉学生他的问题在哪,需要怎样改进。这样的评价才是更能促进学习和教学的。

当然了,这两种评价方式也都有其各自的优缺点和适用条件,需要我们有选择的使用。只有当他们用在恰当的位置,才能充分发挥其作用。

 

三、各学科solo试题分析

语文

我们曾经出了一道题目,“你认为这个故事主要讲的是什么?”

评分标准如下:

前结构的学生对文章的理解是完全错误的或者是脱离了文章内容的,比如说“这篇文章讲了小松鼠和小兔是好朋友”、“这篇文章讲了小兔和小乌龟一起玩耍”、甚至“我不知道讲了什么,但是我很喜欢小白兔”。

单一结构的学生能够理解文章中的某一个片断,或者某些句子,但是他们的理解还仅仅是基于字面的,比如说“小松鼠很贪玩,春天夏天都在玩”、“小兔送了小松鼠一片树叶”,这些都是文章中的句子。

多元结构的学生能够把握文章的几个方面,对文章有一定的理解,但是还不完整,比如说“小松鼠因为贪玩,没有储存过冬的粮食”,这个答案显示出学生理解了文章的前半部分,但是对前后内容之间没有建立有机的联系。

关联结构的学生能够完全理解文章,能够把文章做为一个整体建立各个部分之间的有机联系,比如说“在兔子的帮助下,小松鼠吸取教训,知道要储存过冬的粮食了”。

这个评分标准按照学生思维水平的复杂程度将学生可能的回答划分成了四个不同的水平。对教师

政治:

题目举例分析:讨论一下自然的天性和后天的培养对于学生道德体系发展的影响。

如果是前结构的反映,他们的回答可能是沿着“众所周知的,孩子的道德体系是在它们年幼的时候发展的。这个系统影响他们的行为方式。”或者“自然是关于花朵和动物以及我们身边的整个世界的。人类,包括许多动物的父母,当他们的下一代太过弱小或者没有经验不能独自生活时会承担培养他们下一代的责任”等问题展开谈的。前结构的这些回答都是由问题中的某个词语(“道德体系”、“后天培养”)引发的。

如果是单一结构的反应,他们的回答可能是概括出自然的天性(基因遗传等)对于孩子道德体系发展的影响,或者会简单的解释和描述道德体系。但是他们的回答只会沿着问题的某一个方面展开,而不会在其间建立联系。

如果是多元结构的反应,他们的回答可能是概括出自然的天性和后天培养两个方面的影响,但是却不会把他们的影响综合到一起。如果题目本身包含多个信息,那么学生的回答也可能是仅仅在某两个问题间建立联系,但是不会将所有的信息加以整合,形成统一的整体。

如果是关联结构的回答,那么学生可能会描述两个因素对于学生道德体系发展的影响、它们之间的相互作用以及他们的平衡。关联结构的回答会将题目要求的所有信息加以整合,建立相互之间的联系,形成统一的整体。

拓展抽象的回答是建立在关联结构回答的基础上的,它会包括关联结构的回答,并且它还会继续把这个问题放在各种儿童发展或者道德体系的理论中加以考虑。

数学

例1:按下列要求摆放桌子和椅子,1张桌子可坐6人,2张桌子可坐10人,等等。SOLO理论认为各结构层次的学生能够回答的问题如下:

(1)单一结构:3张桌子可坐几人?(学生只需找到这个单一线索,数数椅子的数量即可)

    (2)多元结构:摆5张桌子比摆3张可多坐几个人?(学生首先需要分别数数5张桌子和3张桌子可坐的人数,然后计算两者的差。这些计算只需要找到两个相关的特征,不必形成对问题的整体框架。)

    (3)关联结构:要坐34个人需要摆多少张椅子?(学生对问题的理解要上升到更高的水平,找出桌子与椅子数量之间的联系与规律。)

    (4)扩展抽象结构:n张桌子可以坐多少人?(避开使用具体数字,结论具有开放性,学生只通过数数是无法解决的,必须形成逻辑归纳,对该问题的理解发展到质变的飞跃。)

 

化学

以下是将SOLO的基本思想运用于化学教学进行等级评分的具体实例,从中我们可以了解SOLO的评分标准的应用。

例1:室温下的饱和食盐水。

(1)单一结构:再加入食盐晶体,充分搅拌和静置后,有何现象?

单一结构的反应只需要运用一种策略,即看实验现象即可。

(2)多元结构:为什么在饱和的食盐水中再加入食盐有此现象?而未饱和食盐水之中加入食盐,现象又不同呢?

多元结构反应需要学生做两件事:找出未饱和食盐水中仍能溶解食盐的原因,及饱和食盐水中不能再溶解食盐的原因。所有这些都需要有对问题的基本理解,但不必理解问题的整体结构。

(3)关联结构:在饱和食盐水中放入一个塑料小球,再加入少量食盐晶体,充分搅拌和静置后,小球在液面沉浮情况有何变化?

关联结构水平的学生必须找出影响小球沉浮的全面因素,需要有对问题系统的联系。将氯化钠晶体投入氯化钠饱和溶液中,不会继续溶解,溶液密度不变,mg=F浮=ρ液gV排,因此小球排开液体的体积不变,沉浮情况不变。

(4)拓展抽象结构:在不用外力的情况下使小球略上浮,有什么方法?

方法具有开放性,需要学生拓展知识面,从个例上升到了普遍的通性,使问题本身的意义得到拓展。要是小球上浮,即V排减小,可通过使ρ液增大,可用的办法有:加入硝酸钾等(不反应的其他可溶性)晶体;加入硝酸银等(反应但使溶液质量和密度上升)晶体;升高温度后加入氯化钠晶体等。

历史

过去十多年,我们对历史思维能力的研究主要集中在能力的分类上,影响最大的就是考试中心颁布的十项历史学科能力要求,如阅读能力、归纳能力、比较能力、表达能力等,这不失为研究思维能力的一种方法,但这种方法只有利于确立思维能力的培养目标,却无法确立思维能力的培养层次,因此在评价上就难以拉开学生的差距。从历年的高考试题评价报告中我们也看到了这一点——— 报告只点明了本套试题涉及了哪些能力项目,却无法指明这些能力的层次是怎样划分的。solo分类评价力求解决的就是能力的层次问题。下面就分别以材料题和问答题为例,说明 solo分类法是如何划分历史题目的能力层次的。

例题 1:下列两则材料分别表明了两种截然不同的观点。你同意哪一种观点?请说出你的理由。

材料一:夏、商、周、汉封建而延,秦郡邑而促。(注:在古文中,所谓“封建”就是指分封制,所谓“郡邑”就是指郡县制。)

      ——— 摘自柳宗元《封建论》

材料二:秦有天下,裂都会而为之郡邑,废侯卫而为之守宰,据天下之雄图,都六合之上游,摄制四海,运于掌握之内,此其所以为得也。不数载而天下大坏,其有由矣。亟役万人,暴其威刑,竭其货贿。负锄梃谪戍之徒,圜视而合从,大呼而成群。时则有叛人而无叛吏,人怨于下而吏畏于上,天下相合,杀守劫令而并起。咎在人怨,非郡邑之制失也。

      ——— 摘自柳宗元《封建论》

本题为一道材料解析题,学生要解答好这道题,需要具备古文阅读、比较、综合、分析等多种能力,但solo分类法不需要分析能力的种类,只分析能力的层次。根据solo 分类法,学生的回答可以划分为以下五种情况:

1、前结构的回答。这种回答只出现了一个简单的判断,我们不知道学生是根据什么得出这种判断的。如:答(1):分封制是不对的。(2):郡县制要比分封制好得多。

2、单点结构的回答。这种回答只看到问题的其中一个方面,学生只根据片面的材料就得出绝对的结论。如:答(1):实行分封制是对的,因为夏、商、周和汉朝实行分封制,国家的寿命都很长。(2):实行郡县制是对的,因为秦朝以后大多数朝代都实行郡县制。

3、多点结构的回答。这种回答能够认识到问题的多个方面,但是未能建立起这些方面之间的联系。如:答(1):夏、商、周和汉朝实行了分封制,国家较长久,秦朝实行了郡县制,国家较强大。(2):分封制和郡县制一直处于激烈的冲突之中,有些朝代实行了分封制,有些朝代则实行了郡县制。

4、关联结构的回答。这种回答不但能够联系起多个事件,而且能够在多个事件之间建立起某种联系。如:答:分封制主要是在秦代之前实行的,而郡县制主要是在秦代之后实行的,汉代以后,某些朝代虽然也在局部地区实行过分封制,但总体上还是以郡县制为主体。郡县制取代分封制,这是一种历史的进步。

5、抽象拓展结构的回答。这种回答能够把对问题的认识上升到抽象的理论认识层次,能够从理论上分析为什么会出现这种现象,以及这种现象的发展规律。如:答(1):分封制和郡县制的差异的实质在于中央集权和地方分权的斗争。从材料中我们注意到,在秦朝以前,主要实行分封制,而秦代以后,中央主要是通过郡县制来实施对地方的管理。不同的朝代实行不同的制度,这是由该时代的生产力水平所决定的,秦代以前,由于生产力水平较低,中央政府没有足够的能力对广阔的领土实施直接的管理,因此就采取了分封的形式。秦代以后,随着生产力的发展,中央政府有能力也有必要对地方实施直接管理。答(2):分封制和郡县制的差异的实质在于中央集权和地方分权的斗争,这不仅是一个历史问题,同时也是一个现实问题。从历史上看,中央过分集权,有利于国家的统一,但不利于地方的发展,而地方过分地分权,短期内对地方的发展有好处,但往往会产生分裂势力。因此,中央集权和地方分权是一个“度”的把握问题,过分地强调任何一方面都是有后患的。

本材料题考查学生思维能力的种类较多,如理解材料、结合材料的有效信息进行论证、理论分析历史现象的本质等等,但solo评价法并不具体分析学生运用了什么思维方法,而只是分析学生所能达到的思维层次。能够从材料中找到两条有效信息的学生,能力层次自然比只找到一条有效信息的学生高;能够综合分析两条信息的学生,能力层次又比只是单纯找到两条信息的学生高;能够从理论上分析材料所反映的历史现象的学生,能力层次更比只是简单分析材料间的关系的学生高。

例题 &:请结合英国资产阶级革命的相关史实,谈谈你对英国议会制度的理解。

本题为一道问答题,考查学生思维能力的种类包括再现历史知识、概括历史知识、分析历史事物的本质、阐述历史发展的规律等等。而根据 solo分类法,可以把学生的回答分为以下五种情况:

1、前结构的回答。这种回答只出现了一个简单的判断,我们不知道学生得出这种判断的根据何在;或者只提供了一个史实,我们不知道这个史实说明了什么问题。如:答(1):英国的议会制度对英国历史产生了巨大的作用。(2):1649 年,议会把查理一世送上了断头台。

2、单点结构的回答。这种回答只依据了一个方面的史实,说明学生还没有充分理解历史发展的复杂性。如:答:英国资产阶级革命期间,议会组成了议会军,打败了王党军队,使君主立宪制能够在英国确立。

3、多点结构的回答。这种回答能够依据两个以上的史实,但是未能建立起这些史实之间的联系。如:答:1640年,查理一世为筹措军费而被迫重新召开议会,而议会却以此为契机要求限制王权。当两者的矛盾不可调和时就只能兵戎相见了。1645年,议会军最终击败了王军,并于 1649年把国王送上了断头台。

4、关联结构的回答。这种回答不但能够提供多个史实,而且能够在这些史实之间建立起某种联系。如:答:英国资产阶级革命其实是国王与议会之间的矛盾斗争引起的。1640年,查理一世为筹措军费而被迫重新召开议会,而议会却以此为契机要求限制王权。当两者的矛盾不可调和时就只能兵戎相见了。1645年,议会军最终击败了王军,并于 1649年把国王送上了断头台。但是,议会与国王之间的矛盾并未根本解决。1660年,因为议会内部矛盾不断,查理二世借机复辟。斯图亚特王朝复辟后,国王与议会的矛盾更加尖锐,最后,议会不得不抛弃查理二世,把荷兰的执政威廉三世迎来英国当国王,使立宪君主制最终在英国确立,国王与议会的矛盾也最终得以解决。

5、抽象拓展结构的回答。这种回答不但能够提供多个史实,而且能够把对问题的认识上升到抽象的理论认识层次,能够从理论上分析为什么会出现这种现象,以及这种现象的发展规律。如:答:英国的议会起源于中世纪,议会与国王之间的矛盾是一直存在的。在中世纪,两者的矛盾主要体现在王权与贵族特权的纷争。到了近代,随着资产阶级势力的发展,两者的矛盾则体现在新兴的资产阶级对君主专制统治的不满,要求分享政治的权利。……(省略具体的史实)“光荣革命”后,资产阶级立宪君主制最终在英国确立起来,表面上这种制度的特点是国王与议会并存,而实质上是议会的权力日益超过国王,因此,资产阶级终于能够通过议会来实现对国家政权的控制。

与材料题不同,问答题直接考查了学生的识记能力,但是作为一道开放式或半开放式的题目,学生不应该只满足于罗列大量的史实,而应该把这些史实作为自己思考问题的素材,有理有据地提出自己的分析思路和观点。solo评价法同样可以根据思维的层次把该问题分为五个层次。前三个层次主要考查学生识记史实的多寡,后两个层次主要考查学生的依据史实得出结论和运用理论分析结论的能力。

 

四、利用solo编制测试题目的步骤

(一)利用solo编制主观性试题

1、题干的命制

将solo理论应用于主观性试题的编制,在题干的编制上基本上和传统的命题没有什么区别,唯一要注意的是要在命题时保证给学生充分的发挥空间。如果题干本身的要求过死,那么学生很难在对题目的反应中表现出他们不同的思维水平。

从理论上来说,SOLO理论可以应用于任何一道主观题评分标准的制定,但是有些题目本身就限定了对它的回答最好只能到达SOLO学习结果分类系统中的某一个水平,而不是最高水平。例如,膝盖骨在解剖学上的名字是什么?请举出四种蚊子的种类?这样的题目最好的答案也只能是单一的,极少会有学生出现多元或者更高水平的回答。同时,也有一些题目本身就限定了对它的回答最坏也会在SOLO的哪一个水平上,而不会在更低的水平上。例如:举出四种热带地区常见的蚊子种类,并且讨论他们在公共健康体系中相对的重要性。这个问题最差也会是一个多元的回答(即仅仅列出每种蚊子的种类,并且回答它为什么及怎样重要。)但是它很容易就能得到一个关联的回答(例如讨论四种蚊子之间的相对重要性)。甚至是一个拓展的回答(例如讨论为什么某一种蚊子在公共健康体系中会是最重要的)。

2、评分标准的制定

这是利用solo编制主观题和传统技术编制主观题最主要的区别。

以阅读文段“小松鼠的复信”为例,我们可以出一道考察整体感知能力的题目“你认为这个故事主要讲的是什么?”

按照原来的评价方法,我们可能会在命制题目的同时给出标准答案:这个故事主要讲了小松鼠在兔子的帮助下吸取教训,改正了贪玩的缺点。但是,这个答案存在两个难以克服的问题:首先,这是命题人希望学生达到的结果,是成人阅读的结果,并不是儿童的;另外,这个答案仅仅给出了唯一最好的水平,阅卷人在阅卷的过程中要自己把握学生的正确程度,很容易由于阅卷人的主观效应造成评价的失准。但是,如果采用SOLO理论制定这道题目的评分标准,就会大大减轻这种问题。

采用SOLO理论,在命制题目的同时也要制定出一个答案,但是这个答案不是命题人主观决定的,而是通过将“一对一”小范围预测(预测采用“口语报告”的方法)中得到的学生答案整理分类得到的。在正式阅卷时,这个答案依然不能被直接应用,还需要在试评的过程中验证已有的答案是否能包含学生可能出现的情况,并加以调整,然后才能进行阅卷。

对于上面这道题目,我们采用这种办法得到的答案是这样的:前结构的学生对文章的理解是完全错误的或者是脱离了文章内容的,比如说“这篇文章讲了小松鼠和小兔是好朋友”、“这篇文章讲了小兔和小乌龟一起玩耍”、甚至“我不知道讲了什么,但是我很喜欢小白兔”;单一结构的学生能够理解文章中的某一个片断,或者某些句子,但是他们的理解还仅仅是基于字面的,比如说“小松鼠很贪玩,春天夏天都在玩”、“小兔送了小松鼠一片树叶”,这些都是文章中的句子;多元结构的学生能够把握文章的几个方面,对文章有一定的理解,但是还不完整,比如说“小松鼠因为贪玩,没有储存过冬的粮食”,这个答案显示出学生理解了文章的前半部分,但是对前后内容之间没有建立有机的联系;关联结构的学生能够完全理解文章,能够把文章做为一个整体建立各个部分之间的有机联系,比如说“在兔子的帮助下,小松鼠吸取教训,知道要储存过冬的粮食了”。

这样的评分标准是根据学生的实际回答,寻找答案背后蕴含的思维结构的不同水平,根据思维结构的不同划分出的不同层次。使得主观性试题的评分标准相对独立于知识点之外,更多地评价学生思维的深度和广度,从而既减轻主观题的评分者效应,又保证让学生可以自由发挥和表达;并且评分标准中对学生可能出现的四种水平都做了界定,并且根据对学生实际答案的分析,给出了答案的样例,有利于阅卷者准确判断学生的答案处于哪一水平,有效地降低了阅卷者的主观效应,具有较强的可操作性。

历史

运用 solo理论来命制历史试题,目的是为了考查学生的高级历史思维能力。根据 solo分类法设计出来的历史试题,在题型和题目表述上与传统的历史试题相比并没有太大的差异,根本的区别在于评分标准的制定。

  下面以1991年的一道高考题为例,说明两种评分方法的重大差别。

   1991年高考第 46 题:

以下是英国历史学家马士的一段话:“当中国人实行一种激烈的禁烟运动而使危机加剧的时候,战争果然就来到了;可是它并不是为了维持鸦片贸易而进行的斗争,它不过是一个持续了二十年,并且要决定东方和西方之间应有的国际和商务关系的斗争的开端。”(摘自《中华帝国对外关系史》)回答:(1)“危机加剧”是因为“中国人实行一种激烈的禁烟运动”而引起的吗?为什么?(2)马士认为鸦片战争的目的是什么?你认为这一 “目的”的实质是什么?

其中第1问的答案是:不是。(1 分)“危机加剧”的原因是英国坚持鸦片贸易,破坏中国的禁烟运动。(1 分)

这是一道较成功的历史题目,既考查了学生的材料分析能力,也考查了学生透过现象看本质的抽象思维能力。但是,对于这样的一道思维含量较大的题目,评分标准却采取了一种简单化的做法,把复杂的思维内容浓缩成为一句话,在评卷实践中势必成为一种按图索骥的简单游戏,最终是无法判别学生思维能力的高低。如果依照solo 分类法来操作,第1问的评分标准可以表述如下:

本题可以按以下五个层次来给分:

第一层次:仅仅回答“不是”而没有做任何理由阐述的,给 1分。

第二层次:回答“不是”并提供了一个言之成理的理由的,给2分。例如:中国人民的禁烟运动是正义的运动,它只能成为英国发动战争的借口,而不是战争发动的原因。

第三层次:回答“不是”并提供了两个以上言之成理的理由的,给3分。例如:中国人民禁烟是正义的,不是战争爆发的原因。英国发动战争是为了把中国变成其殖民地。

第四层次:回答“不是”并提供了两个以上言之成理的理由,而且能够综合表述这些理由的,给4分。例如,中国人民禁烟是正义的行动,不是战争爆发的原因,战争爆发的原因是英国要把中国变为它的殖民地,马士把责任归结为中国人民的禁烟,目的是为英国的侵略行径辩护。

第五层次:回答“不是”并提供了两个以上言之成理的理由,并且能够从理论的层面合理解析问题的根本原因,给5分。例如,从资本主义的扩张性分析,可知英国作为一个资本主义国家急需海外市场和殖民地,因此发动战争具有必然性。又如,从直接原因和根本原因分析,中国人民的禁烟只是战争爆发的直接原因,根本原因在于英国资产阶级的侵略本性。再如,从必然性和偶然性的关系原理分析,禁烟只是一次偶然的事件,而英国的侵略具有必然性,即使没有禁烟运动,英国也会找别的借口来发动战争。

solo评价与传统评价的根本差别在于答案的开放性。一道题目是否具有开放性,主要不是看题目怎样提问,关键是看评价者如何去评价。如果答案本身是封闭的,那么再开放的提问也是禁锢被评价者的思维的。因此,solo评价法所做的工作主要是改变答案的评分方法。具体说来,solo的答案设计方法有以下三方面特点:

第一,根据思维层次来打分,而不是根据采分点来打分。思维层次的划分根据题目的思维含量来确定,但一般应该有三个以上的层次。关键点是确定思维的层次。

第二,不提供样板式的标准答案,阅卷教师不必再拘泥于标准答案的表述,而应该深入领会该题目的思维层次划分的依据和方法。

第三,为了帮助阅卷教师更好地理解题目的思维层次,答案在每个层次的后面都提供了具体的答题例子。在大规模阅卷之前应该有一个试评的工作,目的就是通过抽样评卷来充实各层次的例子,以方便一般教师更好地操作。

(二)利用solo编制客观性试题

利用solo理论编制客观性试题的关键在于选择题选项的制定。通过把四个不同的选项分别设计成表征不同表达水平的描述,根据学生选择的选项不同,区分它们实际思维结构的复杂程度。这样,就可以改变传统的选择题只能做出正确与错误的判断,不能区分学生的思考过程和实际思维水平的问题,有效地测查学生高水平的思维能力。

客观性选择题中的四个表征不同水平的选项可以通过两种方式来获得。一种是可以通过学生对相应问题的主观评述,把大量的答案加以类型化,选取典型的答案转换成选择题的选项。第二种是根据教育专家对儿童经验的把握,建立代表不同水平的选项,然后再通过大量的测试对选项的合理性进行检测,证实学生的认知反应。这两种方式没有本质的区别,都是要保证四个选项能够有效地代表学生可能出现的四种不同的思维水平。不论是采用这两种方式的哪一种,都可以在一定程度上测量出学生答题过程中思维结构的复杂程度,区分学生高水平的思维过程。同时,也保持了客观性选择题的各种优势。

例如对上面的例子“这个故事主要讲了什么”,根据对学生答案整理的结果,可以很容易的将这道题改编成一道选择题。“你认为这个故事主要讲的是:”A小松鼠很贪玩,春天夏天都在玩儿(单一水平)。B小松鼠很重视和兔子的友谊(前结构水平)。C在兔子的帮助下,小松鼠吸取教训,知道要储存过冬的粮食了(关联水平)。D去年冬天小松鼠因为贪玩,没有储存过冬的粮食,所以很狼狈(多元水平)。

这四个答案分别是根据学生在主观性试题中不同水平的回答加以类化得到的,因此,它不存在以往客观性选择题不能反映学生思维过程的缺点,反而是可以准确地反映学生实际的阅读状况和阅读能力水平。同时,它也保持了客观性选择题的各种优势。具体分析这道题目:

如果学生选择的是B选项,那么说明学生根本没有读懂文段的意思,他对于文段的理解是处于前结构的。

如果学生选择的是A选项,由于选项中的句子就是文段中的原话,那么可以说明学生只注意到了文段中的一个方面,并没有对文段形成整体的理解。学生在这道题目上的反应说明他在整体感知这个能力上所处的水平是单一结构的。

如果学生选择的是D选项,那么说明学生只读懂了文章的前半部分,对于前半部分中小松鼠的行为进行了联系和整合,但是对于后面一部分的内容,还没有进行整合,对文章的理解还不够全面。学生的这个反应说明他在整体感知这个能力上所处的水平是多元结构的。

如果学生选择的是C选项,那么说明学生对文段的全部内容都进行了很好的整合,真正理解了文段的内容。学生的这个反应说明他在整体感知这个能力上所处的水平是关联结构的。

但是不论学生选择了A项、C项、或者是D项,我们都不能简单的评价说学生的答案是对的或者是错的。只能说选择A和D选项的学生只答对了题目的部分内容,他们在整体感知这个能力上还没有达到关联水平,还需要进一步发展。并且,通过这道题目对学生认知发展水平进行的评价,只能说明他们在这道题目所测查的整体感知这个能力上的认知发展水平,并不能说明他们在其它能力、其它领域中的认知发展水平。

当然了,我们也可以采用第二种方式命制选择题的选项。只要我们首先根据专家对学生能力发展的把握命制出代表不同水平的选项,然后再通过大面积的测试验证题目的有效性就可以了。

总之,将SOLO学习结果分类系统的分层思想应用于主观性试题评分标准的制定以及客观性试题选项的命制,可以有效地减少主观题评分过程中评分者主观意识对于评价的影响,减轻评分者效应;可以有效地提高不同的选项对于学生思维过程和思维水平的区分能力,更大地发挥客观性选择题的功能。这对于学业评价中测试方法有效性的充分发挥具有十分重要的意义。

 

五、solo的特点及问题分析

(一)Solo的特点

1)后一水平是以前一水平为基础的,允许学生在不同学科、不同问题上有不同表现。

在SOLO学习结果分类系统中,后一水平必须建立在前面的几个水平的基础上。例如,学生达到多元水平的反应必然是以其达到了单一水平的反应为基础的,而学生如果没有达到多元水平,他也一定不能达到更高一级的关联水平或者拓展水平。并且,当学生获得新的认知方式时,新的认知方式并不会取代旧的认知方式,而是与旧的方式同时发展。

根据这一观点,学生在不同认知领域中能力的发展可能具有不一致性,儿童在同样的年龄在不同领域会有不同的发展。因此,在SOLO学习结果分类系统中允许学生在某一个问题上达到了关联水平,而在其他问题上却只能达到较低水平。高一级的水平仅仅代表了学生所能达到的最高水平,而不是所有的学科领域都能达到的水平。

2)区分质的差异,不作量的比较,有利于评价学生思维水平。

SOLO学习结果分类的标准是对学生对问题的反应进行质的比较,是以结构的复杂性(指儿童反应水平上的结构差异)来测量认知结构的质量。而不是对学生的反应进行量的多少的比较。比如一道阅读题,并不是学生写得越多,他的能力就越强,并不是学生答对的题目越多,它所处的认知水平就越高。如果他答对了10道题目,其中有9道题目都是属于简单记忆水平的,或者说是单一水平的,那么也不能说他比那些答对了一道多元题目的学生水平高或者低,只能说明他在题目所考察的内容上处于单一水平。这样的测量方式更有利于对学生的思维水平作出客观的评价。

3)对学习反应结果分类,有利于评价发挥反馈作用。

SOLO学习结果分类是对学生对问题的反应结果进行分类,而不是对学生分类,它并不将学生之间进行比较。SOLO只能评价出学生在某一道题目上、某一个内容上是处于一个什么样的水平,但是并不能对学生作出整体上处于什么认知水平的评价。例如,孩子在一道题目上的反映是单一水平的,那么我们可以得出结论,这个孩子在题目测试的内容上所处的水平是单一水平,还需要进一步发展。但是对于学生其他方面的能力,则需要通过其他的题目才能得出。

因此,可以说这样的分类方式属于诊断性的分类模式,通过这种题目的测试,不仅可以告诉学生得了多少分,更重要的是它能使老师明白学生哪些能力发展的好,哪些能力还存在问题,存在什么样的问题,以及应该怎样改进。这样就有利于教师根据评价反馈的结果调整自己的教学,学生根据评价的结果调整自己的学习。

4)有利于充分发挥不同类型试题的功能。

SOLO理论认为,评价应该更多地关注学生在回答问题时表现出来的思维结构,而不是学生在答题时使用的语言本身。根据这一观点,我们可以按照学生思维结构的不同水平制定主观题的评分标准,或者是客观题的不同选项,根据学生相应的表现区分它们实际思维结构的复杂程度。从而使主观性试题的评分标准相对独立于知识点之外,减轻主观题的评分者效应;使客观性选择题不只能区分学生的对与错,还可以区分学生的多个思维水平,有效地测查学生高水平的思维能力。充分发挥不同测试题型的功能。

 

(二)对Solo的反思

1)评价低层次的能力效果差。

SOLO理论对于等级作了较为详细的描述,所以用它来评定那些有着较为明显的步骤特征或等级层次分明的探究型开放题,其效果会比其它方法更好。但是评价低层次的能力效果比较差。比如,要求学生记忆的内容,谈不上学生处于单一或者多元的水平,这时SOLO并不能发挥它的优势。

2)在有了学生的答案之后,才能对学生的表现进行评价。

由于SOLO评价的对象不是学生,而是学生在具体题目上的表现,所以,这就限定了一定要在有了学生的答案之后,才能确定这个答案是处于那个认知水平上的。教师在没有看到学生的答案之前,并不能事先定好评分的要求。正因如此,在基于SOLO编制客观性试题时,必须以学生对相应测试内容的口语报告结果为基础。

3)缺乏对试卷整体的考虑。

由于SOLO学习结果分类系统关注学生在一个具体问题上的反应,并且,只有在学生做出反应之后才能利用SOLO理论对反应进行分析,所以当它应用于整份试卷的评价时,它只能分析学生在每道题目上的表现,却难以对考查内容进行全面地考虑。SOLO理论对于整份试卷中考查点的设置作用不大。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多