分享

PISA如何测量阅读素养

 叶老师YP 2016-02-26
《中国教育报》2011年3月17日 星期

陆璟

  ■上海市教育科学研究院普教所副所长

    PISA中国上海项目组秘书长 

  由经济合作与发展组织(OECD)组织的“国际学生评价项目”(Programme for International Student Assessment,PISA),是全球范围进行的一项大型学生学习质量比较研究项目。PISA以纸笔测验衡量15岁青少年的阅读能力、数学能力和科学能力,希望了解即将完成义务教育的各国初中学生,是否具备了未来生活所需的知识与技能,并为终身学习奠定良好基础。

  PISA 2009对阅读素养的定义

  PISA第一次测评阅读素养是在2000年,其阅读素养的定义为:“阅读素养指为了实现个人发展目标,增长知识、发挥潜能并参与社会活动,而理解、运用和反思书面文本的能力。”PISA 2009的阅读素养定义为“为了实现个人发展目标,增长知识、发挥潜能并参与社会活动,而理解、使用、反思书面文本的能力和对书面阅读活动的参与度。”与PISA 2000相比,PISA 2009在两个方面扩展了对阅读素养的界定:

  ● 包括了电子文本的阅读。PISA 2009对“书面文本”(written text)的理解扩展了,包括手写的、印刷的,也包括电子媒体呈现的文字或附有文字说明的图片内容。但不包括录音和录像,也不包括没有文字说明的图片。

  ● 包括了阅读的动机、态度和行为因素,PISA称之为阅读参与度(Engagement in Reading)和学习策略(Learning Strategy),指的是阅读的兴趣、时间、广度、方法等。OECD报告认为,阅读参与度和有效的学习策略不仅是影响阅读表现水平的关键因素,而且它们本身就是重要的教育结果,它们不仅会影响学生青少年时期的生活质量,还会影响他们进一步受教育的决定,以及抓住就业机会的能力。

  PISA 2009阅读素养测评框架

  阅读素养测评包括试题本和问卷两个部分,阅读试题本主要评价学生对不同情境、不同形式的文本的认知能力,问卷则主要了解阅读参与度和学习策略,阅读电子媒体文本的能力则通过“电子阅读能力测评”选项来评价。PISA测评的重点在于应用阅读能力解决实际问题或学习新知识的能力,而不是阅读技巧本身,因此并没有对学生最基本的阅读技能进行测评。

  PISA阅读素养测评框架主要包括3个主要特征:文本(texts)、认知方面(aspects) 和情境(situations)。因为阅读的要素之间并不是完全独立的,所以这些分类并不是绝对的。但是区分这些主要特征有利于覆盖多种维度,从阅读素养的不同方面开展全面而深入的测评。图1说明了框架的主要特征和它们之间的关系,PISA阅读测试题目类型和内容的分布必须符合PISA测评框架要求的分布。

  第一个主要特征是文本,指所覆盖的阅读材料的范围。可以进一步分为4个子类别:媒介、环境、文本形式和文本类型。每个子类别又可分为更具体的类别。其中,文本形式分为4种:连续文本、非连续文本、混合文本、多重文本。

  ● 连续文本:由句段构成的文本,句子是文本的最小单位。占此次阅读测试内容的60%。

  ● 非连续文本:与连续文本形式不同,不是以句子为最小单位,需要不同于连续文本阅读策略的文本,也可看作是由表单构成的文本。包括清单、表格、图表、图示、广告、时间表、目录、索引等。占此次测试内容的30%。

  ● 混合文本:由连续文本和非连续文本共同构成的单篇文本。占此次测试内容的5%。

  ● 多重文本:由几篇相对独立的文本构成,这些文本可以是连续的,也可以是非连续的,文本与文本之间的关系比较松散或不明显,甚至可以互相矛盾。占这次测试内容的5%。由于这次测试中的多重文本都是由连续文本构成,因此在制定阅读分量表时归入连续文本量表,混合文本试题要求学生既要参考连续文本部分,又要参考非连续文本部分,这些试题没有归到任何一种分量表中。

  第二个主要特征是认知方面(见表1),指决定读者怎样处理文本的认知方法,包括思考策略、方法或目的。PISA 2009区分了3个方面:访问和检索、整合和解释、反思和评价。

  第三个主要特征是情境,指文本和与文本相联系的试题的背景,以及作者写该文本的用途。

  PISA评价的是广义的阅读素养,不仅仅是语文阅读,而是把阅读作为学习其他内容、为生活作准备以及参与公共活动的工具,体现了“大阅读观”。根据阅读的目的或作用,可以把PISA阅读测试涉及的情境分为个人、公共、教育、工作等4种:

  ●个人:为了满足个人兴趣而进行的阅读,例如小说、传记;

  ●公共:为了获取公共信息或参加大型社会活动而进行的阅读,例如官方文件、公告;

  ●工作:为了做工作或完成某项任务而阅读,例如招工广告、说明书、时间表;

  ●教育:为了学习新知识而阅读,阅读是一项较大的学习任务的一部分,阅读是为了获取信息来完成该学习任务,比如学科教材。

  对于这4种情境的具体说明和在PISA测试中的分布比例如表2所示。有些阅读材料可能在不同的情境中都会涉及到,比如图表和表格,因此还要结合具体内容来判断这些材料属于哪种情境。

  PISA阅读素养测评结果报告

  学生的阅读素养包括阅读表现、阅读参与度和阅读策略。阅读表现可以从3个方面显示,一是根据PISA 2009全部阅读试题构建阅读素养量表,也叫总量表或综合量表,比较各个国家和地区的阅读平均成绩和百分位数分布,研究各国义务教育末期学生的阅读能力高低和差异大小。阅读素养首次作为主要测评领域开展全面测评是在2000年,PISA 2000的阅读量表成绩将作为今后比较的基准。因此,PISA 2009阅读量表的分数是根据与PISA 2000的等值关系来确定的,以2000年OECD各国的平均成绩为500分,标准差为100分。二是根据阅读素养量表成绩,把学生分为若干精熟度水平(proficiency level,过去称为能力水平),说明学生在阅读方面能够做什么,分析各个国家和地区达到各级水平的学生比例,评估各国在阅读素养上的高端竞争力,以及有多少学生还没有达到适应未来社会需要的基本阅读素养。三是比较阅读素养各个分量表上的成绩和精熟度水平分布。由于阅读是PISA 2009的主要领域,题目量最多,所以不仅有综合量表成绩,还有3个认知方面的分量表成绩和两种文本形式的分量表成绩。通过分析各个国家和地区的相对优势和薄弱环节,可能会发现课程设置上的优势和问题,使各国从别国的成绩中反思自己的教育,寻找更有效能的教育政策。

  这里对阅读精熟度水平作些说明:

  为了更好地对学生的分数作出解释,说明达到某个分数的学生能够做什么,学生的精熟度水平和试题的难度被分为相对应的7个等级水平。1b级是最低水平,往上依次是1a级,2级,3级,4级,5级和6级。达到某个水平的学生在全部由该水平试题构成的测试中至少能答对50%的试题,完成该水平以下试题的可能性更大,但是不太可能完成该水平以上的试题。例如,在一个假定都是由3级水平试题构成的测试中,达到3级水平分数的学生预计能够答对至少50%的试题。因为一个水平覆盖了一定的难度范围和精熟度要求,所以在该水平底端和顶端的学生能够答对的概率是不同的。位于某个水平底端的学生正好能够答对该水平全部试题中50%的题目,而位于某个水平顶端的学生很可能可以答对70%的试题。

  区分精熟度水平的意义还在于能够关注顶端学生的测评。全球产业竞争结果表明,具备高层次能力对新技术和创新的产生是最关键的。相对于“一般”的个体,具备高层次技能的个体在知识的创造和应用中会产生相对大的外溢性。这反过来也表明,投资于优秀生可以使所有人都受益(Minne et al., 2007)。

  经合组织把各国达到最高精熟度水平的学生比例看作这些国家未来竞争能力的基础。反过来说,几乎没有学生处于最高水平的国家则可能会因此面临未来的挑战。此外,处于最低精熟度水平的学生比例也要引起特别的注意,因为这意味着人力资源负担的大小和所要投入的补偿资源的多少。

【阅读样题】

  PISA 2009阅读样题及点评

  样 题

   《学生看法》这一单元包括了5篇简短的议论文,都是学生们关于太空研究的一些看法。

  世界上有很多人,正因饥饿和疾病而濒临死亡边缘,但我们只关心未来的发展。当我们试图忘记这些人而不断继续向前时,我们漠视了他们的需要。每年,大公司都将大笔金钱投入到太空事业的研究。如果将这笔用于太空探索的金钱,改用在有需要的人身上,而并非用在贪心的人身上,广大人民的苦难必定得以减轻。 ——小玲

  

  对很多人来说,太空探秘的挑战是灵感的来源。数千年来,我们都在幻想天堂的美妙,渴望伸手触摸星星,渴望与一些只在幻想中存在的生物沟通,渴望知道……我们是孤单的吗?太空探索就是一种学习,而学习就是推动世界前进的力量。当现实主义者不断提醒我们眼前的问题,梦想者却拓展我们的思想空间。就是这些梦想家的远见、希望和渴望,引领我们走向未来。 ——小碧

  

  我们破坏雨林,因为那里埋藏着石油;我们在神圣的土地上开矿,只为得到铀。那么,我们还要为解决自己所造成的问题而去破坏另一个星球吗?当然要!太空探索强化了一个很危险的信念,就是我们可以靠不断增加的支配环境能力来解决人类的问题。如果我们始终知道附近有另一个星球正等待被掠夺,那么人类便会很自然地不断滥用天然资源,如河流和雨林。我们对地球的破坏已经够多了,不要再打外层空间的主意了。 ——达达

  地球资源正快速地耗尽,而地球人口却以显著的速度增长,如果我们仍然保持现在的生活方式,生命将无法延续。污染导致臭氧层穿了个洞,肥沃的土地已所剩无几,不用多久,食物来源也将随之消失。现在人类已面对因人口过多而出现的饥荒和疾病问题。太空是一个广阔的空闲领域,我们可以加以利用。借着支持太空探索,终有一天,我们可以找到另一个可居住的星球。目前,这似乎是不可想象的。但太空漫游这一想法也曾被认为是不可能的。为了解决当前的问题而停止太空探索,是狭隘和短视的。我们不单要为这一代着想,还要为世世代代着想。 ——小力

  

  忽视太空探索的好处人类将遭受重大损失。深入了解宇宙及其起源的机会十分宝贵,不容错失。对其他天体的研究已让人明白到地球的环境问题,假如不控制我们的活动,那么不知地球将来会何去何从。 研究太空旅行有间接的好处。激光和其他医学治疗方法的发明可以归功于太空研究。很多物质如特富龙(teflon)都是人类为了太空探索所研究出来的。这些太空研究所创造的新技术,给所有人都带来直接的益处。 ——嘉嘉

  

  以上短文是由毕业班学生所写的,请参考内容并回答以下问题:

  问题:

  想想这5名学生所表达的主要看法,你最认同哪一位学生?

  学生姓名:      

  试用自己的文字,以你自己和这个学生的主要观点,来解释为什么你选择这个学生。

  PISA 2009的阅读纸笔测试有130多个试题,被分为7个单元组,每个单元组大概需要半个小时做完。阅读单元组和数学、科学单元组放在一起,组成13套试题本,每本试题本包含4个单元组,每个学生只需做一本试题本,答题时间是2小时。由于阅读是PISA 2009的主要测试领域,所以每个试题本至少包含一个阅读单元组。

  PISA试题本是按照一个个单元组织起来的,每个单元由一段引导材料和3-5个问题构成,引导材料包括文本、表和(或)图表,问题针对上述材料的各个方面。

  问题有不同的形式,但阅读、数学和科学这3个测评领域都有约40%的问题需要学生自己构建答案,答案或简短(简答题)或较长(开放式问答题),让学生可以有不同的、个性的回答,还能评价学生支撑观点的理由。测试中还有8%的题目,要求学生根据预先确定的一组可能的回答来自己构建答案(封闭式问答题),评分只有对错之分,其余52%的题目都以选择题的形式出现。

  

  评分标准:

  题旨:反思文章的内容,以自己的知识与价值观,评价篇章所申述的论点。

  满分标准:对所选学生的立场(有关太空探索)理解正确,并解释认同该学生说法的原因。要指出该名学生的论点与其他学生有何不同(例如:要确切说明该学生的立场:赞成或反对太空探索),答案必须通过以下方法,直接或间接指出所选学生的其中一个主要论点

  (1)  提出自己的论点(在此情况下可以直接引述篇章的有关句字,或以自己的文字去复述意思),和(或)。

  (2)以自己的文字去解释或概括该学生的论点。

  以下是每名学生的主要观点:

  小玲: 必须清楚表明或间接指出小玲反对太空探索,并直接或间接指出她所持的论点:我们应该把用于太空探索的金钱,改用在有需要的人身上。

  ● 帮助地球上的人比浪费金钱去进  行太空探索重要。【以自己文字去复述小玲的意思】

  ● 小玲——我认为我们在把钱花在太空探索之前,应该关心一下我们的世界。我明白太空探索的重要,但我们更应帮助受到疾病与饥荒威胁的地方。【用自己的文字去概括小玲的论点,还要加上自己见解】

  小碧:必须清楚表明或间接指出小碧赞成太空探索,并直接或间接指出她所持的观点:太空探索是人类成就的正面表现。可以指出小碧认为应该关心长远发展这一点,但必须直接或间接指出小碧的立场与小力不同。

  ● 小碧——“太空探索就是一种学习”。我认为拓展视野并无危害。【直接引用文章中的句子并加上自己的见解】

  达达: 必须清楚表明或间接指出达达反对太空探索,并直接或间接指出他所持的观点:太空探索会造成环境破坏,人类会破坏太空,或探索太空会鼓励人类破坏地球。接受下列答案:达达认为改善地球环境是首要的,我们需要改变我们的态度。

  ● 达达——我同意他的看法,因为他关注地球环境,也认为我们不应骚扰外层空间。【以自己文字概括达达的论点】

  ● 达达:达达说我们不应再破坏环境,我想这是地球面临的一大问题。【概括了达达的主要观点,还加上其他论据,显示学生明白达达对太空探索所持的看法】

  小力: 必须清楚表明或间接指出小力赞成太空探索,并直接或间接指出他所持的观点:人类要找另一个可住的星球,和(或)生命将不能在地球延续下去。可以指出小力关注环境这一点,但需直接或间接指出小力的观点与达达不同。可指出小力认为应该关心长远的发展,但直接或间接指出他的观点与小碧不同。

  ● 小力:我同意小力的说法,因为除非我们愿意面临绝种这一命运,否则当我们把地球彻底破坏后,我们便无处容身。【以自己文字转述小力的主要观点】

  嘉嘉: 必须清楚表明或间接指出嘉嘉赞成太空探索,并直接或间接指出她所持的观点:太空探索可让知识增长,和(或)我们可以把从太空探索所得的应用到其他地方。

  ●嘉嘉:借着太空探索,我们无时不以不同的方式扩展我们的知识。【概括了嘉嘉的主要观点】

   点评:

  《学生看法》这个单元是在最后一学年的学生写作的基础上编制而成的,所以该文本从情境的角度被归类为教育的情境。组成这个单元的这几篇短文都是连续文本,但是他们彼此是相对独立的,为了评价的目的被并置在一起,因此在文本形式上属于多重文本。文本提出了观点和建议,并试图说服读者接受,因此在文本类型上属于议论。

  以上样题是典型的评价和反思问题,这个任务要求学生利用他们自己的知识和信仰来评价作者提出的论点,比较文本的内容而不是形式。学生要得分的话,就要证明他们理解了某个作者提出的主要论点,并通过提供自己的支持性论据,或总结或介绍作者所提出的论据,为某个作者的立场辩护。

  无论学生提及哪一位作者,只要与评分(编码)标准中所概括的原则或例子相符,就可以得到满分。这体现了PISA阅读开放题评分的特点:一是鼓励学生阐发自己的见解,不要求面面俱到,也不要求符合主流的观点。学生可以各抒己见,只要证明自己理解了文章和问题,并且答案合理,就可以得到满分,因此有利于学生发展个性,提出具有创造性的想法。二是在结合学生自己的经验和理解的同时,也必须体现出对文本内容的理解,不能与文本无关。

  (本文样题来自PISA中国上海项目组,由陆璟点评)

  【阅读分级】  

  阅读精熟度水平概述

  为了说明达到某个分数的学生能够做什么,学生的精熟度水平和试题的难度被分为相对应的7个等级水平:

  6级水平的学生有很高的阅读技能。他们能对文本进行精细化分析,这不仅要求详细了解明确的信息,而且要深刻理解隐含的信息,以及能够在更高的概括水平上反思和评价所阅读文本。达到这一水平的学生能够成功地完成阅读测评中几乎所有试题,证明他们能处理许多不同类型的阅读材料:他们的阅读面很广,不仅能阅读在结构和文本特征上典型的、熟悉的内容,而且能从以非典型格式呈现的不熟悉的内容中吸收信息。PISA所界定的最高水平读者的另一个特点在于,他们在面对新信息时能够克服先入为主的看法,即使这些新信息是与预期相反的。他们能识别出文本提供了什么,包括明显的和较微妙的信息,同时能够利用超出文本的深刻理解,用批判性的观点来看问题。这种吸收新内容并且与评价相结合的能力对知识经济极为有价值,知识经济依赖创新,并且要能够利用所有可获得的证据进行细致入微决策。因而,达到这一极高阅读水平的人的比例受到极大关注。

  5级水平的学生能够处理在内容或形式上不熟悉的文本。他们能够在这类文本中找到信息,详细地理解文本,并推断出哪些信息是与任务相关的。他们还能够批判性地评价这类文本,并建立假设,利用专门的知识,包容与预期相反的概念。检查5级水平学生能答对的题目后发现,这一水平的学生可以被看作是明日潜在的“世界级”知识工人,一个国家达到这一水平的学生比例关系到这个国家未来的经济竞争力。

  4级水平的学生能完成复杂的阅读任务,例如查找隐含的信息,从有细微差别的语言中建构意义,以及对文本作批判性的评价。在这一水平上,访问和检索试题要求学生查找与组织若干条隐含的信息;整合和解释的试题中,有些要求结合对文章整体理解来解释文本某个部分中有细微差别的语言的意思,有些要求在不熟悉的背景中理解及应用分类;反思和评价试题要求读者运用正规知识或公共知识对文本提出假设或作批判性评价。读者必须能够准确理解内容或形式上不熟悉的长文本或复杂文本。

  3级水平的学生能够完成中等复杂程度的阅读任务,例如查找多条信息,在文本不同部分之间建立联系,并将它与熟悉的日常知识相联系。在这一水平上,访问和检索试题要求学生查找满足多种条件的几条信息,有时要认识到满足多种条件的几条信息之间的关系;整合和解释试题要求学生结合文本的几个部分来确定主要观点,理解某种关系,或解释某个词或短语的含义。他们在比较、对比或分类时要考虑许多特点。通常所需要的信息并不突出,或者有许多竞争性信息,或者有其他文本干扰,例如与预期相反的观点或负面的措辞;反思和评价试题要求联系、比较和解释,或者要求学生评价文本的一个特点,有些题目要求读者对熟悉的、与日常知识有关的文本表现出精细的理解,还有些题目不需要对文本的深入理解,但是要求读者利用文本之外的不常见的知识。

  2级水平的学生能答出的试题,例如,访问和检索方面,查找满足多种条件的信息,围绕一个单一的特征进行比较或对比,理解文本中指定的某个部分的含义,即使是在信息不明显的情况下。有的题目要求学生查找一条或多条信息,这些信息可能需要推断,并且可能需要满足多种条件;整合和解释方面,有的题目要求学生确定文章的主要观点,理解关系,或者解释文章某个限定部分的意义,有时信息不明显、读者必须做出低层次的推论,有些题目要根据文本的某个单一特点进行比较或对比;反思和评价方面,要求学生利用个人经验和看法,在文本或外部知识之间做比较或做一些联系。

  1a级水平的学生能够查找在文章中相当明显且明确表示的几条信息,在熟悉主题的文章中,能确定文章的主要观点,并且认识到这类文本中的信息与他们的日常经验之间的联系。这一水平的任务要求学生查找一条或几条独立的信息,这些信息表述是明确的,或者在文本信息和常见的日常知识之间作出简单的联系。通常,需要的信息在文本中是明显的,并且几乎没有竞争性信息,即便有也是很少的,学生们被明确地指向试题中或文本中的要考虑的相关因素。

  1b级水平的学生能够在内容和风格熟悉的简单短文中找到明确表示的信息。他们能作出低水平的推论,例如,即使在没有说明的情况下,也能在两个句子之间确定因果联系。访问和检索试题要求学生在背景和文体都熟悉的、句法简单的短文中查找一条简单的明确表示的信息,例如一个故事或一个简单的列表。文本通常给读者提供支持性信息,例如重复的信息、图片和熟悉的符号,竞争性信息极少;整合和解释试题一般要求学生在相邻的几条信息之间作出简单的联系。

  (陆璟译自OECD PISA 2009测评结果报告)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多