分享

曲阜师范大学教授谭维智:教育大数据最大问题是缺乏有价值的数据

 止观观止 2020-06-07

编者按:本文作者在高校大数据教育教学领域拥有相对成熟的教学经验、独到的教育观点及创新的教学方法。作为全国高校人工智能与大数据创新联盟常务理事,积极推进大数据教育教学工作,本文内容根据作者在'赋能大数据教育专题'分享的内容整理而成,旨在为2020年高校数据科学与大数据技术专业、大数据管理与应用专业、大数据技术与应用专业赋能。

曲阜师范大学教授谭维智:教育大数据最大问题是缺乏有价值的数据

曲阜师范大学教授 谭维智

教育大数据主要包括教学过程的数据和育人过程的数据,按照学习过程中的人分为学习者的数据和教育者的数据,按照教育功能分为教学数据、管理数据和评价数据等等。对于每一种数据都能进行细分,比如学习者的相关数据可以分为学生基本信息(座位信息、学习经历、认知状态等等)、学生行为数据(参与学习社区、在线互动情况记录及应答情况)、学习环境数据(课程目标、评价指标、学习资源、课程资源等等)。

目前,教育大数据应用最大的问题还是缺乏有价值的数据,比如教学过程的数据,教学数据的采集主要还是依赖在线教学的普及。如今,在中小学和大学中在线教学的应用还是很有限的,只有真正用起来才能产生数据,我们才能采集到有价值的数据。大数据在教育中的应用具有非常重要的价值,基于大数据的个性化教学、科学化的评价、学校的精细化管理、智能化决策及精准化的教育科研等等,这些对于促进教育公平、提高教育质量、培养创新人才都具有重要意义,宏观层面还可以为教育决策提供支持,提供监控、管理,优化教学过程,微观层面可以提供个性化的学习诊断和各种干预的策略。目前教育大数据的应用还包括教育舆情的监测、教育热点问题的追踪、国民体质的监测等等,这些都是中国教育大数据研究院正在进行的大数据研究项目。

教育大数据主要建立在学习分析的相关平台架构上,否则便无法进行系统的挖掘,技术的瓶颈的影响还是比较大的。目前应用于教育采集的技术主要包括以下几种:第一类是物联感知技术,比如校园一卡通,这种一卡通可以积累很多有用的数据,可以利用它分析学生在校内活动的轨迹、借阅图书的数量、在校园餐厅消费刷卡的情况等等;第二类是视频技术,这类技术目前运用得越来越普遍,很多学校的教室、活动场所都装了监控,可以监控每一个班级学生上课、教师授课的情况,录制的视频除了可以存下来观看,还可以结合人工智能技术对视频进行分析,比如通过人脸识别技术可以分析学生是否在学习、其注意力是否集中;第三类是图像识别技术,比如采用数码笔将学生的作业上传到云平台,接着在平台上进行相关的分析;第四类是平台采集技术,通过建立的各种平台及日志记录的方式,记录学生在平台中的一举一动。除此之外,还有一些技术对教育有着非常重要的意义,比如人的情绪数据采集技术,这种技术主要是综合人的脸部动作来判断一个人的情绪,这类技术可以涉及人的意识领域,在教育领域的应用前景是非常广阔的,甚至比一般的学习分析更有意义、更有价值。

通过教育大数据技术,我们可以量化过去无法量化的信息,使用精妙的统计学分析方法分析教育过程中的各种信息,而过去对教育过程中的各种信息,主要是靠经验、靠估量、靠课堂上学生举手和大体比例,比如语文老师布置学生在课下预习课文,但学生具体的实施情况是无法得知的。再比如课上学生对教师授课的理解程度基本是靠估量的,教师很难精确地掌握学生。学生上课的听讲情况,注意力是否集中,我们只能靠观察来掌握大体情况。传统的教学中由于班级学生人数众多,教师凭经验、传统的手段很难做到因材施教,一个教师面对七八十个学生,教师个人的能力和经验难以做到因材施教。尽管教师可以通过分析学生成绩来了解学生的学习情况,但也只能帮助教师初步了解大多数学生的共性问题,很难精准地掌握每一位学习者的情况。随着数据存储技术、自然语言处理技术、语义分析技术、数据挖掘技术等大数据技术的不断发展,利用学习分析技术可以全面记录学生的学习行为,可以利用这些数据分析学习者的学习习惯、学习方法及潜在问题,运用这些分析的结果为学生提供个性化的学习内容和自适应的学习方式。在全媒体教室中还可以实时监测学生的注意力情况,通过音频、视频数据的分析记录下学生的整个学习过程,对其学习过程进行分析。未来人工智能还能对学生的表情、语气中的情感进行分析,可以进一步掌握或研究分析学生在学习过程中的思维转换与意识。2016年,哈佛大学做了一个注意力检测头环,通过检测脑电波,并和教师的电脑联网,教师便可以及时注意到学生上课的注意力集中情况,这在平时的课堂上是几乎不可能实现的。

目前,我们对教育大数据的应用还处于初级阶段,刚刚起步,大多数学校只能提供教师备课数据库、考试数据库,稍微好一点的开始采集学生学习过程的数据,比如通过扫描仪扫描学生的试卷,在机器上阅卷并进行分析。再比如采集平时学生练习的数据,所有这些数据集中起来便可以进行分析。

从目前大数据在教育过程中的应用来看,对宏观层面把握确信的教育教学状况,了解和分析大范围教育教学趋向共性问题具有非常积极的作用。因此,目前我们对大数据分析得出的结果,它仅仅是一般性情况,考察的是大事,分析的是一般性规律。但教育的应用不能仅满足于掌握大势,我们要注意到教育的对象是人,最终要落实到每个学生身上,教育中的每个人都是不同的,每个学生都是完全不同的个体,只有符合学生特性和兴趣的教育才是有吸引力的。因此教育需要研究大数据,也需要研究小数据,大数据找规律,小数据找痛点,只有找到学生的痛点,才能对症下药,解决学生的问题。我们必须注意到教育具有特殊性,教育的对象是人,人是具有想象力、创造力的动物,每个学生都是不一样的,而且课堂上发生的事情都是偶然性的。因此,我们除了关注教育大数据之外,还要关注数据的研究。

2011年,乔布斯在与比尔·盖茨的会面中讨论了关于教育的问题和未来学的设想,他们一直都认为计算机对学校的影响小得令人吃惊,这是相对于媒体、医药和法律等其他领域而言的。美国联邦教育部部长邓肯也提出了一个类似的问题,即为什么各国政府教育信息化投入了很多,但产出和投入却不成比例。事实上直到今天,我们在教育技术学领域也无法拿出令人信服的、具有革命性的信息技术与教学能完美融合,还没有一个研究能证明学习成绩的提高确实是应用计算机的结果。

科技的发展、条件的改善使人的体能、智能退化,会使人变得更懒惰,这是无需证明的问题。比如空调的使用会使人的抗寒、抗暑能力下降。电脑的发展是否会使人的智能下降是值得我们注意的问题。2017年6月份,苹果首席执行官库克提出这么一个问题:'我不担心人工智能会让计算机像人一样思考,我更担心人类像计算机一样思考,失去了价值观和同情心,罔顾后果,这是我需要大家帮助预防的。'就教育领域对计算机、互联网、多媒体等技术的使用而言,其产生的后果目前还不得而知,多媒体对学生而言也不一定是隐患,比如数学课学生需要进行很多演算,教师需要挖掘隐藏在定理背后的思想,这并不是PPT能做到的,PPT仅仅是教学辅助书,永远无法取代传统的教学模式,它能发挥的作用最多是将概念、定理及静态动态的图片事先放到屏幕上,以便于节省时间,也可以完成传统板书完成不了的工作。但现实是多媒体不仅取代了板书,也限制了教师的思想,学生在课堂上看到的是与教材一样冰冷的符号与文字。

另外,数据分析只能告诉我们'是什么',却不能告诉我们'为什么',在教育上'为什么'要比'是什么'重要得多。学习的意义也不限于知识,但目前大数据的学习分析更多的是对显性知识以及学生掌握这些知识的行为过程分析,它在给学生和教师提供精准的学情教程的同时,也有将教学导向更经常地灌输危险。就人的学习而言,学习的意义几乎等同于生活,人的学习很多时候并非发生在学校、在使用计算机设备的时候、在教师教的过程中,学习中最重要的东西无法被数据采集到,只有在使用计算机、智能设备、互联网的时空才能产生我们需要的大数据。教育和学习的时空显然是互联网和现有的智能设备无法完全覆盖的。

数据是信息和知识经过表达、经过一定的加工或编码所形成的,能进行数据处理的都是可以表达出来的东西,但在教育上有很多是不可教、不可说的东西,也无法进行数据的处理,比如作业的批改、作文的批改等都是技术的难点。在教育过程中,除了我们所注意到的之外,还有很多偶然的学习,在学生的一生中,偶然学习的成果可能比正式教授的主要材料还重要。比如在学习历史时,一个学生可能附带学习到了有效的学习习惯、对学校的良好态度或对整个学习的爱好。但经过学习,他可能考虑到为了争取好分数可以不择手段,学生大量的、偶然的学习来源于看不见的课程,这是无法量化的、数据也无法采集的东西,比如教学大纲或课程进度表并未明文规定的,教师不讲述的、甚至不知道学生正在学习的东西等,所有这些都是教师毫无察觉的情况下进入了正式的课程,这样便导致学生看不见,教师也看不见,大数据的研究也采集不到。

通过现有的技术手段能采集到的学习数据是非常有限的,基于我们对学习的认识、技术使用的范围,那些偶然发生的学习都是很难进行数据采集的,同时,这些也是非常重要的。我们目前可以采集到的数据仅仅是各种数据中的冰山一角。值得注意的是,有时我们为了采集数据不得不采用计算机、网络等各种电子设备,课堂教学中要使用网络、多媒体教学手段,这些手段在帮助我们采集到数据的同时,其效果是不得而知的。比如国际金融组织关于电脑使用对于学生的影响相关研究发现,越是提升学校的学生与配置计算机台数比例的国家,该国学生成绩呈现下降的趋势,其中也出现学生使用计算机频率越高,阅读能力越低的情况。

很多研究证实,互联网妨碍了学习,网络将超文本技术与多媒体技术融为一体,用来发送所谓的超媒体内容,超媒体不仅是以电子形式连接起来的文字,还包括图像、声音、视频等等。很多教育专家认为,多媒体会加深理解的程度,强化学习效果,输入越多,效果越好。但也有很多研究得出了与此相反的结论,比如有些研究已经证实,多媒体所要求的精力分散进一步加剧了认知的疲劳,从而削弱了学生的学习能力,降低了理解的程度,当我们为大脑提供思考原料的同时,并非越多越好。

大数据在教育中的应用不同于其他行业、其他领域的应用,培养人的方式与制造业、通讯业、交通业有本质的不同,这些行业的对象本身就是技术的产物,甚至是技术本身,作为技术的指向对象可以被动地可以被改造,而教育的对象指向的是人,人不是技术的产物,更不是技术本身,人具有主观能动性,人只能自我改变、自我改造,人不可能被技术改变。人的学习本质上只能是自我练习、自我学习、自我成长,不仅仅是机器和技术不能取代人的自我学习,任何其他人也不能替代学生的学习和成长,人只能通过自己改变自己,而不能被技术改变。

当今很多一流的科学家告诉我们,大脑最深层的奥秘是非计算的,由于大脑意识活动的不可测,实际上也限制了我们获取人脑学习相关数据的可能性,我们能够获取的都是低质量的、边缘性的、间接性的数据。以心理学的研究为例,得到的数据都是大脑某个位置的电波,距离记录人脑真实的思想内容还很远,大脑对我们而言还是一个黑洞,人类的思想意识在其中的流动运行,我们几乎一无所知。而这正是教育至关重要的层面,是教育的根本。教育不仅仅是知识的堆积和积累,这不是人存在的根本,这些任务目前完全可以交给电脑和互联网来做,教育根本性的任务和目标是培养人具有正确的价值观和道德品性,培养人心中最核心的判断力、创造力、自由的精神、独立的人格,培养人的良知良性,而这些对技术而言还无能为力,属于技术一无所知的区域。技术背后包含知识,技术也可以操作知识、传递知识,但技术不能操作价值观,不能通达人性,技术只涉及了人性中最微不足道的角落。多媒体技术、信息技术、人工智能等等对教育而言仅仅为一种工具,其价值只体现为价值工具,是一种学习的助长手段,但教育本质上是人的自然教育,学习本质上是人的自我学习,在教育和学习的问题上恰恰是一切其他人和外在的工具手段无法助长的。

大数据的应用将使我们更加清晰地认识教育的本质,在大数据时代、技术无孔不入的情况下,教育的目的可能是保持人性,特别是保持人之为人的天性、天赋、好奇心、求知欲、想象力等等,这些是人区别于机器,不能被机器取代的根本所在。

谭维智,曲阜师范大学教授、博士生导师,中国教育大数据研究院首席专家。山东省有突出贡献中青年专家。全国高校人工智能与大数据创新联盟常务理事。近五年以来,主持国家社科基金项目2项,教育部人文社科项目1项,横向课题1项(到账经费20万元),参与省部级课题4项。出版著作4部,其中专著1部(独立作者)、合著1部(第一作者)、参著2部。在《教育研究》发表论文5篇。这些成果在学术界和社会上产生了较大影响,被《新华文摘》全文转载3篇、观点摘编1篇,人大复印资料转载5篇。研究成果获国家级奖3项,省部级奖3项,厅级奖5项,分别为:山东省社科优秀成果奖一等奖2项、二等奖1项,全国优秀博士论文提名论文1项,全国教育科学研究优秀成果奖一等奖1项(位列第六),山东省高校优秀科研成果奖一等奖3项、二等奖1项、三等奖1项。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多