分享

系统整合视角下教育大数据应用研究

 博容书屋 2018-11-16

系统整合视角下教育大数据应用研究

孙志伟,李小平

 

大数据与教育的融合推动了教育系统的创新。近年来,大数据在教育管理、教育研究、教育评价、以及教育服务等方面发挥了巨大的作用[1],研究内容基本涵盖了教育大数据内涵、教育大数据体系框架[2]、教育大数据来源等[3];也有学者研究了大数据下教学模式、学习方式的变革,建立学业预警系统[4];还有学者探讨了大数据下的学习分析技术、教育数据挖掘等[5]。

教育大数据研究的目的在于透过数据挖掘深层次的教育问题,关注的焦点不能局限在算法和数据本身,更应关注隐藏在数据背后的教育现象和规律[6]。当前,教育大数据的应用研究主要集中在利用数据发现影响问题的关键要素,研究的切入点较小,且关注的焦点停留在元素层面,未能深入探究教育结构及元素之间的关系。为此,本研究着重讨论以多视点构造锥体网络结构,并在锥体网络结构的基础上讨论各节点之间的多路径关联。通过挖掘节点之间的关联关系构建节点之间的路径结构,重构不同视点下的节点关联关系图,并以此构造数据公平的、信息平衡的、相关性科学的、自然规律完整的网状图,促进教育数据的挖掘和教育大数据的综合利用。

一、教育大数据的结构嬗变

教育大数据包含了隐含在不同信息载体中与教育相关的全部数据,如体量数据、资源数据、活动数据等不同层次的教育数据[7]。教育数据与教育现象之间存在着密切的关联,这种关联将各种教育行为、现象连接成互联互通的网状结构[8]。教育活动中任何独立的数据都没有意义,数据的价值在于体现事件的相关关系和诱导机制。囿于教学行为的独立性和以往教育数据的不完整性,以“点”为基础的教育大数据结构不能完整的反应各教学要素之间的关系。为适应和满足教育研究的需要,教育大数据结构逐渐完成了从单点到局部关联再到大型网络的结构演变。

(一)教育大数据演变之源:从单点到多点数据来源演变

在教育大数据理念提出之前,教育数据信息同样存在。以往教育研究中的数据主要关注具体问题数据和精细数据。问题数据和精细数据确保了研究的针对性和专一性,却存在研究视野局限不能全面分析问题的现象。教育大数据理念扩展了教育数据的来源和教育信息的范围。多类型、超大量的数据扩大了教育数据的外延,从观念意识层面扩展了人们对大数据的认识,多维度数据被引入到教育分析中来,数据的来源结构从单点演变成多点。

(二)教育大数据演变之网:从散点到网状数据结构演变

教育大数据不仅包含节点数据,还包括节点间的关系数据。分散的、未建立完整逻辑关联的教育数据价值密度很低。大数据理念的发展促进节点关联关系的构建,多节点互通的网状结构构建完善了教育元素的互通关系,也避免了研究具体问题时元素关系的偏向和路径权重的失衡。构建节点关系稳定的、均衡的、统一的、公平的网状结构扩展了教育数据的视野,教育数据的来源从具体事件扩展到全体教育活动。

教育大数据研究从独立的散点结构扩展到相互关联的网状结构促进了研究视角从一个节点到多个节点的扩散,视点的转移带来了新的研究视野。网状结构重构了教育大数据的体系结构和系统框架。网状教育数据结构首次探讨了教育大数据的任意原点性、数据重心的偏移性和重构视点的原发性。多视点关联的教育大数据结构扩展了教育的研究路径和分支,同时给出了教学资源、学生学习、教学管理等多元素的关联关系,为构造简约平台提供了新的思路。多元素的关联使网状结构更均衡、更稳定。

(三)教育大数据演变之体:从平面到立体数据层次演变

多节点网状关联极大扩展了数据规模,元素之间的关联关系也日趋复杂,多元素的潜在关联增加了数据量和结构的复杂性。复杂网状结构增加了数据分析和统计的难度,不规则、非结构化的数据让教育统计很难达到预期效果。根据网络结构的复杂性,将教育活动按照对象和内容等不同维度划分成多种数据层次有助于理清了元素之间的关系。构建高内聚低耦合的层次模型能清晰的反应教学体系结构和元素关联关系,促进了数据体系的规范化。在这种层次网状结构中,可以对任一个节点进行数据挖掘、统计,也可以进行两点间的相关性的分析,促进教学结构和体系的完善。层次立体网状结构如图1所示。

二、教育大数据中的锥体视点结构

视点是指观察问题的角度,教育大数据自身具有数据量大、类型多、高效性和价值性的特征[9]。大数据环境下教学视点来源多、范围广、类型多,多视点的教育大数据应用归纳了教学结构,构建了新的教学思维形态,这种结构和思维形态便于理清各元素之间的关联关系,利于通过关联关系构造教育数据挖掘的路径。在层次化网状教育数据结构中,视点元素层次明确,关联关系清晰,能直观的反应教育本身的体系架构。这种层次化网状结构固定性的反映了教育体系架构,却也影响了不同层次的元素相关关系研究。层级跨度较大的元素在研究过程中容易出现结构复杂、关联路径不清、数据冗余等问题。为解决任意点之间的关联关系和相关性问题、属性问题的研究,本文首次提出了锥体网状结构模型,利用锥体网络能理清复杂网络中元素的关联关系,重新打造动态平衡的层次化网状教学数据结构。

(一)锥体视点结构的提出

锥体视点网状结构以现行层次化网状结构为基础,突破现行层次结构的固态僵硬的弊端,根据研究需要灵活组织不同层次教学元素,动态打造立体化教学框架体系。锥体视点结构即将出发视点提升到最高层次,与其直接相关的节点位于第二层次,依次递推构建以出发视点为顶点的锥体。锥体结构打破了现行以问题和以数据为导向的数据库构建模式,引发了以大数据思维为核心的新型数据结构设计。锥体视点结构使元素层级关系设计更灵活,满足相关元素层次关系的自由组合,也易于构建以数据推动的逐级递进的数据挖掘体系。锥体网状结构可以动态调整各相关元素的层次和逻辑关系,为挖掘各元素之间的关系、发现教育规律、探索人才培养的关键路径提供了方便。

锥体视点网状结构利用各元素相互连通,层次结构动态变化的特性,为不同元素关联提供多种路径选择,是非邻接元素关联路径研究的新成果。多路径连通的锥体网状结构推动了任意点出发的资源建设和系统设计,为完善教育大数据应用提供了实践依据。如关注教育评价,可以构建以教育评价为顶点、邻接元素为第二层、其他元素逐渐向下扩展的锥体结构,直观反映出与教育评价相关的主要要素及各要素之间的层次关系。

(二)锥体视点结构的优势

教育大数据下的视点是层次性的、是逐层递进的、是逐步精细化的。网状数据结构中,各元素都可以作为新的视点开展研究。与层次网状结构相比,锥体视点结构可以动态调整,按照元素与视点的邻接关系及元素关联性强弱,锥体结构能直观反应元素的层次体系。

锥体视点具有明确的层次性、动态性。从关注教育大数据整体的角度来看,大数据视点主要包括教师、学生、管理者、教学资源和教学环境[10]。各个独立视点都可以通过相关元素构建逐级关联的锥形层次体系结构。锥体结构可以随着关注点的转变而重构,如以管理者视点分析教育问题,主要关注内容为教学质量提升、学生学习能力的培养、教学资源的优化、教学环境建设、教学效果的提升等,以教师视点分析教育问题则主要关注教学内容、教学环境、学习者特征等。教师视点下单锥体层次视点结构图如图2所示。

锥体视点具有可伸缩性,既可以关注教育整体也可以关注教育活动中的某个具体问题。单锥体是单视点下的教学体系结构,若关注教育整体可以通过将相同维度的所有视点锥体结构对接,构建完整的教学视点网络。教学视点是研究教育大数据的基本起点,只有通过不同教学视点下的锥体结构分析才能获得系统的教学数据,依据教学视点的教育数据才有意义。锥体结构是教育数据的可视化显示,是关联关系伸缩性的表现。透过不同教育视点构建的锥体结构能反映出系统中不同元素的关联关系和相互影响。数据的类型、规模和内容等都将反应不同元素之间的隐含关系。

(三)锥体视点结构的应用

教育大数据研究的重点在于通过不同的视点探寻数据挖掘的路径和方向,锥体视点为研究提供了动态的多类型选择。根据研究需要,研究者可以从任意一点或多点出发构建锥体结构。从学习者、管理者、教师等不同人员的角度去挖掘教育数据能全面的反应教育结构。教育大数据下的数据挖掘应有明确的顶层设计,能根据经验、需求和期待从不同视点提出应用方法。

锥体视点结构可以明确节点的关联和层次关系,为规划数据挖掘路径提供方便。锥体视点结构便于明确元素的立体层次关系,基于多视点锥体网状结构的数据挖掘能够适当扩展挖掘的深度和广度,通过深层次的挖掘将多种要素添加到锥体结构中来。如研究学习者的学习情况可以将家庭背景、教师备课情况等看似相关性不大的因素关联到同一结构中来。

锥体视点结构可以扩展视点的范围,突破传统单视点的局限。在传统网状结构中,也可以选择任意一点作为研究的出发点,但出发点仅能为其中一个,对于多视点研究有明显的局限性。锥体视点结构能够在网络中选择任意两点或多点提高到同一层次构成不同类型的锥体,展开研究。视点结构的动态性要求多视点下的网状结构体节点之间关联紧密,保证网状结构达到动态的平衡。锥体视点网状结构保证了结构的稳固,避免了关联路径构建中的多样性,锥体视点下的平衡状态才能全面的反应各点之间真实的关联关系。

三、多锥体网络结构的构建及数据挖掘

教育数据挖掘的基础是明确的挖掘目的和挖掘对象,从具体对象中针对性的获取数据,如以智慧课堂作为挖掘对象[11];从挖掘内容的角度看,非结构化的数据往往蕴含着比结构化数据更深层次的信息[12]。在教育数据挖掘中,专业人员比挖掘技术起着更重要的作用。教育数据挖掘的目的在于研究各元素之间的关联和因果关系,在挖掘之前必须明确挖什么、在哪里挖、为什么挖和怎么挖,为此,构建多视点锥体网状结构是数据挖掘的前提,在锥体网状结构的基础上能制定明确数据挖掘路径和挖掘方案。

(一)锥体网络结构的构建

1.确定相关元素

网状结构中(连通图)任意节点之间都可以通过不同路径关联,教育大数据是以教与学为核心的所有相关元素数据的总和。网状结构中,相互关联教育元素和内容数据较多,其中既有教育数据的核心元素,也有关联性不高的元素。教育大数据研究要根据研究对象,在网络结构中选择最相关的节点元素进行挖掘和研究,由此才能保证研究的准确性和针对性。

根据研究对象和研究问题,教学活动中不同视点间存在很大差异,通常单视点研究选择以该视点为出发节点,路径长度不超过5的所有节点元素作为数据的来源;多视点研究通常选择与两视点相关联,中间节点数不超过3的关联路径元素获取数据。确定相关元素是对研究内容和范围的初步界定,在此范围内研究内容的针对性更强,结果的可信度更高。比如研究某学科的教学资源,针对同一学科有不同的教材供选择,不同教材的编著者、教材配套资源(电子资源、课件、教学视频等)、出版社等都是与教材相关的元素。确定相关元素有利于帮助研究者明确研究维度,确定研究对象及扩展对象。

2.研究相关关系

网状结构中,各联通元素之间都有关联关系,其中关联路径的权重即为相关系数。在锥体网状结构中,邻接元素的相关系数与元素性质相关,不同类型元素之间可能存在一定差异,通常元素的关联关系以元素的相似度或不同类型元素之间的数据交流频度来计算,相似度越高,交流越频繁的元素之间相关系数越高。非邻接节点之间的相关系数通过路径关系计算,找出两个节点之间的所有连接路径,计算各路径权值关系得出。

网络结构中各节点之间的权重通过逐级推断得出,对于非邻接节点的关联度通过所有路径权重来计算。在网络结构中,相互邻接的节点之间关联关系基本稳定不变,这种保持不变的相关关系称为的绝对权重。若两节点非邻接,它们之间的相关关系可能会因为路径不同而存在较大的差异,这种不同路径下的相关系数称为相对权重。通常路径越短,节点之间相关性越强,反之则越弱。连接节点之间的层次越多,节点相关性越弱,路径权重也就越小。

3.构建权重网络

权重网络即是根据整体网络环境下各元素相关系数构建的权重均衡的网络结构,构建权重均衡的网状结构是教育大数据挖掘的前提。在权重均衡的网状结构上,研究者可以根据研究需要自主抽取相关内容组成针对性更强的、更精细化的子网络结构。综合多路径,计算节点间的相关关系是复杂网络中节点分析的关键。节点元素之间的逐层递进关系按照递归函数关系模型构造出有明确量化关系的、连续驱动的数据结构。通过完整的教学要素网络结构,可以提炼出从教学期望到教学效果之间的符合逻辑关系的逻辑序列,并逐渐细化到教学要素和教学方法。构建权重网络为研究教学现象和行为提供了依据,也有利于探讨不同教学要素对教学的影响,并以此优化教学路径。

4.确定研究视点

教育大数据研究的目的在于透过外在现象研究教育内在的关联。教育研究必须有明确的研究目的和研究对象,即有明确的研究出发点。如研究教学方法与作业评价之间关系需要在网状结构中选择教学方法和作业评价两个视点作为出发点,并从由此逐渐向外扩散,延伸到其他关联节点,并通过中间节点组成连通路径。研究视点之间构建的路径结构和关联关系能反映出视点之间的隐含信息。

网状关联结构让多视点选择成为可能,以往研究节点的存储多以树状结构为主,若研究内容属于不同分支,相关研究只能回归到根节点再去查找关联路径。这种单路径长度大并且忽略了很多其他关联元素,研究结果不能完全反应相互之间关系。如教学方法与资源类型分属教师和资源类,在树形结构中只能通过根节点教师与资源建立连接。网状结构提供了多视点、多路径的选择,这种多选择性更符合教学实际。网状结构下视点的选择是单视点结构的升级,升级后的结构模型,能将出发视点调整,形成结构明确可视的教学结构模型。

5.构建锥体结构

锥体结构是网状结构的动态调整,利用系统结构的动态调整型,以出发视点为锥点,相关元素构成逐级分化的层次体系结构。对于多视点问题研究,教育大数据可以根据研究问题选择所有与研究问题相关的节点,以研究视点为锥体的顶点,邻接节点作为锥体下层节点依次递推的构造锥体结构。锥体结构的独立互联性明确了各元素之间的相关关系,也对不同锥体元素之间的关联路径做了初步探索。锥体结构的构建促进了多视点路径的选择,也为经典网状结构的升级提供新的思路,有利于促进新型智能锥体的构建。如研究学习者学习成绩与教师、学生之间的关联关系可以选择学生视点、教师视点和成绩视点分别构建锥体结构,借助锥体层次性和关联性,分析其中的关联路径。学生、教师、成绩三视点锥体网状结构如图3所示。

(二)多锥体网络结构下的数据挖掘

1.分析视点特征及关系

锥体网状结构是在多元素网络结构的基础上提出的新型结构,它克服了多层次网状结构构造复杂,研究视点间的关联关系不清的问题。锥形网状结构利用网状结构体系的层次性,将研究节点调整到其他节点之上,视点层次和结构更明显。

锥体网络结构下的数据挖掘首先要根据研究视点构造成的锥体,分析相关元素之间关联关系,从视点的特征出发,根据研究目的将相关联元素划分成不同类型,深化分析各元素之间的相互关联关系。多视点锥体网络下数据元素关联研究以两视点元素间关联路径作为分析对象,分析多路径中各元素的关联关系。锥体思维让各元素的关联关系更明确,多锥体方法模型的提出产生了新的关联关系,这种新型关联关系将教学现象和教学问题放在数据的基础上研究,为构建新型教学系统和教学结构提供了依据。

2.制定挖掘路径

教育大数据挖掘是多来源、类型数据的统计分析,挖掘对象包括结构数据和非结构数据[13]。结构化数据的统计也是数据挖掘的一部分,通常教育数据统计仅限于与视点直接相关或路径中间元素的数据统计,对于隐含数据的处理存在较大难度。锥体网络环境下的数据挖掘根据研究视点选择研究对象,通过锥体结构能明确与锥点直接关联的元素。多视点元素之间的关联路径的构建以路径权重为基础。多锥体模型通过多元素互联的网状结构将一些看似不相关的内容链接到一起,扩展了数据挖掘的维度,有利于获得更多的数据支持研究结果。锥体网络结构的层次性让不同节点之间的关联关系和权重更明确,挖掘路径的构建即是从一节点按照强关联关系找到另一节点的过程。通过锥形网络结构不同节点之间的层次性和互联互通性扭转了单纯数据统计的被动局面。如研究教师与学生学习成绩之间的关联关系路径如图4所示。

从教师与学习成绩的关联路径来看,影响学生成绩的关键因素是教师教学能力,教师拥有良好教学能力的前提是有过硬的专业能力,而教师的教育背景成为影响教师专业能力的主因。为此,从教师角度,影响学习成绩的主要路径为:教育背景→专业能力→教学能力→学习成绩。锥体网状结构下大数据挖掘路径问题,在数据和椎体层次的基础上将一个节点到另一个节点之间的关系数据挖掘出来形成特有的数据挖掘路径,重构了教育数据框架体系。

3.数据挖掘及结果分析

教育大数据应用的目的在于通过数据反应教育现象之间的关联关系,找出提升教学效率或优秀人才的培养路径。教育大数据为教育评价提供了一种新的方法,也为新技术和新教学模式的推广提供理论依据。通过关系路径的研究能找出教学效果和教学方式、教师特征等之间的联系。教育大数据的研究可以通过对具体某成功人士的分析找出影响个人成长的多方面因素,并迁移到其他人才的培养中去。教学活动应当以人才培养为研究对象,围绕人才培养问题讨论。人才培养是人与外界元素之间不断磨合的过程,调整学习者外在的学习环境能促进学习者实现自主创新、提升个人能力。

教师教学质量是原点,学生学习结果是终点,通过对其中路径的研究,能设计产生出新的教学结构。参照路径中涉及的关键要素构建以质量为核心、评测为手段教学系统能打造出让学生受益的教学结构。通过数据挖掘寻找节点之间最强关联关系有助于选择从起点到终点的最优路径。

四、教育大数据下系统的升级再造

教育大数据的研究在新资源架构体系的基础上,首次提出了锥体网状教育体系结构,并在此结构上进行教育数据挖掘。锥体网状结构扩展了教育数据挖掘的方向和维度,产生了新的教育数据挖掘的体系架构、新的资源和管理结构,打通了原本相对独立的资源体系,构架了多元素互通的系统框架。锥体网状结构对现行资源和管理体系提出了新的挑战,它将更多元素加入到系统中来,众多相关元素组成多个相对独立的小的模块,最终系统对多模块整合,完成了整体教学系统框架。

(一)教育大数据的应用促进了教学系统的整合

传统课堂教学和网络远程教学资源系统都是结合已有教学资源数据库构建LMS(Learning Management System)系统,这是一种根据资源产生的递推式的体系结构。教育大数据下的教学系统通过研究关联关系,明确系统需要什么、要解决什么问题,将更多相关的元素加入到教学系统中来,构造多个具有明确功能的小型系统。大数据下的教学系统构建从总体视角观察学生系统、资源系统、教师系统、管理系统的关系,找到其中系统的关联路径,从教师、学生、资源、管理等多视角将众多小系统关联到一起链接成一个完整的系统。如从教师维度构建的教师信息系统结构如图5所示。

(二)教育大数据应用促进了简约系统的构建

教育大数据理念扩展了教育数据的来源和类型。在经典教育数据中,具体某个元素在教育大数据理念下也包含了大量的其他信息。数据量的激增促进相关元素的聚合,众多属于同一类的元素构成了实现某一功能的小模块。这些功能模块以相对独立的内容根据具体需要构建简约的教学系统结构,如基于元模型构建的学习资源描述体系,既符合学习资源著录标准,又满足扩展性需求[14]。简约化系统在初级阶段数据量较少、功能不够完善,在后续使用的过程中,可以通过不断完善数据和系统结构完善系统功能。由于新教学体系结构数据基础的局限性,简约系统在功能上可能存在一定局限,在使用的过程中可以通过人工干预完成系统的修复和升级。简约教学系统结构的构建可以借鉴模块设计组态原理,将相应的内容向内整合,完成相应的功能。这种模式便于根据具体教学需要快速搭建教学支持系统。简约教学系统根据数据库支持,相关问题支持,基本功能支持等,综合完善系统的主要功能,提升了系统搭建的速度,也保证了系统的针对性。随着人工智能技术的应用,基于数据构造简约教学支持系统成为新的研究趋势。如搭建简约教学系统主要考虑教学资源、方法、规则和教学案例,其他相关元素不在系统中涉及,基本框架如图6所示。

 

教育大数据的应用不局限于挖掘数据及其数据之间的关系,更是为重构教学结构、升级教学系统和系统控制提供一种新的控制模型。教育大数据研究构造了锥体网状结构图,为教育关联关系研究和数据挖掘提供了新的思路,促进了多视角出发的平台建设和以路径为基础的模型构建。这种模型和平台的建设既关注内部模块,也关注系统整体,既保证了平台建设的开放性和融合性,也防止了冗余和不合理的建设。

教育大数据的研究有助于明确教育目标与教学设计和教学结构之间的关系,并根据相关元素之间的关系,创设新的解决问题的思路。教育大数据的应用,重整了教学系统,在具体任务上,实现了通过现象推导问题、并将问题递推给教师、教材、学习环境的研究路径。以数据挖掘视点形成新的逻辑思维,有助于促进新的教学架构思维、新的资源体思维和新的教学系统管理思维的建构。


参考文献:

[1] 杨现民,李新等.学校导入教育大数据项目:动因、模式、路径与误区[J].中国电化教育,2018,(1):50-58.

[2] 杨现民,唐斯斯等.教育大数据的技术体系框架与发展趋势[J].现代教育技术,2016,(1):5-12.

[3] 杨现民,唐斯斯等.发展教育大数据:内涵、价值和挑战[J].现代远程教育研究,2016,(1):50-61.

[4] 金义富,吴涛等.大数据环境下学业预警系统设计与分析[J].中国电化教育,2016,(2):69-73.

[5] 郭炯,郑晓俊.基于大数据的学习分析研究综述[J].中国电化教育,2017,(1):121-130.

[6] 李婷,傅钢善.国内外教育数据挖掘研究现状及趋势分析[J].现代教育技术,2010,(10):21-25.

[7] 丛亮.大数据背景下高校信息化教学模式的构建研究[J].中国电化教育,2017,(12):98-102.

[8] 胡天壮.数据挖掘技术在教育决策支持系统中的应用[D].金华:浙江师范大学硕士学位论文,2005.

[9] 祝智庭,孙妍妍等.解读教育大数据的文化意蕴[J].电化教育研究,2017,(1):28-36.

[10] 张琳,李小平等.基于远程教学视点下的大数据挖掘模式问题研究[J].中国电化教育,2018,(4):41-49.

[11] 孙曙辉,刘邦奇等.面向智慧课堂的数据挖掘与学习分析框架及应用[J].中国电化教育,2018,(2):59-66.

[12] 李巍.半结构化数据挖掘若干问题研究[D].长春:吉林大学博士学位论文,2013.

[13] Educational Date Mining[DB/OL].http://www.,2018-06-23.

[14] 张吉先,单永刚等.大数据环境下学习资源元模型的研究与应用[J].中国电化教育,2015,(9):71-76.


作者简介:

孙志伟:在读博士,研究方向为大数据挖掘、新技术在教育中的应用、未来教育(220zhiwei@163.com)。

李小平:教授,博士,研究方向为大数据挖掘、智能图像处理、虚拟现实、教育技术和人工智能(lxpmx@x263.net)。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多