基于深度学习的学生异常行为
智能预测系统研究
项目的研究目标与研究内容
项目的研究目标和主要内容
设计并实现以学生“”特征库为核心,学学生异常行为预测系统特征的多维行为特征,分层模型,学习算法建立学生行为预测模型,并开发整有并行化能力的生异常行为预测系统此,本课题
(1)数字化校园建设积累了丰富的学生行为数据,以这些数据为基础分析系统业务流程,设计智能预测系统结构,构建学生“画像”特征库。
(2)设计基于深度学习
(3)构建Spark大数据生态环境,并在上述理论研究基础上开发基于Spark的学生异常行为智能预测系统。
功能指标
数据融合:生数据融合,能够将学生成绩、教务考勤、、图书借阅网络等多种数据行统一抽取、转换与清洗于。画像:生形成学生信息一张图于老师全方面地了解学生。为预测生活学习因素导致的心理行预测于老师加强心辅导,防学生生过激行为
智能检索:生信息的智能检索进行与关联搜索,同时可对搜索词进行语义理解和意图识别,并能进行自动纠错。
指标
系统扩展性:能够实现与最新版本的主流数据库产品(如IBMDB2、Oracle、MySQL等)的数据互通;满足云平台架构要求,支持虚拟化资源的横向扩展。
数据可靠性:数据采集清洗后有效信息不低于90%;系统间、设备间的信息交互准确率不低于90%;学生异常行为预测准低于种于项目的研究方法和技术路线
学生“”特征库
着各高校园建设的断深入,了丰富的学生行为数据,包括学生成绩、教务考勤、、图书借阅网络等多种数据对学生大数据进行挖掘和关联分析,从学生消费规律、生活习惯指标、学生成绩、日常行为等挖掘分析出学生的学习生活行为信息,学生“”特征库。
学习
深度学习是机器学习的一个分支,许多传统机器学习算法学习能力有限,数据量的增加并不能持续增加学到的知识总量,而深度学习系统可以通过访问更多数据来提升性能通过发现经验数据中错综复杂的结构进行学习。次研究生维行为,分层模型,利用回归等方法建立学生行为预测模型,学生的为
在对学生行为进行分类时-means聚类通过计算类内样本点到类簇中心点的距离的平方和来评估聚类的效果,它只关心了类簇内各样本的相似性,而缺乏考量聚类结果类簇之间的相异,-means的基础上进行优化分类的准度
实现算法并行化
Spark是由UCBerkeleyAMPlab所开源的类hadoopMapReduce的通用分布式并行计算框架。不同于MapReduce,优化了MapReducer的中间结果全部持久化到磁盘的过程,减少了少量数据迭代式处理过程中的IO瓶颈,很大程序上提高了Spark对大数据处理的实时性,是基于内存的大数据并行计算框架。
由于本文针对学生进行聚类细分数据量较大,同时为了以后的更大规模数据的处理能力,保证系统的可扩展性,本系统设计并实现模型算法在Spark上的并行化,提高算法的运行效率。
项目拟解决的关键问题和可能的创新点
2、基于深度学习算法,生维行为,分层生为预测模型,时,数据自身特点,提出3、由于本文针对学生进行聚类细分数据量较大,同时为了以后的更大规模数据的处理能力,保证系统扩展性,我们设计了算法在Spark上的并行化实现。
项目与国内外同类研究的比较
国外的多家在线教育机构针对在线教育过程中高发的辍学问题,应用数据挖掘方法对学生在线学习数据进行深层次挖掘分析,发现引发辍学的内在原因,并基于挖掘结果制定督促和引导策略,改善在线教育的辍学问题。Marengo基于学生与系统中的交互日志进行数据挖掘,建立个性化知识库,分析学生知识掌握情况,帮助学生建立培养知识体系。保罗实验室在2015年10月发起了一项数据竞赛,研究在指定训练集样本上通过机器学习算法构建知识模型,利用统计及逻辑推理的方法选择可能正确的答案,建立答题模型,模拟学习考试,取得了很好的成果。
电子科技大学研究人员基于学生在校园内学习、生活的实时行为数据,结合问卷调查、人口统计学等相关数据研发的大数据系统,利用校园一卡通追踪学生行为轨迹,通过对学生吃饭、打水、出行、消费行为记录,挖掘出每名学生的学习、生活状态,并通过对学生日常学习状态的追踪,对学生的期末成绩作出预警。有科研人员基于学生平时测成绩数据,利用决策树挖掘方法提取规则,以预测学生课程成绩,帮助了解学生表现,提适当的学习建议,提高教学质量。以校园卡交易数据为研究对,通过数据仓库、联机分析处理技术以及数据挖掘技术的综合运用来建立数据分析决策系统,以为基础进行聚类分析,发现水的消费与学生性别有关联深度学习生异常行为模型较少,还处于萌芽阶段
4
|
|