分享

当“教育”遇上“大数据分析”

 澄怀观道 2015-09-24

点击'康赛信息'关注我哦!

大家都说现在是“大数据时代”,可是当“教育”遇上“大数据分析”——很多高校信息中心领导说:我们把数据整合做完了,数据也管理起来了,但是数据量不够大啊;就算数据足够“大”,毕竟大数据属于前沿性、探索性的课题,究竟怎么做,分析什么?目前都还没有明确的思路。

的确,很多高校的信息中心主任都有这样的困扰,那大数据分析真的是遥不可及么?其实不然。大数据并没有想象的那么难,很多学校在大数据应用上也取得了一些效果,而且是不知不觉就做到了!

到底怎么做的呢?答:做大数据分析必须满足四个基础要素。

第一,分析主题,即你分析的目的是什么,是学生离校预警?还是学生成绩差异?

很多学校都不知道高校的大数据分析该如何下手,把大数据分析想得过于复杂。其实我们完全可以从实际问题入手。比如:某校地处偏僻,学生安全问题一直困扰着学校领导和管理老师,生怕学生擅自离校出现什么安全问题。那么,学校可以做学生离校预警分析,通过数据分析看学生是否在校,然后及时地将数据推送给相关的管理老师,以便于老师及时采取措施。

再比如:学生成绩到底和哪些因素相关呢?生源地?高考成绩?性别?星座?吃不吃早餐?在学校的消费水平?有没有谈恋爱?把学生成绩和这些数据做一些关联的分析,发现一些有趣的结果。这也是大数据分析了。

第二,基础数据,包括结构化与非结构化数据。

大数据的数据来源非常广泛,既包括传统的关系型数据库,也包括XML等半结构化数据,以及以视频、音频、文本和其它形式存在的非结构化数据。数据抽取和集成要解决的主要问题就是收集各种碎片化的数据,对数据进行清洗,保证数据质量,同时根据时间演进不断更新数据模式,以便提供给上层用来进行数据分析。实际上这一点也不难解决,专注于教育行业的数据清洗与整合平台—DCI就能够对异构应用系统中的数据进行数据抽取、清洗与整合。除了结构化数据,对半结构化数据、非结构化数据也能准确整合,同时提供多种整合任务的调度方式,保证了数据的动态更新。

第三,分析方法,即也就是我们常说的“大数据模型”。

“大数据模型”是做数据分析的关键环节,也是令信息中心主任头疼的环节。其原因有二:

1.现在学校做大数据分析,往往采购成熟的数据分析工具,其设定的数据运算模型往往通过定制开发,大多数算法的制定都是靠编程来完成,模型被写死了,其扩展性肯定不强。举个例子:某高校做学生离校预警,以现有的一卡通数据、图书馆数据、点名数据和门禁数据建立了一个分析模型。后期学校做了无线WIFI的定位覆盖,想要把无线WIFI的数据加到数据分析模型中去,结果发现分析模型的程序无法做更改,除了重新开发新模型别无他法。

2.大多数“大数据模型”的设计都是通过编程来实现,对于学校这个终端用户来说,后期的维护,往往受厂家的绑架,不仅要投入高昂的服务费用,而且在需求响应程度上也会受到厂商的大大制约,响应不迅速、服务不及时、解决不彻底的状况想想都可怕。

其实这两点也是完全能够避免的,大数据分析工具DCI采用可配置大数据模型理念设计,采用可视化组件的拖拽,通过无编码的向导配置就可以轻松完成大数据模型的设定,易于设计、灵活性强、后期维护简单。

第四,分析工具,即用于分析的软件。

实际上,在教育信息化行业也有国际范儿的专业分析软件—DCI。通过对异构系统的整合,保证用于大数据分析的数据源头的标准性、一致性和权威性。根据分析的目的,灵活的选取数据来源,设定大数据分析模型,轻松完成大数据分析的构建。

现在,有些学校通过DCI做了大数据分析,比如:上文提到的学生离校预警分析,即通过将一切能够证明学生在校行动的数据信息都作为数据源头,通过DCI进行整合和分析,就能够得出结论该学生是否在校。另外还有学生成绩分析,即将学生的某科成绩与其成绩段的分析比例以及成绩排名等结合起来进行分析,最终得出学生成绩好坏的科学依据及评估。

因此,大数据分析就在我们身边。

康赛内部供稿,转载请注明出处。

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多