分享

只有数据的高校,离真正的数据治理还差这个“仓库”

 文武不全 2017-09-29

这是一读EDU推送的第236篇文章

全文2035,预计阅读3



随着高校信息化建设进程的加速,数据在决策中的重要性得到越来越多管理者的认可。为了加强数据的完整性与一致性,提升数据质量,更好地支持数据挖掘与决策,诸多高校搭建了统一、全方位的数据仓库。


借助建立数据仓库,职能部门可对现有系统的数据进行有效的集成并加以重组,以满足学校对数据的准确掌握和统计分析上报的需求,并为数据挖掘和决策支持提供基础。


本文将以拥有全美最大计算机中心之一的密西根大学(University of Michigan,下称“密大”)为例,分享该校建设数据仓库的实践经验,以期为国内高校提供借鉴。


01

什么是数据仓库?


随着全球经济急速发展,企业间合作频繁,越来越多的企业开始重视数据资产的价值,这也使数据仓库在企业中有了巨大的发展。


数据仓库的概念最早由比尔·恩门(Bill Inmon)于1991年提出,他在《建立数据仓库》一书中对数据仓库进行了精确的定义:

数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程

数据仓库在高校内的应用起步,要远晚于企业。在高校信息化建设初期,相关工作多由各个业务部门组织实施,形成的是业务部门内部的数据闭环,以支撑部门内部的业务决策。


这种模式有效解决了学校发展早期的问题,但随着学校的快速发展,积累的数据出现了“井喷式”的增长,而此前缺乏整体规划设计、数据标准不统一、存在于各个业务部门系统内的数据孤岛,再也无法支撑学校的管理决策。


为了有效整合源于内部各业务部门的内部数据和外部数据,实现对管理决策的支撑,对高校而言,建设统一、全方位的数据仓库是个不二之选


02

如何建立数据仓库?


数据仓库的构建需要通过实践不断反馈、持续改进。总体而言,数据仓库的构建包括以下核心流程:


构建数据仓库的核心流程图(来源:一读EDU编辑部制作)


系统现状分析


为了给设计逻辑数据模型打好基础,首先,高校需要清晰了解业务系统的现状、特点和数据情况,理清数据结构和了解数据含义。


体系架构设计


对体系架构进行整体规划设计是建设数据仓库的基础。在设计时,需要整体考虑数据仓库的系统扩展与性能优化,从而定义各模块的功能、设计原则与接口。


数据标准设计


缺乏统一的数据标准是制约高校数据化治理水平提升的关键因素,因此数据标准设计也是高校数据仓库建设的核心环节


高校需充分参考国内外及行业外的标准,结合学校业务特点,制定统一的数据标准,保证数据的一致性。


数据模型设计


数据模型直接决定了数据仓库能够进行的分析类型、分析细致程度、分析效率及响应时间。


设计数据模型时,高校可根据主题域进行设计,将与主题相关的数据进行整合,用统一的逻辑语言来描述该主题。


数据处理过程


通过对数据进行抽取、转换、加载,完成对数据的批量处理。


联机分析处理和数据挖掘


联机分析处理技术和数据挖掘是院校数据仓库架构与建设的“最后一公里”


作为被广泛应用的数据仓库应用技术,联机分析处理系统可根据需求,快速实现复杂数据查询和可视化展示,为管理人员提供决策支持。


03

数据仓库有什么作用?


作为美国高校实践数据仓库的重要力量,密大自建设数据仓库以来,学校整体数据治理能力得到了明显提升。


该校数据仓库中的数据主要以数据集的形成存在,每个数据集又归属于一个或多个主题域。


校方根据决策需求,划分了10个主题,分别为学校资源分析、学校发展、科研、财务管理、人力资源、薪酬、基础设施、学生、学生生活、教与学。


学校管理人员可根据分析需求,选择合适的数据集进行运算,将生成的分析报告作为决策的参考信息。


案例


例如,在“学生生活”主题域下,与其相关的数据集主要为校园生活类的数据集,包括学生校园卡数据、安全访问数据、餐饮服务管理数据等。


以校园卡数据为例,管理人员可以通过数据仓库对不同数据源的数据进行集成,通过联机分析为学校的食物采购、食物供应等提供参考。


资料来源:The Regents of the University of Michigan

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多