这是一读EDU推送的第236篇文章 全文2035字,预计阅读3分钟 随着高校信息化建设进程的加速,数据在决策中的重要性得到越来越多管理者的认可。为了加强数据的完整性与一致性,提升数据质量,更好地支持数据挖掘与决策,诸多高校搭建了统一、全方位的数据仓库。 借助建立数据仓库,职能部门可对现有系统的数据进行有效的集成并加以重组,以满足学校对数据的准确掌握和统计分析上报的需求,并为数据挖掘和决策支持提供基础。 本文将以拥有全美最大计算机中心之一的密西根大学(University of Michigan,下称“密大”)为例,分享该校建设数据仓库的实践经验,以期为国内高校提供借鉴。 01 什么是数据仓库? 随着全球经济急速发展,企业间合作频繁,越来越多的企业开始重视数据资产的价值,这也使数据仓库在企业中有了巨大的发展。 数据仓库的概念最早由比尔·恩门(Bill Inmon)于1991年提出,他在《建立数据仓库》一书中对数据仓库进行了精确的定义: 数据仓库在高校内的应用起步,要远晚于企业。在高校信息化建设初期,相关工作多由各个业务部门组织实施,形成的是业务部门内部的数据闭环,以支撑部门内部的业务决策。 这种模式有效解决了学校发展早期的问题,但随着学校的快速发展,积累的数据出现了“井喷式”的增长,而此前缺乏整体规划设计、数据标准不统一、存在于各个业务部门系统内的数据孤岛,再也无法支撑学校的管理决策。 为了有效整合源于内部各业务部门的内部数据和外部数据,实现对管理决策的支撑,对高校而言,建设统一、全方位的数据仓库是个不二之选。 02 如何建立数据仓库? 数据仓库的构建需要通过实践不断反馈、持续改进。总体而言,数据仓库的构建包括以下核心流程: 构建数据仓库的核心流程图(来源:一读EDU编辑部制作) 系统现状分析 为了给设计逻辑数据模型打好基础,首先,高校需要清晰了解业务系统的现状、特点和数据情况,理清数据结构和了解数据含义。 体系架构设计 对体系架构进行整体规划设计是建设数据仓库的基础。在设计时,需要整体考虑数据仓库的系统扩展与性能优化,从而定义各模块的功能、设计原则与接口。 数据标准设计 缺乏统一的数据标准是制约高校数据化治理水平提升的关键因素,因此数据标准设计也是高校数据仓库建设的核心环节。 高校需充分参考国内外及行业外的标准,结合学校业务特点,制定统一的数据标准,保证数据的一致性。 数据模型设计 数据模型直接决定了数据仓库能够进行的分析类型、分析细致程度、分析效率及响应时间。 设计数据模型时,高校可根据主题域进行设计,将与主题相关的数据进行整合,用统一的逻辑语言来描述该主题。 数据处理过程 通过对数据进行抽取、转换、加载,完成对数据的批量处理。 联机分析处理和数据挖掘 联机分析处理技术和数据挖掘是院校数据仓库架构与建设的“最后一公里”。 作为被广泛应用的数据仓库应用技术,联机分析处理系统可根据需求,快速实现复杂数据查询和可视化展示,为管理人员提供决策支持。 03 数据仓库有什么作用? 作为美国高校实践数据仓库的重要力量,密大自建设数据仓库以来,学校整体数据治理能力得到了明显提升。 该校数据仓库中的数据主要以数据集的形成存在,每个数据集又归属于一个或多个主题域。 校方根据决策需求,划分了10个主题,分别为学校资源分析、学校发展、科研、财务管理、人力资源、薪酬、基础设施、学生、学生生活、教与学。 学校管理人员可根据分析需求,选择合适的数据集进行运算,将生成的分析报告作为决策的参考信息。 案例 例如,在“学生生活”主题域下,与其相关的数据集主要为校园生活类的数据集,包括学生校园卡数据、安全访问数据、餐饮服务管理数据等。 以校园卡数据为例,管理人员可以通过数据仓库对不同数据源的数据进行集成,通过联机分析为学校的食物采购、食物供应等提供参考。 资料来源:The Regents of the University of Michigan |
|