如何搭建一个数据仓库? 下面大体说明了搭建的流程。 数据仓库的结构 用一幅图来表示: 数据仓库的好处 数据仓库是一套体系。可以建在Oracle上,MySQL上,Hive上,MaxCompute上,具体建在哪个平台根据数据量来定。对数据仓库来说,建在哪个平台不重要,重要的是目的。 数据仓库的目的,是对组织的数据进行统一的治理,归纳来讲,就是:存、通、用。
存偏向于存储,通偏向于数据管理,用偏向于数据计算,也就是业务创新。 业务的野蛮生长总会遇到瓶颈,这个时候就需要有内在驱动的业务创新。数据是指导组织二次创业的好依据。by 山水 主要的流程 简单的来说,就是包括:数据源、ODS、DW(DM)、报告这几部分。 主要有这么几个流程:
ODS到DW(DM),刚开始可以考虑建立数据集市(DM),待对数据,对业务足够理解,人足够多的时候,考虑建立数据仓库(DW),需要考虑:
报告,这个是给业务、决策层看的,是体现价值的地方
用到的工具 在建设数据仓库的时候,需要使用一系列的工具。
ODS到DW(DM)
报告
整个流程通过 调度工具 串起来 调度工具需要解决:
后续的工作 迭代! 迭代! 迭代! |
|