数据模型设计 模型目标 口径一致 避免重复计算 易于数据服务 充分支持业务 数据模型涉及的几个方面 数仓分层 业务主题 维表/事实表 命名规范 如何规划数仓 良好的模型抽象和清晰的层次划分能保障支持各种复杂的数据业务接入并较好的支撑数据业务,这是大部分规划数仓时会重点关注的问题。其实,不同时期来考衡标准是不一样的,初期可能主要考虑的把业务支撑好,中后期可能主要重心在模型和数据治理上,通过不同阶段将数据业务价值最大化同时保障数据建设健康发展。 初期 管理方便性:0 模型通用性:0.1 数据治理:0.1 安全保障:0.1 业务支持:0.7 中后期 管理方便性:0.1 模型通用性:0.2 数据治理:0.3 安全保障:0.2 业务支持:0.2 在数据仓库建设初期,由于仓库数据沉淀少,大量的业务数据需要处理,是暂缓业务数据需求开发待仓库建设好全力支撑业务?还是全力保障业务支持逐步来建设数据仓库建设?这两个问题可能也困扰着很多人,个人觉得还是先run起来,先解决一些业务问题,即先产出一些价值,这样会更容易推进后面的工作。如果一上来就大而全,一方面产出价值少被老板挑战,另一方面实施周期长,很容易成为一个较大的成本中心。在快速发展的互联网行业像这种建设方式显然不太合适,通过数据支持保障业务快速发展是我们首要考虑的问题。值得注意的是:先run起来并不是意味着不遵从任何的规范,只不过首要的问题的支持业务。等到数仓建设到中后期,这个时候就需要考虑数据治理的问题,而不是一味的去满足需求,比如考虑主题数据的中间层数据资产沉淀、模型优化、任务优化、存储与计算成本优化等等,从而使得数仓逐渐趋于完善。 我是一位爱学习的老人!本站主要是些学习体验与分享(其中会引用一些作品的原话并结合我的一生体会与经验加工整理而成!在此一并感谢!如有不妥之处敬请与我联系,我会妥善处理,谢谢!)我写的主要是中老年人各方面应注意的事儿!退休后我希望通过这个平台广交朋友,互助交流,共筑美好生活!!!!!! 更多文章请参看http://www.赵站长的博客。期待大家的光临与指教哦^0^!欢迎大家转发! |
|
来自: 赵站长的博客 > 《人工智能大数据云计算物联网》