分享

人工智能[4878]数仓 | 该如何理解数据仓库的建设[9]

 赵站长的博客 2024-05-15 发布于北京

如何评价数仓

需求响应敏捷 数据仓库建设不是需求驱动的,但是数据仓库的根本目的还是面向决策的。在现实中,数据仓库团队承担着很多数据查询分析的职责,经常会收到业务方的数据需求。一个好的数据仓库模型,能预知业务方的数据需求,足够灵活扩展。能做到这一点,首先需要建立元数据管理工具,从而可以方便快速查找数据的基本信息。其次,还需要有大量的数据中间层,有预先算好的数据指标。此外,数据自助提取工具也是快速响应数据需求的必备工具。

数据质量可靠 在数据开发过程中,很多人可能会遇到这种情况,开发时间只用了1周,数据测试和校验用了2周甚至更长时间。测试校验时间长,往往不是由于计算逻辑复杂,而是上游数据不规范,不可靠,不可信,需要花很大的代价自己做校验和数据探查,这在一定层面上也反映出模型的设计有问题。

可扩展 数据仓库经常会面对业务的变化,比如业务方拿到一个结果后,经常会与更多的维度交叉分析,或者粒度上做上卷或下钻,还有对统计口径做特别的限定。数据仓库在要能覆盖这些不可预知的变化的需求。更麻烦的是,业务规则会发生变化。良好的数据仓库设计要能兼容这些变化,否则以前积累的数据都将变成垃圾。

稳定性 数据仓库还要稳定地保障数据的产出,服务于业务系统,不要经常掉链子。造成不稳定的因素往往是机器网络等硬件因素,但是良好的数据仓库设计能在硬件故障后快速恢复数据,不会造成连锁的灾难。

我是一位爱学习的老人!本站主要是些学习体验与分享(其中会引用一些作品的原话并结合我的一生体会与经验加工整理而成!在此一并感谢!如有不妥之处敬请与我联系,我会妥善处理,谢谢!)我写的主要是中老年人各方面应注意的事儿!退休后我希望通过这个平台广交朋友,互助交流,共筑美好生活!!!!!! 更多文章请参看http://www.赵站长的博客。期待大家的光临与指教哦^0^!欢迎大家转发! 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多