这是数据工程概念系列的 10 部分中的第 3 部分。在这一部分中,我们将讨论数据质量和治理。 内容: 什么是数据质量 数据质量是保证数据准确、完整、新鲜、可靠并适用于组织需要处理的业务需求。投资于数据质量将节省大量时间和精力,并防止出现任何错误情况。 不同类型的数据质量检查可以是 e.类别检查(例如,可能有一个不存在的州缩写) f.新鲜度检查(例如,几分钟前发生的交易未注册) g.唯一性检查(例如,确保没有重复的行) h.引用完整性检查(例如,确保外键与其他表中的主键匹配) 如何实现数据质量
什么是数据治理 数据治理是指定义数据控制、访问和标准化策略的过程,以随着时间的推移提供安全性和有效性。指定数据管理员负责数据质量和这些策略的执行,并且数据沿袭用于在整个数据生命周期中跟踪源到目的地。 数据治理框架有 3 个主要组成部分: 2.规则 3.分类 如何实施数据治理 为了实施数据治理框架,需要构建以人为中心的方法,因为人们应该能够对他们管理的数据负责。治理框架应根据应用策略的进展进行迭代细化。 数据治理可以通过 3 种不同的模式来实现:集中式、分散式、混合式 为了实施数据治理策略,需要采取几个步骤: 2. 准备和转换元数据 3. 选择并构建治理模式 4. 建立政策分发流程 5. 识别潜在风险 |
|