分享

数据标准是什么?

 非著名问天 2023-07-10 发布于内蒙古

在数据治理过程中,我们通常会说到数据标准,那么数据标准是什么了?

数据标准是指为特定领域或行业制定的一套规范,用于定义数据的结构、格式、约束和内容。数据标准旨在确保数据在不同系统、组织以及业务场景之间的一致性和互操作性。 数据标准可以包括以下内容: 

1. 数据模型:定义了数据的结构和关系,包括实体、属性和关系等。 

2. 数据格式:规定了数据的表示方式,如文本、数字、日期等。 

3. 数据元素和命名约定:定义了数据元素的名称、定义、长度、数据类型和其他属性。 

4. 数据字典:提供了对数据元素的详细定义和描述,包括数据的来源、含义、用途等。 

5. 数据编码和分类:用于对数据进行分类和编码,以方便数据的组织、检索和分析。 

6. 数据质量规范:定义了数据的质量标准和要求,包括准确性、完整性、一致性等。 

7. 数据安全和隐私规范:规定了数据的访问、使用和保护的规则和要求。 

数据标准的制定和实施有助于解决数据整合、数据质量、数据共享等数据治理方面的挑战,促进数据的有效管理和利用。通过遵循数据标准,组织能够更好地实现数据共享、数据分析和业务流程的协同。

以上是一个非常全面的数据标准的定义,基于以上分析,对于数据标准可以分成3类:

图片

对于业务属性和技术属性一般是到字段级,而管理属性是到表级.

对应于以上的数据标准的分类,我们可以分为数据编码标准,命名标准,数据元标准三类,

1、数据编码标准表达的是一个数据元里面的编码的取值范围,例如,中国的省份有56个,那么用不同的数字或者编码代表不同省份名称,为后期不同业务域使用提供了统一的标准,方便后期数据仓库在进行数据融合的时候进行关联融合。

2、命名标准,主要包含库名称标准、表名称标准、字段名称标准,而字段名称标准一般是在数据元标准。库名称标准和表名称标准,为后期识别表建立好的基础

3、数据元标准是指每个字段的标准,这时是包含业务属性和技术属性,通过详细的定义业务属性和技术属性,规范到表的创建和建模。

对于标准的执行落地,主要是通过现状调研、标准设计、标准映射、标准执行和标准管理,五个阶段进行执行。

图片

对于标准的映射主要是通过质量管理中将监控的字段和数据标准进行映射,通过质量评分,了解实际数据对标准的满足程度。

而对于标准的执行则需要根据实际情况分为两种情况进行执行

1、从源头控制:各系统建设改造,新建系统的调整(模型、界面、功能、接口)、短期兼容方案、系统长期改造方案、

2、数据清洗:辅助数据补录、历史数据转换、手工调整等

此外,数据标准管理应该制定一个有效的数据标准保护机制。目前,企业通常采用事前、事中和事后的三种模式对数据标准进行管理。事前管控是在项目/系统建设的需求分析阶段介入,以确保系统建设在起始阶段就围绕数据标准进行设计。例如,发布的标准可以为业务系统在系统设计时提供参考。事中管控是在项目/系统开发过程中进行管控,利用数据研发工作站等工具,在数据开发过程中应用数据标准。例如,发布的标准可以供系统或项目调用使用。事后管理是在项目上线阶段进行审核,对不符合标准要求的情况进行说明,并在需要更新数据标准时进行更新。例如,进行质量标准的监督等。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多