分享

一文了解元数据

 gfergfer 2023-09-21

  Meta因为Facebook公司的改名被世人皆知。在计算机科学和信息技术领域,“Meta”用于表明与某个事物相关的描述、属性或操作。本文将介绍软件系统中的“Metadata”是关于数据的数据。

  关于数据的数据,大家最容易联想到数据库中的数据字典。数据字典对数据的描述是基于数据存储、数据运算和数据执行等视角。数据字典中主要描述了字段的数据类型、字段和表的关系、字段内的关系和字段值规则。但是字段描述中不包含任何业务含义,随着外键使用率越来越低,数据字典也无法表达实体与实体之间的数量关系。

图片

MySQL配置数据字段信息示意图

  在数据治理中,元数据提供了对数据的定义、属性、结构和关系等不同层面的详细描述。通过元数据描述的数据,它不再是一个具体的数值或者一串字符,而是代表具体含义的信息。在数据治理的过程中,元数据有如下七种:

图片

数据治理元数据示意图

  七种元数据可以分为四大类型:溯源、结构、质量和权限。

溯源

  数据血缘元数据:描述数据来源的信息,包括:数据源、数据提供方、数据采集等。数据血统元数据是一种用于跟踪数据流向的元数据,包括:数据源、数据传输过程、数据处理和使用等。 当数据内容被质疑时,可以一路回溯到故障点。

结构

  数据结构的定义分三层,既表与表之间的定义、表与字段的定义和字段内部的定义。此部分元数据和数据字典较为相似,但并不能互相替代。

  数据关系元数据:描述数据之间的关系和依赖,包括关联关系、层级关系、引用关系等。对数据内容进行分析后,还可以形成数据分类体系和标签关系等,用于数据分类和访问控制。

  数据结构元数据:描述数据的组织结构关系,包括表、字段、主键等。

  数据定义元数据:描述数据的基本定义和业务含义,包括数据名称、数据类型、数据范围和数据长度等。

质量

  数据质量元数据:描述数据内容的质量特征,包括数据准确性、完整性、填充率和一致性。其中数据填充度作为数据完整性的一个指标是最容易被衡量的。

  数据处理元数据:描述数据的处理过程和规则,包括数据清洗、转换、加工等操作。运行过程中,记录此元数据的内容可以了解数据处理的成功率。

权限

  数据权限元数据:描述数据的访问权限和安全要求,包括数据可见性、数据保护级别等。权限分为管理方和数据责任方。对于管理方包括:数据的访问权限、数据保护策略和安全控制规则。对于责任方包括数据的所有者、数据治理责任和数据使用权限的规定。

图片

DIKW模型示意图

  元数据在数据到信息的转换中扮演着关键角色,它帮助完成了DIKW模型中数据(Data)到信息(Information)的转换。元数据定义各种数据格式及内容,使得程序能够理解数据的含义和内容。业务系统、数据系统、低代码平台、AI系统都无法离开元数据。元数据的设计变得越来越重要,帮助人们完成从信息(Information)到智慧(Wisdom)的提升。

       
点击“在看”和“赞”
让更多人了解数字化技术。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多