Meta因为Facebook公司的改名被世人皆知。在计算机科学和信息技术领域,“Meta”用于表明与某个事物相关的描述、属性或操作。本文将介绍软件系统中的“Metadata”是关于数据的数据。 关于数据的数据,大家最容易联想到数据库中的数据字典。数据字典对数据的描述是基于数据存储、数据运算和数据执行等视角。数据字典中主要描述了字段的数据类型、字段和表的关系、字段内的关系和字段值规则。但是字段描述中不包含任何业务含义,随着外键使用率越来越低,数据字典也无法表达实体与实体之间的数量关系。 MySQL配置数据字段信息示意图 在数据治理中,元数据提供了对数据的定义、属性、结构和关系等不同层面的详细描述。通过元数据描述的数据,它不再是一个具体的数值或者一串字符,而是代表具体含义的信息。在数据治理的过程中,元数据有如下七种: 数据治理元数据示意图 七种元数据可以分为四大类型:溯源、结构、质量和权限。 溯源 数据血缘元数据:描述数据来源的信息,包括:数据源、数据提供方、数据采集等。数据血统元数据是一种用于跟踪数据流向的元数据,包括:数据源、数据传输过程、数据处理和使用等。 当数据内容被质疑时,可以一路回溯到故障点。 结构 数据结构的定义分三层,既表与表之间的定义、表与字段的定义和字段内部的定义。此部分元数据和数据字典较为相似,但并不能互相替代。 数据关系元数据:描述数据之间的关系和依赖,包括关联关系、层级关系、引用关系等。对数据内容进行分析后,还可以形成数据分类体系和标签关系等,用于数据分类和访问控制。 数据结构元数据:描述数据的组织结构关系,包括表、字段、主键等。 数据定义元数据:描述数据的基本定义和业务含义,包括数据名称、数据类型、数据范围和数据长度等。 质量 数据质量元数据:描述数据内容的质量特征,包括数据准确性、完整性、填充率和一致性。其中数据填充度作为数据完整性的一个指标是最容易被衡量的。 数据处理元数据:描述数据的处理过程和规则,包括数据清洗、转换、加工等操作。运行过程中,记录此元数据的内容可以了解数据处理的成功率。 权限 数据权限元数据:描述数据的访问权限和安全要求,包括数据可见性、数据保护级别等。权限分为管理方和数据责任方。对于管理方包括:数据的访问权限、数据保护策略和安全控制规则。对于责任方包括数据的所有者、数据治理责任和数据使用权限的规定。 DIKW模型示意图 元数据在数据到信息的转换中扮演着关键角色,它帮助完成了DIKW模型中数据(Data)到信息(Information)的转换。元数据定义各种数据格式及内容,使得程序能够理解数据的含义和内容。业务系统、数据系统、低代码平台、AI系统都无法离开元数据。元数据的设计变得越来越重要,帮助人们完成从信息(Information)到智慧(Wisdom)的提升。 |
|