评价数据质量的标准有多种。①完整性:用于度量哪些数据丢失或者哪些数据不可用。②规范性:用于度量哪些数据未按统一格式存储。③一致性:用于度量哪些数据的值在信息含义上是冲突的。④准确性:用于度量哪些数据和信息是不正确的,或者数据是超期的。⑤唯一性:用于度量哪些数据是重复数据或者数据的哪些属性是重复的。⑥关联性:用于度量哪些关联的数据缺失或者未建立索引。但是,还有其他与数据质量有关的标准。例如,ISO 25012定义了数据的15个质量维度。质量维度(特征)的数量和名称也取决于数据源的特性。例如,对于Web2.0文档中的数据,定义以下维度:可访问性,完整性,可信度,参与度,客观性,可读性,相关性,声誉,样式,及时性,唯一性,有用性。 |
|
来自: 求是1025 > 《162大数据与人工智能》