通常数据质量评估和管理评估需通过以下几个维度衡量。常见的以下维度:
1.完整性
完整性,是指数据信息是否完整,是否存在缺失情况。数据缺失的情况可能是整个数据记录缺失,也可能是数据中某个字段信息的记录缺失。
2.规范性
规范性,是指记录是否符合规范,是否按照规定的格式存储(例如标准编码规则)。
3.一致性
一致性,是指数据是否符合逻辑,数据内单项或多项数据间存在逻辑关系。
4.准确性
准确性,用于度量哪些数据和信息是不正确的,或者数据是超期的。准确性可能存在于个别记录,也可能存在于整个数据集上。准确性和规范性的差别在于规范性关注合规,表示统一,而准确性关注数据错误。
5.时效性
数据从产生到可以查看的时间间隔,也叫数据的延时时长。某些实时分析和决策需要用到小时或者分钟级的数据,这些需求对数据的时效性要求极高,所以及时性也是数据质量的组成要素之一。
6.唯一性
唯一性,用于度量哪些数据是重复数据或者数据的哪些属性是重复的。即对存在于系统内或系统间的特定字段、记录或数据集意外重复的测量标准。
7.合理性
合理性,是从业务逻辑角度判断数据是否正确。评估方面可参照规范性、一致性做法。
8.冗余性
冗余性,是指多层次数据中,中是否存在不必要的数据冗余。
9.获取性
获取性,是指数据是否易于获取、易于理解和易于使用。