综合百科

数据冗余是什么意思?(数据冗余)

数据冗余是指在数据库中,存在大量重复数据或者相关数据的情况,这样可以增加存储空间的使用量,但同时也会降低数据库的性能。

这种问题的根源通常来自于建立数据库时的设计。设计不当,会造成数据冗余,而在实际工作的过程中,人为的操作也会导致数据冗余出现。

数据冗余最常见的是冗余属性、冗余元素、多余表和多余记录。冗余属性指实体内同一属性被存储多次,冗余元素指一个元素由多个数据项组成时,某个数据项被存储多次,多余表指在一个关系数据库中存在多个重叠实体表,多余记录指一个实体表存在多个同类型的记录,而这些记录中只有几个数据项有不同,其他均相同。

数据冗余的出现有可能会影响数据库效率,也会增加数据库的维护成本,因此在设计阶段应慎重考虑这一点,利用正确的数据模型可以大部分的避免数据冗余的产生。当然,既然已经出现了,那么也可以尝试通过某种形式来避免它带来的不良影响,比如使用视图来替代冗余属性,使用虚拟字段来替代这冗余元素,尝试合并多余表,以及删除多余记录等手段。