教育行业A股IPO第一股(股票代码 003032)

全国咨询/投诉热线:400-618-4000

数据清洗的原理是什么?

更新时间:2022年11月14日10时09分 来源:传智教育 浏览次数:

好口碑IT培训

  数据清洗是利用相关技术将“脏”数据转换为满足质量要求的数据。下面通过一张图描述数据清洗的原理,具体如图1-3所示。

数据清洗的原理

  图1-3 数据清洗的原理

  从图1-3中可以看出,同一值的不同表示、拼写错误、不同的命名习惯、不合法的值以及空值都会导致“脏”数据出现,通过定义好的数据清洗策略和清洗规则(即数理统计技术、数据挖掘技术等清洗策略)对“脏”数据进行清洗,得到满足数据质量要求的数据。

  需要注意的是,数据清洗的目的是解决“脏”数据问题,即不是将“脏”数据洗掉,而是将“脏”数据洗干净。干净的数据指的是满足质量要求的数据。

0 分享到:
和我们在线交谈!