永洪社区

标题: 在数据清洗(治理)中,为什么需要值映射功能? [打印本页]

作者: 造价师郑在宇    时间: 2022-10-12 22:54
标题: 在数据清洗(治理)中,为什么需要值映射功能?
在数据清洗(治理)中,为什么需要值映射功能?
或者说值映射功能能够解决什么问题?

比如教学视频中把性别字段的男和女,映射为1和0,其目的是什么?

谢谢(。◕∀◕。)

作者: Adil_zhang    时间: 2022-10-12 22:54
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个业务域、数据实体、数据项等等制定数据标准并提升数据质量。理想情况下是你的数据治理天衣无缝之后就不需要数据清洗了直接用(狗头保命)

2.值映射解决了什么问题:随便举两个场景举一反三吧,某一天返回的数据是1 、2、3,分别代表优、良、差,但是你需要展示为中文,这时需要值映射;再或者原业务返回数据为一等,二等,三等,四等,但是统计口径时一等二等为优秀,其三等为良,四等为差。



作者: yhdata_ruby    时间: 2022-10-12 23:00
本帖最后由 yhdata_ruby 于 2022-10-12 23:04 编辑

由于导入数据集的列的值是无法在数据集中更改的,当用户需要把维度列中的各维度值换一个名称或表现方式时,例如用户想把具体的会员等级名称换成量化的1、2、3级,就可以使用值映射。https://www.yonghongtech.com/hel ... C%E6%98%A0%E5%B0%84
作者: yhdata_ruby    时间: 2022-10-13 10:06
Adil_zhang 发表于 2022-10-13 10:03
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个 ...


作者: 造价师郑在宇    时间: 2022-10-13 15:04
Adil_zhang 发表于 2022-10-12 22:54
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个 ...

感谢回复
作者: 造价师郑在宇    时间: 2022-10-13 15:05
yhdata_ruby 发表于 2022-10-12 23:00
由于导入数据集的列的值是无法在数据集中更改的,当用户需要把维度列中的各维度值换一个名称或表现方式时, ...

感谢回复
作者: yhdata_ruby    时间: 2022-10-13 15:05
造价师郑在宇 发表于 2022-10-13 15:05
感谢回复

(。◕∀◕。)




欢迎光临 永洪社区 (https://club.yonghongtech.com/) Powered by Discuz! X3.4