[数据处理] 在数据清洗(治理)中,为什么需要值映射功能?

造价师郑在宇铂金一 显示全部楼层 发表于 2022-10-12 22:54:32 |阅读模式 打印 上一主题 下一主题
在数据清洗(治理)中,为什么需要值映射功能?
或者说值映射功能能够解决什么问题?

比如教学视频中把性别字段的男和女,映射为1和0,其目的是什么?

谢谢(。◕∀◕。)

最佳答案

永洪vip
Adil_zhang 铂金二 关注Ta

2022-10-12 22:54:33

1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个业务域、数据实体、数据项等等制定数据标准并提升数据质量。理想情况下是你的数据治理天衣无缝之后就不需要数据清洗了直接用(狗头保命) 2.值映射解决了什么问题:随便举两个场景举一反三吧,某一天返回的数据是1 、2、3,分别代表优、良、差,但是你需要展示为中文,这时需要值映射;再或者原业务返回数据为一等,二等,三 ...
查看完整内容
回复

使用道具 举报

精彩评论6

Adil_zhang铂金二 显示全部楼层 发表于 2022-10-12 22:54:33
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个业务域、数据实体、数据项等等制定数据标准并提升数据质量。理想情况下是你的数据治理天衣无缝之后就不需要数据清洗了直接用(狗头保命)

2.值映射解决了什么问题:随便举两个场景举一反三吧,某一天返回的数据是1 、2、3,分别代表优、良、差,但是你需要展示为中文,这时需要值映射;再或者原业务返回数据为一等,二等,三等,四等,但是统计口径时一等二等为优秀,其三等为良,四等为差。


回复

使用道具 举报

yhdata_ruby皇冠三 来自手机 显示全部楼层 发表于 2022-10-12 23:00:55
本帖最后由 yhdata_ruby 于 2022-10-12 23:04 编辑

由于导入数据集的列的值是无法在数据集中更改的,当用户需要把维度列中的各维度值换一个名称或表现方式时,例如用户想把具体的会员等级名称换成量化的1、2、3级,就可以使用值映射。https://www.yonghongtech.com/hel ... C%E6%98%A0%E5%B0%84
回复

使用道具 举报

yhdata_ruby皇冠三 显示全部楼层 发表于 2022-10-13 10:06:19
Adil_zhang 发表于 2022-10-13 10:03
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个 ...

回复

使用道具 举报

造价师郑在宇铂金一 显示全部楼层 发表于 2022-10-13 15:04:58
Adil_zhang 发表于 2022-10-12 22:54
1.数据清洗与数据治理是完全不同的概念,前者是你对混乱的数据按自己的规则进行处理清洗,后者是基于你每个 ...

感谢回复
回复

使用道具 举报

造价师郑在宇铂金一 显示全部楼层 发表于 2022-10-13 15:05:14
yhdata_ruby 发表于 2022-10-12 23:00
由于导入数据集的列的值是无法在数据集中更改的,当用户需要把维度列中的各维度值换一个名称或表现方式时, ...

感谢回复
回复

使用道具 举报

yhdata_ruby皇冠三 显示全部楼层 发表于 2022-10-13 15:05:46

(。◕∀◕。)
回复

使用道具 举报

高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |联系社区管理员|《永洪社区协议》
返回顶部