永洪社区
标题:
<永洪tech>如何轻量级的数据清洗
[打印本页]
作者:
vincent
时间:
2017-12-11 16:08
标题:
<永洪tech>如何轻量级的数据清洗
本帖最后由 vincent 于 2017-12-11 16:13 编辑
Yonghong产品为用户提供了数据建模功能,这些实用的小功能具体为新建表达式、新建分组、缺失值填充、拆分列、去空格、值映射等功能。
新建分组
选择数据类型是布尔、字符串、时间戳、日期或时间的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择新建分组,对字段的数据值进行分组,数据列表中空数据和空字符串会被过滤掉。
在字符串类型的字段上右键,打开新建分组对话框,如图:
(, 下载次数: 247)
上传
点击文件名下载附件
缺失值填充
选择类型是字符串、数值类型(双精度、单精度、整数、长整数等)的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择缺失值填充,对字段数据进行填充。
在整数类型的字段上右键,打开缺失值填充对话框,如图:
(, 下载次数: 239)
上传
点击文件名下载附件
拆分列
选择类型是字符串的字段,在元数据上选中字段或在细节数据选中字段的列头右键选择拆分列,可以根据分隔符对数据进行全部拆分或部分拆分。
在字符串类型的字段上右键,打开拆分列对话框,如图:
(, 下载次数: 266)
上传
点击文件名下载附件
去空格
选择类型是字符串的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择去空格,可以去除数据中前、后空格。
(, 下载次数: 220)
上传
点击文件名下载附件
值映射
选择类型是字符串、布尔、字符、时间、日期或时间戳的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择值映射,对字段数据起别名,值列表中会列出空数据和空字符串。
在字符串类型的字段上右键,打开值映射对话框,如图:
(, 下载次数: 200)
上传
点击文件名下载附件
当然产品中还包括其他数据类型的转换,数据表间组合等功能,有兴趣的童靴可以向永洪技术人员咨询。
欢迎光临 永洪社区 (https://club.yonghongtech.com/)
Powered by Discuz! X3.4