永洪社区

标题: 这样的数据脱敏,可怎么实现啊 [打印本页]

作者: 给给    时间: 2023-6-7 15:28
标题: 这样的数据脱敏,可怎么实现啊
本帖最后由 yhdata_THHJZFCz 于 2023-6-7 16:26 编辑

永洪社区大佬好,请问下一段文字内容中怎么进行数据脱敏?如截图怎么实现脱敏身份证号和手机号,该段文字内容描述还是一样的,只是一些敏感数据进行脱敏。

在创建数据集中,对数据脱敏试一下,如果对某一列 如手机号等进行脱敏,这个是可以的
永洪社区大佬帮忙看看有没什么方法可以实现这个脱敏需求,谢谢啦!

作者: yhdata_lyaa    时间: 2023-6-7 15:41
这段文字有规律么,位置一样的话,可以按照脱敏规则
支持字符替换、正则替换。
https://www.yonghongtech.com/rea ... E%E8%84%B1%E6%95%8F
作者: 给给    时间: 2023-6-7 16:32
本帖最后由 yhdata_THHJZFCz 于 2023-6-7 18:25 编辑
yhdata_lyaa 发表于 2023-6-7 15:41
这段文字有规律么,位置一样的话,可以按照脱敏规则
支持字符替换、正则替换。
https://www.yonghongtech.c ...

没有规律的呀,比如用户的诉求内容,这段文字内容没有规律,有的可能带手机号,有的就是使用反馈
帮助中心的脱敏规则看了啦,对某一列 如手机号等进行脱敏,这个是可以的
但是运用到一段文字内容进行部分数据脱敏,试了使用正则表达式匹配出手机号,然后手机号全是*号,没有想到可实现的方法啊
lyaa大佬可以的话,可以试一下呀(帮助中心的两个脱敏规则看过的呀,帖子提到说到试过数据脱敏的运用呀)
作者: yhdata_lyaa    时间: 2023-6-7 19:46
yhdata_THHJZFCz 发表于 2023-6-7 16:32
没有规律的呀,比如用户的诉求内容,这段文字内容没有规律,有的可能带手机号,有的就是使用反馈
帮助中心 ...

一段文字分辨不出呀
作者: 给给    时间: 2023-6-8 09:56
本帖最后由 yhdata_THHJZFCz 于 2023-6-8 10:08 编辑
yhdata_lyaa 发表于 2023-6-7 19:46
一段文字分辨不出呀

嗯嗯  这边使用数据脱敏后也可以知道呀,目前可能没啥办法可以实现该需求场景
数据脱敏的脱敏算法规则使用只可以单一使用,所以对单一列的数据(如手机号)进行处理没有问题,其实想要实现该场景的数据脱敏,脱敏算法的字符替换、正则替换可以结合使用就可以呀,不是嘛?
最后这个帖子得不到解决方法暂不重要,可以把该情况反馈下需求,可以丰富数据脱敏规则使用可以更多样
作者: yhdata_lyaa    时间: 2023-6-8 11:20
yhdata_THHJZFCz 发表于 2023-6-8 09:56
嗯嗯  这边使用数据脱敏后也可以知道呀,目前可能没啥办法可以实现该需求场景
数据脱敏的脱敏算法规则使用 ...

好的
作者: 小么小二郎    时间: 2023-6-8 11:55
隐藏可以吗?
作者: yhdata_lyaa    时间: 2023-6-8 13:32
一个思路,可以试试看
新建计算列,用indexOf函数找到身份证号的位置,再用replaceRegex函数匹配正则表达式,返回替换后的字符串
作者: 给给    时间: 2023-6-9 09:06
yhdata_lyaa 发表于 2023-6-8 13:32
一个思路,可以试试看
新建计算列,用indexOf函数找到身份证号的位置,再用replaceRegex函数匹配正则表达式 ...

lyaa,你好,看了这两个函数介绍,没有试出来
可以给个简单案例看下嘛?使用这段描述,身份证号手机号脱敏中间的几位数字,其余保留,谢谢。
大家好,我是永洪BI,身份证号112233201210245566,在BI软件中,连续五年获得中国敏捷BI第一名,希望未来与更多国内厂商携手共创,推动国产数字化发展,可联系电话13198765432。
作者: yhdata_lyaa    时间: 2023-6-9 10:19
yhdata_THHJZFCz 发表于 2023-6-9 09:06
lyaa,你好,看了这两个函数介绍,没有试出来
可以给个简单案例看下嘛?使用这段描述,身份证号 ...


参考
replace(replace(col['列',mid(col['列',indexOf(col['列','身份证号')+5,18),'**********'),mid(replace(col['列',mid(col['列',indexOf(col['列','身份证号')+5,18),'**********'),indexOf(replace(col['列',mid(col['列',indexOf(col['列','身份证号')+5,18),'**********'),'电话')+3,11),'**********')










作者: 给给    时间: 2023-6-9 13:50
yhdata_lyaa 发表于 2023-6-9 10:19
参考
replace(replace(col['列',mid(col['列',indexOf(col['列','身份证号')+5,18),'**********'),mid(r ...

好的 谢谢 这边先学习这个脚本
作者: yhdata_lyaa    时间: 2023-6-9 14:00
yhdata_THHJZFCz 发表于 2023-6-9 13:50
好的 谢谢 这边先学习这个脚本

只替换身份证就是这样
replace(col['列'],mid(col['列'],indexOf(col['列'],'身份证号')+5,18),'**********')

把两个嵌套在一起了

作者: 给给    时间: 2023-6-9 14:04
yhdata_lyaa 发表于 2023-6-9 14:00
只替换身份证就是这样
replace(col['列'],mid(col['列'],indexOf(col['列'],'身份证号')+5,18),'******** ...

身份证号手机号脱敏中间的几位数字,其余保留,如131****5432,这样可以嘛?
作者: yhdata_lyaa    时间: 2023-6-9 14:17
yhdata_THHJZFCz 发表于 2023-6-9 14:04
身份证号手机号脱敏中间的几位数字,其余保留,如131****5432,这样可以嘛? ...

可以,你双击看一下那几个函数的介绍,看看数字的位置和大小怎么写


作者: 给给    时间: 2023-6-9 16:33
yhdata_lyaa 发表于 2023-6-9 14:17
可以,你双击看一下那几个函数的介绍,看看数字的位置和大小怎么写

嗯嗯 好的喔 谢谢lyaa 要这两个函数结合一起使用才可以实现这种文本中复杂一些的数据脱敏




欢迎光临 永洪社区 (http://club.yonghongtech.com/) Powered by Discuz! X3.4