Nero玄铁二
发表于 2022-8-1 10:13:36 显示全部楼层
changda56 发表于 2022-7-30 17:44
我取的“中文列”的代码,没有起到任何作用啊。是不是写的有问题啊。

我在脚本里测试了一下,没啥问题啊,难道列里面不行吗
回复

使用道具 11#

yhdata_yzm
发表于 2022-8-1 10:13:50 显示全部楼层
changda56 发表于 2022-7-30 17:44
区分点,有“公司” 有“出版社”,数据没截全,所以您这个方法,不可取。谢谢。 ...

extractNTH(col['列'], "[\u4e00-\u9fa5]+",1)
你参考下
回复

使用道具 12#

changda56玄铁三
发表于 2022-8-1 10:44:33 显示全部楼层
yhdata_yzm 发表于 2022-8-1 10:13
extractNTH(col['列'], "[%u4e00-%u9fa5]+",1)
你参考下

基本解决我的问题,如果说有一点不完美,那就是比如“国开童趣(北京)xxxx公司”,这个带括号的,给抽取成了“国开童趣”四个字。其他的都对。
回复

使用道具 13#

changda56玄铁三
发表于 2022-8-1 10:45:27 显示全部楼层
Nero 发表于 2022-8-1 10:13
我在脚本里测试了一下,没啥问题啊,难道列里面不行吗

yhdata_yzm  这位工程师,extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题,你那个,确实是有问题的。
回复

使用道具 14#

Nero玄铁二
发表于 2022-8-1 20:36:12 显示全部楼层
changda56 发表于 2022-8-1 10:45
yhdata_yzm  这位工程师,extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题,你那个,确实是 ...

棒~
回复

使用道具 15#

yhdata_yzm
发表于 2022-8-1 20:39:42 显示全部楼层
changda56 发表于 2022-8-1 10:44
基本解决我的问题,如果说有一点不完美,那就是比如“国开童趣(北京)xxxx公司”,这个带括号的,给抽取 ...

再往那个正则表达式几遍再加符号就行
回复

使用道具 16#

12
高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
1500W

用户等你来哦

Copyright   ©2012-2025  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |《永洪社区协议》
返回顶部