找文章 / 找答案
精选问答 更多内容
12
返回列表 发新帖

只有len, 没有lenb,这个分列,或者提取怎么操作(如图)

Nero玄铁二 显示全部楼层 发表于 2022-8-1 10:13:36
changda56 发表于 2022-7-30 17:44
我取的“中文列”的代码,没有起到任何作用啊。是不是写的有问题啊。

我在脚本里测试了一下,没啥问题啊,难道列里面不行吗
回复

使用道具 举报

yhdata_yzm 显示全部楼层 发表于 2022-8-1 10:13:50
changda56 发表于 2022-7-30 17:44
区分点,有“公司” 有“出版社”,数据没截全,所以您这个方法,不可取。谢谢。 ...

extractNTH(col['列'], "[\u4e00-\u9fa5]+",1)
你参考下
回复

使用道具 举报

changda56玄铁三 显示全部楼层 发表于 2022-8-1 10:44:33
yhdata_yzm 发表于 2022-8-1 10:13
extractNTH(col['列'], "[%u4e00-%u9fa5]+",1)
你参考下

基本解决我的问题,如果说有一点不完美,那就是比如“国开童趣(北京)xxxx公司”,这个带括号的,给抽取成了“国开童趣”四个字。其他的都对。
回复

使用道具 举报

changda56玄铁三 显示全部楼层 发表于 2022-8-1 10:45:27
Nero 发表于 2022-8-1 10:13
我在脚本里测试了一下,没啥问题啊,难道列里面不行吗

yhdata_yzm  这位工程师,extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题,你那个,确实是有问题的。
回复

使用道具 举报

Nero玄铁二 显示全部楼层 发表于 2022-8-1 20:36:12
changda56 发表于 2022-8-1 10:45
yhdata_yzm  这位工程师,extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题,你那个,确实是 ...

棒~
回复

使用道具 举报

yhdata_yzm 来自手机 显示全部楼层 发表于 2022-8-1 20:39:42
changda56 发表于 2022-8-1 10:44
基本解决我的问题,如果说有一点不完美,那就是比如“国开童趣(北京)xxxx公司”,这个带括号的,给抽取 ...

再往那个正则表达式几遍再加符号就行
回复

使用道具 举报

12
高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |《永洪社区协议》
返回顶部