只有len, 没有lenb，这个分列，或者提取怎么操作（如图） - 第2页 - 问答

显示全部楼层

changda56 发表于 2022-7-30 17:44
我取的“中文列”的代码，没有起到任何作用啊。是不是写的有问题啊。

我在脚本里测试了一下，没啥问题啊，难道列里面不行吗

显示全部楼层

changda56 发表于 2022-7-30 17:44
区分点，有“公司” 有“出版社”，数据没截全，所以您这个方法，不可取。谢谢。 ...

extractNTH(col['列'], "[\u4e00-\u9fa5]+",1)
你参考下

显示全部楼层

yhdata_yzm 发表于 2022-8-1 10:13
extractNTH(col['列'], "[%u4e00-%u9fa5]+",1)
你参考下

基本解决我的问题，如果说有一点不完美，那就是比如“国开童趣（北京）xxxx公司”，这个带括号的，给抽取成了“国开童趣”四个字。其他的都对。

显示全部楼层

Nero 发表于 2022-8-1 10:13
我在脚本里测试了一下，没啥问题啊，难道列里面不行吗

yhdata_yzm 这位工程师，extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题，你那个，确实是有问题的。

显示全部楼层

changda56 发表于 2022-8-1 10:45
yhdata_yzm 这位工程师，extractNTH(col['列'], "[%u4e00-%u9fa5]+",1) 解决了我的问题，你那个，确实是 ...

棒～

显示全部楼层

changda56 发表于 2022-8-1 10:44
基本解决我的问题，如果说有一点不完美，那就是比如“国开童趣（北京）xxxx公司”，这个带括号的，给抽取 ...

再往那个正则表达式几遍再加符号就行