[报错信息处理]
通过自服务数据集操作两个数据集市,生成报告,保存警告
因为是跨DB取得数据所以做了两个数据集市,在通过自服务数据集经过连接和汇总等操作得到自己想要的数据,但是在保存生成的报告时有下面警告,请问大家怎么解决
免责声明:本文不代表本站立场,且不构成任何建议,请谨慎对待。
版权声明:作者保留权利,不代表本站立场。
_贝贝
显示全部楼层
发表于 2022-1-11 17:02:09
ZhangNX
显示全部楼层
发表于 2022-1-11 17:14:48
_贝贝
显示全部楼层
发表于 2022-1-11 18:19:33
ZhangNX
显示全部楼层
发表于 2022-1-11 18:51:44
这个回复是有帮助的。但是根据这个回复,难道我在Map side join数据集时需要先把数据集放在新建的自服务数据集或者组合数据集中才可以实现join的操作么?其次,我的版本是9.2.2是支持两个大表的Map side join 的,我是在将组合数据中的子数据集入集市的过程中出现了问题,我已经将两个大表的关联条件加入了切片列,是否需要将聚合的条件也勾选上切片列呢?
环环
显示全部楼层
发表于 2022-1-11 19:20:11
本帖最后由 永洪tech-秀秀 于 2022-1-11 19:59 编辑
就是在组合的时候,如果集市文件满足条件就可以做Map-side join。可以参与join的两个子数据集需要保证联接条件中选择的联接列都经过分片,且在入集市时勾选的分片列都要做为联接条件。
ZhangNX
显示全部楼层
发表于 2022-1-11 19:46:03
我是两个不同源的数据集组合,也是先组合再入集市么,是否需要勾选join结果加速。其次性能测试提示问题是因为我的做法会影响速度才发出的,不是错误导致不能运行是么?
环环
显示全部楼层
发表于 2022-1-11 19:53:03
ZhangNX
显示全部楼层
发表于 2022-1-11 20:13:23
抱歉我的描述可能有些模糊,问题是两个不同源的数据集,其中每个数据集都是单表查询,我需要对这两个数据集进行组合时,应该怎么做呢?
环环
显示全部楼层
发表于 2022-1-11 20:31:17
如果是不同源的只有通过组合数据集,两个单表的数据量大概是多少呢。如果数据量大尽量走Map Side Join,前提是如果是大表join大表入集市时要用分片列,如果是大表join小表用事实表——维度表,然后在用集市数据集做组合。