永洪社区

标题: 数据分箱 [打印本页]

作者: 取数    时间: 2022-5-30 17:47
标题: 数据分箱
有学号,报读课程,学费3列数据

我想做成按照学号对后面的课程计数,对总学费求和,然后根据不同的报读课程数以及总学费分箱统计



报读课程数 对学号非重复计数
1门
2门
2门以上


报读金额分组 对满足条件的学号非重复计数
0-500
500-1000
大于1000



作者: 永洪Tech-Lu    时间: 2022-5-30 17:47
本帖最后由 永洪Tech-Lu 于 2022-5-30 19:06 编辑

1. 新建一个计算列计算出每个学号对应报的课程数,即count(col['学号']),按照该值进行数据分箱即可。
2. 新建一个计算列计算出每个学号对应的总学费,即sum(col['学费']),按照该值进行数据分箱即可。
作者: Il.Mare    时间: 2022-5-30 18:06
您稍等
作者: Il.Mare    时间: 2022-5-30 18:14
您要在一个表实现这个效果吗?
作者: 取数    时间: 2022-5-30 18:22
永洪tech-ab 发表于 2022-5-30 18:14
您要在一个表实现这个效果吗?

是的呢,一个表内可以实现吗
作者: 取数    时间: 2022-5-31 10:10
永洪Tech-Lu 发表于 2022-5-30 18:54
1. 新建一个计算列计算出每个学号对应报的课程数,即count(col['学号']),按照该值进行数据分箱即可。
2.  ...

对应学号的分箱要如何处理呢请问




欢迎光临 永洪社区 (https://club.yonghongtech.com/) Powered by Discuz! X3.4