中级数据分析师认证课程 脚本场景1-计算列的使用
课程内容 1. 计算列:应用场景、添加方式(数据集/报告)、分类和阐述(维度计算列/聚合计算列/多粒度表达式/动态计算函数) -拓展点:计算列的运行机制、聚合计算列和维度计算列的差异点、多粒度表达式不能应用在自由式表格中 2. 报告脚本运行机制:分类和执行顺序(装载时运行/变化时运行/组件脚本) 计算列允许利用数据集中已存在的数据列创建新的数据列。即基于已有列,创建一个新的列(或字段),其值或成员由所控制的计算来确定。 在永洪中,数据集和报表都可以创建新的计算列,在数据集上创建的计算列,存储于数据集中,在报告中创建的计算列,存储于报告中。新的计算列可用于图表、文本、参数、过滤等组件绑定数据。 计算列测试1 sum(if col['市场分布'] == '南部市场' then col['销售额'] end) 计算类型:基础函数、SQL语句 基础函数即永洪产品支持的函数,采用产品规定语法,如果是直连数据库,可以转为SQL语法下推数据库执行。 SQL语句需按照SQL语法写入,产品不做转换,直接将写入的内容合入到SQL语句中下推数据库执行。 维度计算列/聚合计算列/多粒度表达式/动态计算函数 维度计算列:行拼接 col['市场分布'] +"-"+ col['市场级别'] 聚合计算列:列级别的数据聚合操作 sum(if col['市场分布'] == "南部市场" then col['利润'] end) / sum(if col['市场分布'] == "南部市场" then col['销售额'] end) 多粒度表达式 fixed固定维度 fixed(col['产品种类']::sum(col['销售额'])) Exclude exclude(col['产品种类'],col['产品名称']::sum(col['销售额'])) Include包含维度 include(col['产品名称']::sum(col['销售额'])) 动态计算函数 diff(sum(col['销量']),PREVIOUS) 脚本执行顺序 报告打开时,脚本、参数、数据的整体顺序如下: •“装载时运行”的脚本,是最先执行的。此脚本定义在报告上。 •通过输入框输入的参数。 •所有组件的查询数据。 •“变化时运行”的脚本。 •组件上的脚本。 报告变化时: •变化时运行的脚本。 •组件上的脚本。
|