[AI分析] 数据集常见操作

寻找新技能 显示全部楼层 发表于 2021-4-1 14:16:05 |阅读模式 打印 上一主题 下一主题

数据集常见操作有如下几种类型:

part1:转换为数字列使用

可以将字符串类型的字段转换为数字列,在元数据上选中字段或者在细节数据选中字段的列头点击“更多”图标,菜单中选择选择转换为数字列选项,同样在元数据或细节数据中点击更多图标可以编辑或者删除新转化的列。

在字符串类型的字段上点击更多图标,菜单中选择转换为数字列,打开转换为数字列对话框,如图:

【原始字段】需要转换为数字列的字段。
【名称】数字列名称,默认名称是 “ 数字列 ”,可以对名称进行修改。
【数字 & 货币 & 百分比】根据列数据选择相应的格式。例如数据为 20%,选择的格式应该为百分比。

例如:
原始数据如图:

将 “ 百分比字符串 ” 转化为数字列 “ 百分比 ”,格式选择 “ 百分比 ” ;将 “ 浮点数字符串 ” 转换为 “ 浮点数 ”,格式选择 “#,##0.##”。预览数据如图:

新建生成数字列后,会自动选中该列,如果有纵向滚动条会滑动到新列的位置并选中新列。
在已创建的数字列上点击更多图标,可对其进行编辑、删除。

part2:预览数据使用

点击预览数据集,用户可查看数据集的细节数据,也可以点击数据集列表上预览数据集图标进行查看,详情可参考附录->界面介绍->数据集界面部分。

预览细节数据时,预览行数默认是1000行,可以根据需要设置预览行数,预览行数可以是在1-20000之间的任意整数。修改后可点击页面空白处或按键盘Enter键进行应用。

例如:将查询中预览行数设为5,应用后数据中只显示5条数据

part3样本行数:

元数据模块可以设置样本行数,目的是在编辑报告中绑定数据时可以使用合适数据量的样本。

•全量数据

当勾选全量数据时,样本行数处于置灰状态。用户在编辑报告中可以对数据集的全部数据进行编辑,在编辑模式下绑定框的左上角显示“ 全量数据”。

•样本行数

用户可设定采集样本数据的行数。假设用户设定为5000 行,则用户在编辑报告中只能对前5000 行数据进行编辑,在编辑模式下绑定框的左上角显示“ 数据样本行数 5000”。

例如:将数据集中样本行数设为50,在编辑报告中使用表格组件绑定该数据集,在编辑模式下绑定框的左上角显示"数据样本行数 50".

part4新建文件夹:

用户可以在数据集编辑界面创建文件夹,按照需求将字段拖拽到文件夹中,便于对字段进行分类。也可以在维度或度量中多选列右键新建文件夹,将多个字段同时放在文件夹下。通过维度和度量字段创建的文件夹分别对应存放在维度区域和度量区域。当字段较多时,通过创建文件夹可以使界面看起来更有层次感,展示起来更清晰。

例如:

某一 SQL 数据集中存在 BUDGET_COGS,BUDGET_MARGIN,BUDGET_PROFIT,BUDGET_SALES 这四个与预算相关的字段,如下图所示 :

用户在元数据区域按Ctrl键同时选中这几列,然后右键选择新建文件夹,如下图所示 :

在弹出的对话框中,中文环境下会默认名称是 “ 文件夹 ”,修改文件夹名称,点击确定按钮则在元数据区域生成文件夹。


确定后,相应字段便会自动放到文件夹中,如下图所示:

被拖拽到文件夹中的字段不可以通过鼠标的拖拽来调节位置。

在 bi.properties 中配置属性 manual.sort.repository=true,可以通过拖拽鼠标调整维度、度量、各个文件夹下列的排序,如下图所示:

part5维度与度量:

维度表示数据分类的角度或方面。是系统内置的一个分类,也可以把维度理解成组的概念,把这些方面分组,把数值类型做统计汇总。维度可以为转变成度量,连接数据模块的界面可以修改,只是整个数据集级别的改动,所有使用报表的地方,都按照数据集里的划分来判断维度还是度量。

度量表示可被用于衡量和统计的数值,销售,利润,成本等都是度量。以此,数值类型的数据都被划分为度量了,度量可以变为维度。

回复

使用道具 举报

高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |联系社区管理员|《永洪社区协议》
返回顶部