二月内容合辑丨磁盘清理、图表进阶与AI探索

新春二月,学习正酣!二月更新聚焦磁盘清理、图表进阶、场景深化与AI探索,助你在数据智能的道路上驰骋前行!

一、场景应用精选

酱油的数字化呼吸:当千年技艺遇上数据分析》→探索传统工艺与数据分析结合,领略数字化赋能案例。
【联合图】你的业务“双视角侦察机”使用指南》→学习联合图实战应用,提升业务分析效率。

【瀑布图】财务的“瀑布流水账”,一眼看穿数字背后的故事》——用瀑布图拆解财务数据流转,洞悉每一笔增减的来龙去脉。

【函数】Exclude函数:你的数据分析“一键清屏”神器!》——掌握Exclude函数用法,轻松排除干扰数据,聚焦关键信息。

二、二次开发视频更新

(5-2)扩展包开发知识点——知识库升级以及查询对象》→深入学习扩展包开发,掌握知识库升级与查询对象技术。

三、技术经验分享

Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→学习磁盘空间清理方法,释放存储资源,优化系统性能。

四、AI每日一学

【AI每日一学】讲一下MCP的三个场景及优势与局限性》→每日一学AI知识,快速掌握MCP的核心要点。

五、新年活动进行中

新年第③弹 | 新春祝福驰骋:马上送祝福,立马领麦豆!》→参与新春祝福活动,赢取麦豆奖励,开启新年好运。

六、任务持续上线

【BI知识闯关】Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→通过知识闯关巩固磁盘清理技巧,提升运维能力。
【行业场景】制曲环节合格率诊断实战》→深入制曲生产场景,学习合格率诊断分析方法,助力质量提升。
【图表应用】驾驭“联合图”,成为业务的双视角指挥官》→掌握联合图使用技巧,实现业务数据的多维度洞察。
【AI知识巩固】讲一下MCP的三个场景及优势与局限性》→巩固AI知识,了解MCP的典型场景及其优缺点。

【图表应用】瀑布图一眼看穿数字背后的故事》——实战演练瀑布图,让财务、库存等流水数据一目了然。
【函数】Exclude函数实战任务》——通过任务实战,熟练运用Exclude函数进行数据筛选与分析。

磁盘清理释放空间,联合图表洞察双维,Exclude函数精准筛选,AI探索拓展认知——二月合辑,与数据共赴新春新征程!

麦粉社区
>
帖子详情

SQL数据集

高级开发 发表于 2019-11-21 15:37
发表于 2019-11-21 15:37:51
SQL数据集是通过在文本区中输入SQL语句,来定义数据集条件和内容的一种数据集。对于熟悉SQL语句的技术人员来说,这是一个较为快捷创建的方式。
纯SQL问题的解答
SQL数据集可以是纯SQL语句,但是如果在SQL数据集中用到“参数”、“用户属性”、“系统函数”等系统资源,必须把资源拖到SQL语句对应的位置,不能手写。
包含这类资源的SQL数据集就不是纯SQL。
嵌套问题的解答
SQL数据集需要嵌套运行。
如文本语句select distinct Card_Type_Cd as c1 from debit_card,会变成 select T2.c1 as F4 from (select distinct Card_Type_Cd as c1 from debit_card) T2 运行。
这样处理是因为在报表中需要对SQL做处理,如果使用SQL数据集不嵌套一层的话,就无法做到去修改原始的SQL数据集,这样SQL数据集中的预览数据和报表中的过滤、排序等功能就无法实现。
嵌套效率问题的解答
我们测试过SQL Server和MySQL,通过Explain看数据集优化,发现嵌套一层对效率不会有太大的影响。
即上例两个语句执行效率相差并不多,一个执行代价是0.366,嵌套后代价是0.367,相差只有 0.1%。

操作入口在“数据集”界面新建SQL数据集。
1、进入“数据集”界面的入口:
入口1:选择系统快捷菜单 数据集 。

入口2:选择“系统导航栏”的 数据准备 ,选择“数据准备”界面主菜单 数据集

2、新建原生SQL数据集的入口:在“数据集”界面的表格树目录区,在现有文件夹的更多操作,选择 新建数据集 > SQL数据集

功能说明
  • 目前SQL数据集的创建只能基于数据源创建。因此若是只使用SQL数据集创建报表,则不需要创建业务主题、语义层定义等操作。
  • 技术人员可以先在数据库中写好SQL并执行通过,然后把这个SQL语句复制到SQL数据集中,并从左侧拖拽参数等对象到相应的位置。
  • 书写SQL数据集后,一定要进行检测输出字段类型操作。
界面介绍
“SQL数据集”界面主要分为以下几个区域:
  • 可选资源区:该区列出了所有可被SQL数据集使用的资源。
  • SQL文本区:该区为用户书写SQL数据集表达式的区域。
  • 工具栏:列出了所有可用于编辑SQL数据集的工具按钮。
  • 属性区:属性区用于设置数据集相关资源的属性。
可选资源区可选资源区列出了所有可被SQL数据集使用的资源。用户只需将各资源拖到相应的区域,如将参数拖拽到where条件下和字段进行关联。
可选资源包含:表字段、计算字段、过滤器、业务视图字段、参数、数据源相关业务主题的业务属性、函数、用户属性、其他数据集的字段等。但是建议SQL语句先写好,只对需要的对象如参数、用户属性、函数等进行拖拽。
显示别名/名称:该区针对“关系数据源”、“联合数据源”和“指标数据源”下的各资源:表、字段、视图、存储过程、表副本和视图副本,提供了“显示名称”和“显示别名”的功能。默认以“别名”显示。

模糊搜索资源:我们可以该区最下方的搜索引擎对相关资源快速搜索定位。可以在搜索区输入所需字段的真名或是别名进行模糊搜索。

SQL文本区SQL文本区用于输入SQL语句及其对象。
SQL数据集输入的注意事项
  • SQL数据集可以使用的资源:表/视图、字段、参数、函数、用户属性(使用时请用括号括起来)
  • 编写SQL数据集时,支持拖动“参数”、“用户属性”、“系统函数”等对象,其他的建议手写;
  • 不支持Select * from .....的写法;
  • 如果有多条语句,用分号和回车隔开;
  • 所有的Select字段需要显式给定一个别名,例如:select T1.fieldA FA from table T1。
  • 对字段进行重命名时,注意各种数据库使用方式跟平时使用的不同。如:SQL Server不需给别名加单引号,Oracle不需要加as和双引号。
  • SQL数据集不能区分输出字段类型,默认设置所有输出字段都是字符型,需要 检测输出字段类型
  • 表关系视图的定义对SQL数据集不起效;
  • 数据行权限设置对SQL数据集不起效。
  • 设置参数缺省值,在SQL数据集中的设置方法为:
工具栏工具栏上放置一些常用功能按钮。

工具栏的按钮说明如下表,对应的功能点击超链接跳转到详细说明:
按钮名称
说明
保存
保存数据集到默认路径。
另存
保存数据集到用户指定路径。
视图
用于区域的显示和隐藏。包含显示/隐藏资源区、显示/隐藏属性区。
格式化SQL
对用户编写的SQL语句按照一定的格式进行展现,便于阅读。
检查输出字段规范
对输出字段按照规范进行检查,列出不符合规范的字段信息。
定义多重表头
对SQL数据集的表头进行修改添加,形成多重表头。
参数布局
调整参数在SQL数据集对应的报表中的位置。
Excel模板设置
把当前数据集的数据结果填充到用户自定义的Excel模板中。
高级设置
用于设置当前数据集的缓存策略和分页策略。
预览数据
对新建或修改的数据集进行预览。
查看SQL
查看该数据集的SQL语句。
显示估计的执行计划
对数据库内部的SQL执行过程进行的解释。
数据抽取
用于将当前数据集的数据抽取到MPP。

属性区属性区用于设置数据集相关资源的属性。它主要包含两个部分:数据集输出区和属性面板。
  • 数据集输出区:该区显示数据集输出的相关资源,该区通常与“属性面板”结合起来用于对这些资源的属性进行管理。包含:输出字段属性检测输出字段类型私有参数输出参数告警设置
  • 属性面板:该区需要与“工作区”结合使用,单击工作区中的任一资源,即在属性面板中列出该资源的相关属性信息。用户可以在属性面板中重新设置资源的相关属性。

输出字段在数据集输出区会列出所有的输出字段。如下图,选中字段,在下面属性区可以对部分属性进行设置。

下面是对字段属性的详细说明:
对象
设置项
说明
输出字段
标识
字段的全局唯一标识,由字段类型和其ID号共同构成。不允许重新设置。
名称
字段的真名。不允许重新设置。
别名
字段的别名,即显示的名字。允许重新设置。
描述
对字段的相关描述,被用于其提示信息中。允许重新设置。
数据类型
字段的数据类型,主要包含:整数、浮点、字符串、日期、时间、日期时间、文本、对象、集合。允许重新设置。
数据格式
根据数据类型选择输出字段的数据格式,该格式选项在 数据格式 中进行设置。允许重新设置。
排序
选择是否对字段进行排序,字段的排序方式类型有:升序、降序。
转换规则
选择是否对该字段进行转换规则,若设置转换规则,其所选的转换规则在 转换规则 中定义。
脱敏规则数据脱敏 是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。

检测输出字段类型SQL数据集中的“输出字段”须通过右键菜单中的 检测输出字段类型 功能将当前数据集中输出字段的数据类型从数据库中读取出来。
操作执行原因:
SQL数据集若是不进行检测输出字段类型操作,则默认所有字段类型都是字符串类型。
数据集一旦定义后,其所有输出字段的类型均默认为“字符串”型,当输出字段与数据库中相应字段的数据类型不匹配时,会导致利用该SQL数据集创建报表后进行的分析失误,因此需要用户手工检测输出字段类型。

执行步骤
选中输出字段节点,右键选择 检测输出字段类型

如SQL数据集包含参数值,则会弹出“自动检测输出字段”对话框。选择参数值,点击 输出字段检测 按钮。则会进行检测操作。

执行结果:操作成功后,我们可以看到如下字段类型发生变化,为字段本身的类型。





高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

0回帖数 0关注人数 8333浏览人数
最后回复于:2019-11-22 23:57

社区

指南

快速回复 返回顶部 返回列表