概述说明自助数据集支持跨库查询,当用户查询数据的范围比较广,并不限于一个数据库时,可以跨多个数据库进行查询。
实现跨库查询的前提条件:保证系统中的“跨库联合数据源”和“高速缓存数据库”有效,且进行跨库查询的数据库已经同步到跨库联合数据源中。
目前支持做跨库的数据源类型包括:高速缓存库、Hadoop_Hive、星环、Vertica、CH、Greenplum、Infobright、Oracle、DB2 V9、MySQL、MS SQL Server、Spark SQL、Teradata_v12、Informix、IMPALA、PostgreSQL。
示例分析业务需求描述某企业的生产部门和销售部门有各自的数据信息存储库,现在公司上层要求结合库存数据和销售数据进行综合分析。
具体要求有:
1、各个地区的销售情况,主要通过销售额数据体现,并且能够对区域进行下钻,查看下级省份和城市的销售情况。
2、不同类别的产品库存情况。
3、不同类别的产品在各个地区的订购量情况。
4、不同类别的产品销售情况,主要通过销售额数据体现,通过产品类别选择查看所属产品的销售情况。
需求及数据分析由于生产部门和销售部门的数据分别存储在不同的数据库:生产部门的数据存储在基于Oracle数据库的“Stock”数据源中,销售部门的数据存储在基于MySQL数据库的“Sales”数据源中。
因此该综合分析需要进行跨库查询,创建一个跨库数据集,并可以用该数据集设计一个自助仪表盘。