二月内容合辑丨磁盘清理、图表进阶与AI探索

新春二月,学习正酣!二月更新聚焦磁盘清理、图表进阶、场景深化与AI探索,助你在数据智能的道路上驰骋前行!

一、场景应用精选

酱油的数字化呼吸:当千年技艺遇上数据分析》→探索传统工艺与数据分析结合,领略数字化赋能案例。
【联合图】你的业务“双视角侦察机”使用指南》→学习联合图实战应用,提升业务分析效率。

【瀑布图】财务的“瀑布流水账”,一眼看穿数字背后的故事》——用瀑布图拆解财务数据流转,洞悉每一笔增减的来龙去脉。

【函数】Exclude函数:你的数据分析“一键清屏”神器!》——掌握Exclude函数用法,轻松排除干扰数据,聚焦关键信息。

二、二次开发视频更新

(5-2)扩展包开发知识点——知识库升级以及查询对象》→深入学习扩展包开发,掌握知识库升级与查询对象技术。

三、技术经验分享

Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→学习磁盘空间清理方法,释放存储资源,优化系统性能。

四、AI每日一学

【AI每日一学】讲一下MCP的三个场景及优势与局限性》→每日一学AI知识,快速掌握MCP的核心要点。

五、新年活动进行中

新年第③弹 | 新春祝福驰骋:马上送祝福,立马领麦豆!》→参与新春祝福活动,赢取麦豆奖励,开启新年好运。

六、任务持续上线

【BI知识闯关】Smartbi磁盘空间告急?这篇清理指南让你轻松腾出几十GB!》→通过知识闯关巩固磁盘清理技巧,提升运维能力。
【行业场景】制曲环节合格率诊断实战》→深入制曲生产场景,学习合格率诊断分析方法,助力质量提升。
【图表应用】驾驭“联合图”,成为业务的双视角指挥官》→掌握联合图使用技巧,实现业务数据的多维度洞察。
【AI知识巩固】讲一下MCP的三个场景及优势与局限性》→巩固AI知识,了解MCP的典型场景及其优缺点。

【图表应用】瀑布图一眼看穿数字背后的故事》——实战演练瀑布图,让财务、库存等流水数据一目了然。
【函数】Exclude函数实战任务》——通过任务实战,熟练运用Exclude函数进行数据筛选与分析。

磁盘清理释放空间,联合图表洞察双维,Exclude函数精准筛选,AI探索拓展认知——二月合辑,与数据共赴新春新征程!

麦粉社区
>
帖子详情

[数据建模] 数据建模实战:方寸之间玩转购物篮分析

智分析 发表于 2021-9-27 17:11
发表于 2021-9-27 17:11:45
  购物篮分析是零售行业里非常重要经典的一个模型,曾经被大家津津乐道的啤酒与尿布的故事,相信大家都还记忆犹新,这个故事很好地诠释了商品关联性对销售额的提升作用,时至今日,仍有很强的现实指导意义。这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。购物篮分析的实现方法有很多,下面教一下大家如何去制作一个完整的购物篮分析模型。

一、前言:
  在开始制作购物篮分析模型之前,我们先来理解一下购物篮分析模型的价值在哪里。购物篮分析的本质是研究商品与商品间的关联关系,比如分析A商品和哪个商品搭配会卖的更好,或者分析客户在购买了A商品之后,对B商品会产生什么影响等等。通过这种交叉分析,我们便可以对客户感兴趣的商品组合去做出相应的调整,或者据此去深入研究更高层次的推荐算法。

1.png

  做购物篮分析还得先理解三个概念,支持度、置信度与提升度。支持度指A商品和B商品同时被购买的概率,用公式表示就是支持度=同时购买A和B订单数/总购买订单数;置信度是指购买A之后又购买B的条件概率,用公式表示就是置信度=同时购买A和B订单数/购买A的订单数;提升度指的是先购买A对购买B的提升作用,用公式表示就是提升度=支持度/((购买A次数/总购买订单数)*(购买B次数/总购买订单数))。看不懂的小伙伴可以看下图的举例说明,加深理解:

2.png

二、购物篮分析步骤:
  首先要准备一份零售行业的数据源,需包含单据编码、商品名称等信息,文中提供的案例数据源大家可以在根据文末提供的信息进行获取。如果用Excel做购物篮分析,难度会很大,建议用其他工具进行制作,本文选择用SQL语句的方式去制作:

3.png

  第一步,新建一个临时表,对商品名称进行交叉关联,为每一组交叉商品增加一列总订单数的字段,并把该临时表命名为t1

4.png

  执行语句后,可得出以下4个字段:

5.png

  第二步,新建一个临时表t2,对商品名称进行交叉关联,算出同时购买A商品与B商品的订单数:

6.png

  执行语句后,可得出以下3个字段:

7.png

  第三步,把t1t2两个临时表的字段进行关联:

8.png
  执行语句后,可得出以下4个字段:

9.png

  第四步,新建一个临时表t4,算出A商品的订单数:

10.png
  执行语句后,可得出以下2个字段:

11.png

  第五步,新建一个临时表t5,算出B商品的订单数:


12.png

  执行语句后,可得出以下2个字段:

13.png

  最后一步,根据支持度、置信度与提升度的公式,以及我们得出的这5个临时表的数据,我们就可以开始进行运算了。根据t3表里‘’同时购买A和B订单数‘’与‘’总订单数‘’这两个字段,我们可以算出支持度的数据。根据t3表里‘’同时购买A和B订单数‘’与t4表里‘’A商品订单数‘’这两个字段,我们可以算出置信度的数据。同理,利用‘’同时购买A和B订单数‘’、‘’购买A订单数‘’、‘’购买B订单数‘’与‘’总订单数‘’这几个字段,我们最后就可以得出提升度的数据了。

14.png

  最后得出的结果如下:

15.png

三、后续建议:
  从上面的制作过程来看,如果要制作一个完整的购物篮分析模型,过程还是挺复杂的。为了对数据建模以及多维分析有更深的认识,小编推荐大家利用智分析的数据模型去制作购物篮分析,智分析的数据模型具有非常强大的多维分析能力,不仅支持自助取数,还支持SQLMDX等高阶的查询语法。智分析的数据源接口同样也很丰富,可以连接各种数据库,也可以以Excel文件导入的方式进行导入:

16.png

  进入数据模型的界面后,便可以开始搭建购物篮分析的数据模型了,这里依然是选择用SQL查询的方法去做购物篮分析,新建一个SQL查询,输入语句,执行后便可以得出购物篮分析模型的数据:

17.png

  数据模型搭建之后,可以借助智分析自助仪表盘对购物篮分析的数据进行可视化呈现,仪表盘可以进行下钻、筛选、轮播等高级的操作,非常适合展示购物篮分析、RFM分析、ABC分析等数据模型:

18.png

  PS:关于文中提到的数据源以及模型资料,大家可以点关注之后私信我进行获取

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

0回帖数 0关注人数 6308浏览人数
最后回复于:2021-9-27 17:11

社区

指南

快速回复 返回顶部 返回列表