三月下旬新内容速递丨JVM调优、权限体系与函数进阶

春日渐暖,学习正酣!三月下旬更新聚焦JVM参数实战、权限体系拆解、多种分析法与AI架构入门,助你在数据与技术的融合中持续进阶!


一、场景应用精选

【数析课堂】别只盯着总数!用“结构分析法”一眼看穿业务真相》→跳出总量思维,深入业务结构发现机会。
【旭日图】数据的“家族族谱”与深度透视镜》→通过旭日图展示多层级数据关系,助力钻取分析。
【函数课堂】Fixed 与 Exclude 怎么选?》→场景化讲解函数选择逻辑,告别计算度量困惑。
【数析课堂】分组法:分析师的“分层透视眼”,一眼看穿客户与业务本质》→掌握分组分析法,实现精细化运营洞察。

二、技术经验分享

那些年漏配错配的,JVM参数们》→深入解析JVM常见配置误区,提升系统性能与稳定性。
别慌!权限体系其实超简单》→轻松掌握权限设计核心逻辑,快速落地数据安全管控。

三、AI知识更新

【AI每日一学】讲一下单Agent架构vs多Agent系统的特征、优点和缺点》→对比单Agent与多Agent系统,为智能体选型提供参考。

四、任务持续上线

【BI知识闯关】那些年漏配错配的,JVM参数们》→通过闯关巩固JVM参数配置要点。
【AI知识巩固】讲一下单Agent架构vs多Agent系统的特征、优点和缺点》→强化AI架构理解,夯实智能体基础知识。
【数析课堂】结构分析法知识巩固》→练习结构分析,掌握业务构成洞察技巧。
【图表应用】旭日图—你的专属“层级解码器”》→实战旭日图绘制,解锁层级数据可视化。
【BI知识闯关】别慌!权限体系其实超简单》→检验权限体系学习成果,提升实战能力。
【函数】Fixed 与 Exclude 怎么选?》→深入辨析两类函数,精准匹配分析场景。
【数析课堂】分组法知识巩固》→强化分层分组思维,提升客户与业务分析效率。

阳春三月,学习正当时,快来社区参与挑战,一起探索数据新视界!

麦粉社区
>
帖子详情

[金融] 银行零售客户流失预测

解决方案 发表于 2021-10-9 16:32
发表于 2021-10-9 16:32:32
  现在银行产品同众化现象普遍存在,客户选择产品和服务的途径越来越多,客户对产品的忠诚度越来越低,所以客户流失已经成为银行业最关注的问题之一。而获得新客的成本远高于维护老客户成本。因此,从海量客户交易数据中挖掘出对流失有影响的信息,建立高效的客户流失预警体系,提前做好营销挽留,降低流失风险尤为重要

  这里提到了数据挖掘,那什么是数据挖掘呢?其实就是从大量的数据中去发现有用的信息,根据这些信息来辅助决策。数据挖掘揭示的是未知的、将来的数据关系,主要的作用就是预测,采用计算机技术、统计学、模型算法等。

  模型算法有分类算法、回归算法、聚类算法等,每种算法类型又包含多种不同的算法,例如分类算法,就包含逻辑回归、朴素贝叶斯、决策树等,使用的编程语言有Java语言、Python,大家听了是不是觉得很专业、很复杂?今天给大家推荐一款简单易用的工具——Smartbi Mining,是由Smartbi推出的独立产品,旨在为个人、团队、企业所做的决策提供预测性分析。

  Smartbi Mining具有流程化、可视化的建模界面,内置实用的、经典的统计挖掘算法和深度学习算法,并支持Python扩展算法,基于分布式云计算,可以将模型发送到Smartbi统一平台,与BI平台完美整合

  简单拖拉拽就可轻松完成预测,实在是太方便。下面我们就看看银行零售客户流失是如何进行预测的吧。

  我们先了解一下数据的流程。数据挖掘有一套标准的流程,可以对数据进行各种科学的处理和预测,从而发现数据本身隐藏的规律。具体流程如下:
  第一步:业务理解。明确目标,明确分析需求。
  第二步:数据准备。收集原始数据、检验数据质量、整合数据、格式化数据。
  第三步:建立模型。选择建模技术、参数调优、生成测试计划、构建模型。
  第四步:评估模型。对模型进行全面的评估,评估结果、重审过程。

数据准备
  业务理解这里不再多说。数据准备,初步判断客户可能会流失的情况,如银行卡交易量逐月下降等,对跟这些情况有关的数据进行采集、格式化。如下为本次示例中整理的数据表字段。

1.png

建立模型
  客户是否流失,是一个分类问题,所以选择分类算法建立模型进行训练。
  1) 选择数据源。本次使用的是已准备好的示例数据源中的“银行零售客户数据”。


2.png


  2) 数据处理。
  ❶数据字段名不是很清晰,可以通过预处理在元数据编辑节点修改。

3.png

  点击最下方的“运行”按钮,再通过节点右击选择“查看输出”可以运行看一下结果情况。

4.png

  ❷“特征离散”。
  现在开始对数据的处理,如对年龄上总资产数据来说是要进行离散的;就拿年龄来说如果其他特征都相同,年龄20岁还是40岁对预测影响比较大的,而20岁还是21岁影响不大,为了提前减少预测误差,需要对数据按照范围重新划分。
  数据划分使用的是“特征工程下”“特征离散”。
  这里离散方法为等距离散,离散区间为10,离散特征列后缀名为Buckerizer可更改。
  选择的特征列有:年龄、月均代发、最大代发、AUM月均、AUM月初。

5.png

  查看一下执行结果:可以看到新增加了5列,即是对原数据进行的离散操作。数据处理到这里就完成了。

6.png

  3) 算法模型。
  这里需要说明的是,目前算法必须要有特征输入的过程。特征有2种途径,1种是特征选择,1种是卡方特征选择。两种的区别是如果已经知道哪种特效影响比较大,直接选择即可;如果不确定可以将字段列选择后,再设置可能影响的列的数量。

拖动节点进行特征选择。

7.png

  “特征选择”,除去离散前的原字段、不必要的字段(如编码等)还有作为预测输出的字段(连续三个月AUM小于1000),所有的字段都可以选择来参与算法预测(此案例中共计16列);“卡方特征选择”,同上选择16列后,比如我们认为有影响的特征只有8个可以设置。

8.png

  客户是否流失,是一个分类问题,所以选择分类算法建立模型进行训练。

选择算法节点:分类算法-逻辑回归。
  算法节点需要进行训练和验证的过程,需要先进行数据的拆分,拆分成训练数据集合测试数据集。拆分后可以对逻辑回归算法训练,模型算法训练好之后需要进行校验。

评估模型
  选择数据预测节点左侧连接训练模型,右侧连接拆分的测试数据集。在通过评估节点进行算法预测的评估。

9.png

  查看一下评估节点的分析结果,3万条数据中预测错误的仅有4834个。


10.png


  主要看加权F1值(对精确率和召回率综合考评的结果),这里是0.8445还是不错的。

11.png

  如果不满意预测结果,我们还可以更改模型参数等。当然还可以查看卡方特征选择下的预测情况。这个就是运行,不断调优的过程了。

12.png


  以上就是银行零售客户流失预测案例分享。

  Smartbi Mining通过提供基于Web的可视化的界面,数据挖掘的每一步流程通过功能点的拖动和参数(属性)配置即可实现。

---------------------------------------------------------------------------
(我是分割线)

  Smartbi Mining 数据挖掘包括3个大的模块:
  (1)机器学习:主要是建立和管理项目,是数据挖掘的主题功能
  (2)模型管理:模型管理是针对机器学习里面的模型保存功能进行模型管理。模型保存功能是将已经训练好的模型进行保存,下次有相同案例的时候可以直接使用模型,不用重复训练;主要是用于大数据量或者训练时间比较久的模型。
  (3)服务管理:与模型管理功能类似,也是针对已经训练好的模型。不同之处是在模型里以服务的方式进行发布,方便第三方使用。

13.png

  现在主要介绍机器学习功能。
  点击进入机器学习页面可以看到有两个列表:一个是实验项目一个是案例项目。

14.png

  实验项目:展示目前存在的所有项目
  案例项目:系统内置案例,主要用于产品学习。
  比如聚类功能如何在产品上实现,可以查看“深圳企业信息聚类”这个案例。
  点击创建项目可以基于示例模型进行学习修改,如需保存,点击另存为。
  点击机器学习管理界面右上角“创建机器学习项目”,可以通过示例数据源学习数据挖掘的流程和操作(创建文件目录设置名称)。操作界面如下:
  最左侧是节点树:包含了已经开发好的所有节点。中间是主要实现区域,将节点之间拖拽过来即可。右侧是节点的参数配置和属性配置。

15.png

发表于 2021-10-13 17:53:16
回复

使用道具 举报

发表于 2021-10-14 10:46:00
学习
回复

使用道具 举报

发表于 2021-10-26 08:33:36
学习学习学习
回复

使用道具 举报

发表于 2024-5-31 09:45:39
厉害厉害。
回复

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册

4回帖数 0关注人数 3883浏览人数
最后回复于:2024-5-31 09:45

社区

指南

AI

搜索

快速回复 返回顶部 返回列表