近年来,数据分析因其自身显而易见的应用价值,从而得到了迅猛发展,与此同时“数据化管理、数据化运营、数据化决策”等的管理理念也渗透到了各行各业。放眼当下,企业间的经营竞争越发剑拔弩张,面对日益激烈的竞争环境,各级决策者更加注重对海量数据的分析利用。在如此背景下,Smartbi与中国信息化协同创新专委会、中国电子表格应用大会、天善智能、CDA数据分析师、168大数据、极光数据等共同举办了“数创未来、智能有我——Smartbi数据分析论坛(北京站)”活动。


在活动的分享环节中,民生银行总行科技部朱江先生,生动有趣的向与会观众阐述银行利用数据分析所创造出的价值,并全面展示了日前刚获得2016年度中国金融行业最佳创新项目奖的阿拉丁自助分析平台。为了满足更多数据分析爱好者的学习愿望,我们特将民生银行阿拉丁的分享内容整理出来,希望大家喜欢。


第1阶段:

2000年以前银行很多数据都是手工处理的。2002年银行开始步入到信息科技时代,当时的数据相对是离散的,分布在不同的系统中,民生银行也成为国内第一个做数据仓库的银行,当时的目标是把离散在各个核心系统的数据能够进行统一的加工整合,形成可以看到全貌数据的数据仓库平台。这个过程持续了3年的时间,当时我们称为数据大集中。


第2阶段:

是2006-2007年,这段时间监管机构提出了新的要求,我们对数据的口径、数据的质量也就有了新的要求。


第3个阶段:

民生银行做了内部改革,最简单来说就是我们把条线化的数据管理变成了矩阵式的数据管理。在座可能很多做数据工作的都知道,如果是做条线型数据统计相对比较简单,逐级汇总即可,但数据一旦变为矩阵式管理就比较麻烦,数据汇总的口径会成倍地增加,那么这个阶段我们也是为了更好的适应相关数据口径的需求,以适应矩阵式管理。


第4阶段:

我们不再满足于只是把数据用来做统计这么简单的事情,我们希望把数据上升到可以做一些分析工作,所以在2010年-2012年这段时间,我们进行了关于数据分析、数据探索方面的工作,在这段时间里面我们做了金融易管家、零售客户流失、私人银行客户提升等分析。


第5阶段:

对历史数据做了很多分析工作后,从2012年开始我们觉得这样的数据分析也满足不了银行的需求,那么我们便期望用数据做预测分析。从2012年到2014年,我们和国内外一些合作厂商去做一些数据挖掘方面的探索,去做一些客户流失的预测、不良贷款可能上升的预测、企业不良违约的可能性等预测工作。


第6阶段:

则是阿拉丁阶段,这部分暂时放到后面去讲。


了解完民生银行在数据分析上的历史变化,我们再谈谈数据分析要满足的五类用户,以及阿拉丁是以什么策略为内部用户提供服务的。


在银行里,数据分析服务的对象包括领导层、业务部门、中后台部门等等,他们有各自的职责,也就产生了不同的关注点,根据我们的实际经验特总结成“快准全灵活”五个字,同时也指导着数据分析服务工作发展方向:


“快”——对应的是行领导这层,行领导要求每天早上八点半以前必须看到头一天所有业务的数据统计情况,这就是所谓的头寸表数据,其中包括一些异常指标。


“准”——指的是监管报送和相关审计的相关人员,虽然他们从时效性来说不像行领导这么快,但是他们对数据的口径包括数据的准确性要求非常高。


“全”——对中后台部门来说,他们需要看到各种数据,从每个客户的明细数据到一些机构的对比数据,甚至包括同业之间的分析数据,以支持中后台的风控审计还有其他一些的工作。


“灵”——我的理解是“管用”!这对应一线客户、理财经理、营销人员而言,因为我们给他们提供数据就是为了帮助他们做营销服务推动的,所以如果你给到他的数据不管用、不灵,他们就没有办法达成很好的业绩,也就会对数据失去信心,所以对一线人员提供数据更应强调数据的灵活、管用、有价值,真真正正减少他们的工作量,带来效率提升。


“活”——对应的是分行的业务管理人员,因为我们知道分行的业务管理人员工作更多的是业务疏导和绩效考核,那么不同的时间段、不同的地域,他主营的业务方向包括他的考核机制都会随时调整发生变化,所以这就要求我们的业务管理人员看到的数据具备足够强的灵活性,能够随时去进行相关的调整和口径的变更。




而从大多数银行(包括以前的民生银行)满足数据服务的模式上,一般都是传统数据仓库的方式。这种模式大家都知道,先是一线提出数据需求,数据需求到分行,分行经过审核之后,如果分行自己可以搞定最好,否则就上行到总行,总行在从全口径对数据进行加工处理,然后把相关的数据结果反馈给分行,这是一个非常标准的数据处理作业流程。


但是这个流程处理有一个非常致命的问题,就是没有考虑到业务需求是无穷无尽的,而且是海量的、急迫的,同时真正能做数据分析的工作人员缺十分紧缺,这两点构成了非常突出的矛盾,这也是我们在2011-2014年遇到的最严重的问题。当时我们发现各种数据需求会不断地往上提,以至于总行的人怎样加班都还是处理不完,导致需求只能排队解决,排队的结果是什么,支行营销的数据结果递交总行,总行需要大概两到三周的时间才能有所反馈,这个时候活动早做完了,数据已经没有办法支持营销了。一方面数据人员累死累活,另一方面营销人员不满意,所有人都在抱怨,这就是传统的数据仓库模式在这个发展阶段暴露的主要弊病。


顺理成章的,第6个阶段的“阿拉丁”项目诞生了。我们希望通过阿拉丁平台,让一线做业务及营销分析的人员自己能够变成数据专家,能够在平台上把需要的数据查询出来,而且能够辨别数据,去做相关的数据分析,这就是建设阿拉丁平台的初衷。


阿拉丁是信息管理部(现为科技部)提供的海量数据查询、展示、交互、分析的整体解决方案。我们希望它是个开放的、自由的、可扩展的平台,容纳很多的应用产品、开发工具、报表工具、数据挖掘分析和数据探索工具。从数据层面,阿拉丁后台整合大量的不同数据源,包括结构化和非结构化的,甚至实时的流动数据等。基于平台功能和海量数据,由我们一线人员自己去衍生出大量切合分行一线业务需求的应用,用于支持其做相关的工作,如流失、舆情、精准营销等等。下面我们就看看阿拉丁上的几个自助应用案例。




第一个案例产生于阿拉丁平台第一期,当时阿拉丁刚试推广了三个月左右。某分行马上给我们提交了一个报告,叫潜在高价值客户的挖掘。从银行角度,一般按照存款多少来区分客户价值,但是这个标准真的合理么,答案是否定的,举一个最简单的例子,如果马云到民生银行办了张卡就放了五万,那我们怎么定义他?我们把他当成银卡客户么?该分行一线人员结合自身的经验,在阿拉丁平台上做了一些探索,寻找潜在高价值客户的消费规律(比如用特殊手机号、开豪车、住高档社区等),以期发现“潜在的马云”。于是,我们根据各种各样的合理规则整理出标签,给我们每个客户进行客户画像,对潜在客户进行重新挖掘和营销。最后这项工作给该分行带来了6.1亿的金融资产的提升,那么这在银行界已经是一个很不错的成绩了,更关键的是它节约了90%的营销费用,这就是使用阿拉丁平台实现精准营销的典型应用。


第二个案例通过一张普通的堆积柱为某分行节省了几百万费用。这张柱状图形(非原图)中,不同颜色代表不同ATM机交易的类型,蓝颜色代表查询交易,红颜色代表转账交易,绿色代表取款交易等等,不同颜色代表不同交易类型。这张图可以说明三件事情。第一、我们ATM机布局不合理,我们能看到某些ATM机使用量只占其他ATM机的一半,尤其靠后的ATM机,他们的位置摆放是有问题的,我们可以把ATM机进行一个重新的地理位置的划分,提高他们的使用效率,能够优化我们结构布局的合理性。第二、我们看到部分柱状条里面,有的可能有四个颜色,但是有的只有三个颜色,这是为什么?这说明我们有的ATM机虽然是存取一体机,但是有的存钱功能被用到的情况很少,这说明它周边的人对它是没有存款需求的,一个存钱一体机和只取不存的机器成本差了几万块钱左右,所以我们通过这个就可以把存取一体机换成更便宜的取款机,我们可以做一个机器类型的优化。第三、底下绿色的线代表的是取款的情况,并不是取款机使用量越高取款量越高,像排名第一的ATM机,它虽然使用量很好,但是取款量并不是最高的,那反之,有的使用量虽然不高,但是取款量很大,那在银行,这种存款管理和取款管理是一个涉及成本的问题,我们把钱存到提款机里,对银行来说是成本,我们不能把大量的现金放在ATM机里,但如果我们放的很少也会有问题,那意味着要经常过去加收,加钞带来的时间成本和运营成本也是一大开销。我们怎么在两者之间取得平衡,我们到底放多少钱合适,多久加收一次合适?通过这张图我们就可以做一个归纳性的总结,然后发现一些规律,所以就这一张图,讲了三个问题之后,根据这个方案落地,最后得知仅这一项就为该分行节约了几百万的费用。


第三个案例源于财务部门的业务分析。财务每天会看见大量的转账记录,其实之前并没有人关注这些转账记录有什么意义。但是现在阿拉丁平台除了提供数据以外,还给他们提供了很多像Smartbi这种产品,能帮助他们做一些简单的数据分析的工作,而且这些工作他们的学习成本非常低,可以零门槛入手,他们利用Smartbi将自己手里客户的转账交易情况做了一个简单的归类,发现有些客户存在一个很有意思的情况,就是每个月定期往其它账号上转钱,而且转账金融基本差不多。经过抽样了解发现,这些都是中小企业的会计,于是把这些人的名单发给对应的客户经理,这些客户经理开始逐个公关,他们大概花了有三周的时间,在一个城市说动了近百家企业,把他们所有的工资卡换成了民生银行的,带来了上千个工资卡客户。(工资卡是银行普遍喜欢的,因为个人都不会注销自己的工资卡,而且还会保留一部分活期存款在其中)。所以通过简单的挖掘,一个财务人员给当地的支行带来了很好的效益的提升,也使得客户经理一年的绩效考核都提前完成了。这些都是我们把阿拉丁平台开放之后,让业务人员接触到数据之后,利用平时自身的业务经验,在结合数据工具创造出的价值。


第四个案例也是精准营销,也是结合地理信息的客户画像。如果你接到客户经理打电话说要送给自己礼品卡。但是取礼品卡需要你从南三环到北五环,那你可能不仅不接受这个活动,可能还会产生一定的抱怨。那我们根据这种情况,一线业务人员就会按照客户日常的行为轨迹,进行客户关系的维系。这行为轨迹是怎么出来的?比如你经常取钱的地址,或者你常用POS机刷卡的地址,我们就能大致推算出这个客户日常活动的区域,也就能把客户经理选派到和你非常接近的区域,由他来给你做日常的维护及联系,这样不仅方便客户、也提升了用户体验。


这些都是在没有阿拉丁之前很难做到的,因为这些需求太个性化,太细节。如果分行和支行把这种需求提上来,业务人员早累死了,但是我们把平台开创出来以后,所有的一线人员可以自己做这种事情,他们根据自己的想法做用户的区域划分,做客户营销/筛选,就能极大的创造出他们业务的真正价值。


阿拉丁平台想要达到这些效果,需要依赖于一个强大平台的技术支撑。整个阿拉丁平台是架设在一个云平台上。首先从数据层面来说,阿拉丁平台希望能够让所有一线业务人员直接看到全面的数据,而不是几张日常都能看到的考核表/客户交易明细表。阿拉丁目前接入全行所有核心系统,所有的明细数据,以及行外的监管、征信、外汇的数据,包括一些实时交易额数据/日志数据/流数据等。同时阿拉丁本身里面所有的软件以SAAS的方式对用户进行提供,提供非常好的灵活可伸缩性,不管在线的数据分析用户是10人、100人、1000人,甚至以后到几千个人,阿拉丁依然可以实现弹性的扩充,因为其底层架构是基于虚拟化IAAS按用户单位划分实施的。


阿拉丁不是只提供数据,它的目标是提供数据、工具和环境。那么工具这层阿拉丁提供什么呢?包括全口径快查的元数据定位工具、在线自助的查询和多维分析工具和数据挖掘的分析工具(包括R),共同面向一线人员提供选择。因此,阿拉丁在前期的推广阶段,也投入了大量的时间精力,在Smartbi等厂商的协助下完成了数百人次的工具使用培训工作。


Smartbi是最早参与阿拉丁平台构建的工具软件,目前升级到V9的新版本。在过去的几年时间,Smartbi以高效的明细数据获取和导出能力,对移动端的支持,以及直接使用Excel进行报表设计和数据分析的特色、获得了一线人员的认可。尤其让业务人员去熟悉一个报表工具,其实是挺困难的,但是所有人都精通excel,当报表开发过程和使用过程跟excel结合起来的时候,就降低了所有业务人员使用的门槛,这也是我们一线人员非常喜欢Smartbi的一个原因。


最后一个是定制化能力,其实这点是作为项目负责人最看重的一点,国外的一些报表工具比较好,技术很先进,但是国外报表软件不可能提供源代码级的定制化修改。而每个银行,包括各个行业可能都会面临着把报表产品和自己系统整合的需求,尤其是我们这个阿拉丁平台,要求Smartbi做了很多深度改造和整合,以满足全面的数据安全需求。


最后,预祝阿拉丁平台能够促进“蜕变”,为民生银行培养千人规模的数据分析挖掘团队,也希望更多一线人员贡献业务经验,形成更大的数据分析产品群落,最终帮助民生银行在业务上贡献直接的价值!感谢大家对阿拉丁的关注,谢谢!