查看原文
其他

​案例丨​基于数据挖掘的银行业务集中耗时分析

金融电子化 金融电子化 2021-08-11

文 / 昆仑银行运营服务中心    郭阳秦

现代商业银行竞争日趋激烈,为争夺客户资源,提高经营效益,银行纷纷提高业务办理效率和服务水平,同时减少人工成本支出。伴随金融科技纵深发展,银行在柜面业务纷纷引入业务集中处理机制,将前台业务逐步向后台集中迁移,并在后台建立一套标准化、流程化的处理模式,进一步提高了业务集约化运营水平。


银行在采用业务集中后台处理后,大幅提高了业务处理效率。但在运行过程中,发现部分处理流程耗时较长,影响了业务的高效运转。为了完善和深化业务集中处理模式,需要分析问题发生原因,找到解决方案,采取积极的管理对策。


理论来源

关联规则算法主要用于寻找数据集中项之间的关联关系,揭示了数据项之间的未知关系,基于样本的统计规律,进行关联规则挖掘。根据所挖掘的关联关系,可以从一个属性的信息来推断另一个属性的信息,当置信度达到某一阈值时,就可以认为规则成立。


本文通过对业务集中操作类项目进行分析,提取影响业务耗时的相关因素,通过采用关联规则算法,探索业务耗时长和业务因素之间的关联关系,并制订针对性的解决方案,提升业务办理效率。


具体做法

1.总体分析方法

本次业务耗时分析的总体流程如图1所示。提升业务办理效率,找出影响业务办理的关键规则,为改善业务耗时提供借鉴。本次挖掘建模主要目标如下。

图1 业务耗时分析建模流程图


一是根据业务集中办理过程中的相关因素,挖掘因素与耗时的关联关系。二是对关联关系进行分析,提取最有效的关联信息,提出优化分析建议。


2.具体分析方法与过程

(1)数据获取。一是从业务集中系统提取近1年期间,业务类型为个人存款开户和综合签约业务共近80万笔,筛选其中业务耗时大于6分钟(全流程平均时间约3分钟)的异常业务共计9000条。二是通过业务集中系统导出前台柜员和后台业务集中处理中心人员因业务差错问题进行沟通的交流数据。三是通过业务集中系统查询9000笔业务的办理客户的年龄、职业等相关数据。


为案例演示需要,对敏感性数据进行了变形处理。


(2)业务情况分析。分析个人存款开户和综合签约业务的数据情况。


一是耗时大于7分钟业务仅占比1.6%,该业务整体办理效率高。二是对异常业务(耗时大于6分钟)进行分析:业务办理包括了全单录入、全单审核、差错处理和前后台沟通交流等环节。三是上述异常业务中,前后台沟通交流平均时长201秒,其他环节加起来最长总计小于110秒。


综上所述,个人存款开户和综合签约异常业务耗时长的原因主要在于沟通时间较长,接下来将对造成沟通时间较长的原因进行深入挖掘。


(3)数据预处理。一是对提取的沟通交流数据进行加工,计算每一笔任务号的交流时间,并通过任务号与耗时长的业务匹配。二是分析业务日期、办理时点、机构、年龄、职业、沟通时长等数据,剔除不完整的数据。


(4)数据变形。由于Apriori关联规则算法无法处理字符集连续型数据,为了将原始数据格式转换为合适建模的格式,对数据进行离散化处理。通过聚类和分类方法对记录中的属性进行离散化处理:将业务日期分为工作日、休息日、节假日三类,将办理时点聚类为早高峰(8-10点)、早低峰(10-12点)、午间低峰(12-14点)、下午高峰(14-19点)四类,将机构聚类为东北地区、陕西地区、北疆地区、南疆地区四类,将年龄聚类为未成年客户(18岁以下)、青壮年客户(18-35岁)、中年客户(35-51岁)、老年客户(51岁以上)四类,将职业分为低知识程度客户、中知识程度客户、高知识程度客户三类,将沟通时长分为短和长两类(以5分钟为界限),并对每类数据进行标识(见表1)。采用关联规则算法,挖掘以上属性的关联关系。原始数据经过数据预处理后,根据聚类标识形成的建模数据。


表 1  聚类数据代码表


(5)模型构建。本次耗时业务关联规则建模流程图(见图2)。

图2 关联规则模型流程图


模型主要由输入、算法处理、输出部分组成。输入部分包括建模样本数据的输入、建模参数的输入。算法处理部分是Apriori关联规则算法,输出部分为关联规则的结果。


模型具体实现步骤为:首先设置建模参数最小支持度、最小置信度,输入建模样本数据,然后采用Apriori关联规则算法对建模的样本数据进行分析,以模型参数设置的最小支持度、最小置信度以及分析作为条件。如果所有的规则都不满足条件,则需要重新调整模型参数,直到输出关联规则结果。


目前,如何设置最小支持度与最小置信度,没有统一的标准,根据业务经验设置初始值,然后经过多次调整,获取与业务相符的关联规则结果,本次挖掘经过多次调整并结合实际业务分析,选取模型的输入参数为:最小支持度10%,做小置信度0.95。模型运算完成后,得到关联规则结果见表2。


表 2  关联规则结果表


(6)模型结果分析。根据上述运行结果,得到多个关联规则,提取其中有意义的关联规则,可以分析得出以下结论:一是工作日、低知识程度客户、北疆地区、沟通时间长等属性关联程度高,支持度为14.5%;二是工作日、早高峰、青壮年客户、沟通时间长等属性关联程度高,支持度为13.5%;三是工作日、早高峰、陕西地区、沟通时间长等属性关联程度高,支持度为13.5%。


实施效果及推广应用

通过关联规则的挖掘结果为银行网点提出如下的建议:一是时间方面,各网点应在工作日早高峰时段(8-10点)增加柜台人力资源配置;二是地域方面,在北疆的网点加大柜员的培养;三是在客户方面,针对低知识程度、青壮年客户(如28岁环卫工人或农民),应尽量将客户分派到经验丰富的柜员办理。


关联规则可以广泛应用于业务操作及操作风险关键因素挖掘等多个方面,为优化业务流程、完善业务系统功能指明了方向,为提升业务效率提供了数学理论支撑。





往期精选:

(点击查看精彩内容)


● 案例丨从“中间件”到“中台”——技术架构与应用架构的演进

● 案例丨银行网点遭遇关停潮?深圳这家银行创新厅堂营销可否复制

● 案例丨阳光保险中间件的最佳实践

● 案例丨办公环境全流程数据安全管理方案——“零信任”“微内核”客户端解决方案

● 案例丨信息科技外包管理探索实践





关于仿冒我刊收费的声明





我刊自创刊以来,从未向投稿人收取过任何费用。任何以刊发文章为名向投稿人收取费用的行为,均属于对投稿人的欺诈行为。


我刊官网地址为 www.fcmag.com.cn。

我刊投稿邮箱为 fcmag@fcmag.com.cn。


对于仿冒我刊网站、网页的违法行为,我社将追究其侵权责任,以维护我社和投稿人的合法权益。仿冒网站、网页举报电话:010-88232443




《金融电子化》新媒体部:主任 / 邝源  编辑 / 潘婧 傅甜甜

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存