查看原文
其他

金融科技助力商业银行数字化风控体系建设

The following article is from 中国信用卡 Author 徐依鸣 邓博文


作者

上海浦东发展银行信息科技部 徐依鸣 邓博




随着以大数据和机器学习为核心驱动力的互联网金融的快速发展,传统商业银行面临着更为严峻的挑战,一方面是同业之间的激烈角逐,另一方面还要受到一大批新兴互联网金融科技公司的剧烈冲击,传统的风控体系已经不足以支撑日益复杂的经济环境,建设数字化风控体系势在必行。本文将以银行数字化风控体系阶段性建设成果为基础,提出数字风控方面的创新探索,旨为商业银行数字化风控体系建设提供参考。


一、全周期数字化风控体系建设成果



1.“打地基”:构建零售信贷数据集市


零售信贷数据集市是以客户为中心跨系统的数据整合,旨在打破以系统为单位的数据管理模式,实现以业务逻辑为主导,利用各种成熟的数据挖掘工具,结合各类分析工具或金融模型,采用关联、分类、聚类、时序、偏差、预测等分析技术,把分散的数据整合到统一的平台中,以满足业务拓展和风险管理的信息需求。


零售信贷数据集市建设不仅覆盖个贷、核心、网贷、反欺诈、征信、决策等传统零售风险数据源,还将客户信息、收益信息、信用卡信息、关联企业信息,甚至是行为信息、第三方来源数据等都囊括在内,实现零售信贷业务数据全覆盖,真正实现全面的数据支撑、风险管理及客户经营,最大程度发挥数据集市的应用价值,为风控体系建设打牢地基。



2.“筑高楼”:打造智能风控决策体系


基于零售信贷数据集市中实时、非实时数据,形成准确可用的标签及业务指标体系,构建从反欺诈、授信审批、贷中额度管控到贷后预警与催收的全信贷周期风控决策体系,实现根据业务风险趋势及时变化、快速迭代,做到更贴近市场、更贴近客户、更快响应。


(1)反欺诈管理


全信贷周期风控决策体系基于外部数据信息或平台运营数据,包括互联网行为数据、设备指纹、平台多头借贷、实名信息核验、偿债能力评估、团伙欺诈等基础数据,识别并防范身份冒用、恶意骗取银行贷款等信贷高风险客户,同时将机器学习应用于反欺诈管理中,采用知识图谱相关技术,利用客户基础信息等字段构建银行零售信贷客户关联关系图谱,并基于复杂网络分析技术进行分析,达到输出疑似高风险团伙的数据指标支撑业务参考判断的目的。


(2)授信审批管理


客户个体的行为看似随机,却遵循一定的统计规律,大量的交易、消费记录等历史数据均可揭示其资金需求和信用状况。基于数据集市中经过整合的内外部数据,包括客户身份特质、资产情况、履约历史、还款表现、消费能力、稳定信息等,综合应用逻辑回归、决策树等机器学习方法开发的评分模型及客户分级模型,可对借款人信用风险进行量化评估,并应用于客户筛选和客户授信。此外,基于量化测算结果制定的模型策略、规则策略和额度策略等,可用于信贷产品客户的授信审批。


在过去几年中,该行针对线上、线下的自营产品及联合贷产品,细化产品特性及风险敞口,自主开发、迭代了多个评分模型,同时持续优化迭代了审批策略,风控成效显著。在贷前授信审批环节,业务资产质量较前期显著提升,根据上线后的A/B test对照实验结果,对比产品模型策略优化前后发现,表现充分的产品单月平均贷款发放不良率降低5%~12%。


(3)贷中额度管控


基于客户贷中行为信息以及客户资产、负债、消费等更新数据构建的贷中行为评分模型,可对借款人信用风险变化进行量化评估,实现对客户的贷中深度风险运营。银行可通过该模型对存量客户按风险进行分层分类,结合客户的收入水平定期对客户额度进行调整,并制定差异化的额度管理策略,包括提额、降额、冻结、清退等措施。


(4)贷后预警管理


尽管在贷前和贷中阶段风险控制就已经启动,但仍然不能百分百规避风险,为了进一步降低风险,同时满足监管要求,加强贷后风险预警显得尤为重要。面向两种应用场景,即显性用途违规风险场景和主要信用风险场景,建立数据驱动预警机制,可实现系统自动分配、机构主动捞取、分行重新分配、分行集中处置的四位一体的预警任务分配,并支持全程在线的预警处置与预警审核任务流转。


针对贷款资金用途违规风险场景,全信贷周期风控决策体系在证券、基金、期货、信托、理财、典当、小贷、房地产等每个细类违规场景实现了预警全覆盖,并针对主要信用风险场景,围绕信用卡、对公贷款、征信、外部工商数据、行政处罚、失信被执行等维度数据更新了零售信贷客户信用风险预警点。


(5)催收管理


该行通过对网贷逾期客户建立早期催收评分卡,优化调整催收策略,完善“内催+外包”的催收模式,有效提升了催收效率,实现30天内回款率提升约5%。同时以“AI催收+人工干预”的技术手段,做强机器人催收,并逐步优化迭代机器人催收功能。



3.“布监控”:建立智能风险监控平台


围绕信贷业务全流程,基于可视化技术,银行可建立全面、集约和智能的零售信贷风险自动化监控平台,包括客群监控、业务运行指标监控、模型策略监控、风险预警监控、催收运行监控、分支机构产能监控等,实现产品运行的全方位监控,提高风控人员的决策能力,赋能银行信贷业务全流程。


(1)业务运行指标监控


在资产质量监控方面,该平台可围绕业务风险、拒贷、放款情况、逾期迁徙情况等维度,基于数据集市实时、非实时数据加工业务运行指标,如过往业务投放规模,贷款存续期、重要时点投放波动、每日余额变动趋势、逾期及不良率、风险滚动率、规模迁徙率等,实现产品经理、数据分析人员对各产品、项目风险水平变化情况的及时监测,使其能够预测出短、中期业务规模及不良的增长,并采取相应的策略调整、项目暂停、合作退出等手段。


(2)模型策略监控


在模型监控方面,该平台针对贷前申请、贷中行为及贷后催收三类评分卡,围绕授信审批、模型有效性及稳定性方面关键指标构建评分卡可视化监测报表,可实现评分卡首次建模、模型评审、模型应用、前端跟踪、后端监测、模型优化的管理闭环。


二、数字化风控体系建设的探索


大数据和人工智能已经广泛应用在信贷业务全流程。风控数据作为各个机构的重要战略资源,其获取成本高、隐私安全保护难等一系列问题正日益凸显,如何解决数据共享与隐私保护之间的痛点,更好发挥大数据在金融领域的潜力,是商业银行完善风控体系建设面临的新挑战。



1.行业解决方案


国家关于数据保护的法律条例日趋严格化和全面化,每个细分领域都出台了相应的条例和条款,这对机构间的数据合作提出更高的要求。当前,行业解决方案的技术路线主要有两种:一是基于硬件可信执行环境技术的可信计算(Trusted Execution Environment,TEE),二是基于密码学的多方安全计算(Multi-Party Computation,MPC)。其中,TEE方案的核心是以第三方硬件为载体,数据在由硬件创建的可信执行环境中进行共享。较为成熟的代表有Intel公司的SGX技术、AMD公司的SEV技术和ARM公司的Trust Zone技术。MPC方案的核心是基于密码学通过不同的方式进行加密计算,主要用到的技术有混淆电路、秘密分享和同态加密。目前,业界针对数据共享场景,利用TEE技术、MPC技术路线已经推出了一些解决方案,如联邦学习、共享学习等。



2.创新探索


从2020年起,该行开始与外部金融科技公司进行多方安全计算技术合作探索,目标是在不暴露用户隐私数据、安全合规前提下,实现数据“可用不可见”,更全面客观地分析客户的还款能力和还款意愿,提升自主风险管理能力。


多方安全计算技术合作使用秘密分享的加密计算方式,通过这种加密算法,双方对特征原值进行拆分交互、加密计算,在不泄露原值的情况下得到原值的计算结果,从而完成模型训练且保证所有原值数据均无法被反推破解。通过对比只采用单一行方数据源开发的模型效果,结果显示本次模型KS指标(模型区分能力)可提升12%~23%,证明了多维度数据有助于提升对客户的综合识别能力。



3.未来应用思考


目前国内外很多企业都在进行联邦学习或者共享学习的相关研究,尤其在金融领域的信贷风险管理是较为适宜的应用场景。


AI建模的一项基本原则是模型只能用于建模样本所能代表的群体。新冠肺炎疫情对商业银行信贷风控是一次严峻考验,在这样的突发状况之下,单机构、个人的样本量是有限的,因此银行方面可以尝试与其他机构合作,引入外部的样本数据,打破数据孤岛,实现数据共享,使数据可以渗透到信贷流程的各个环节,提升信贷风控水平,实现普惠金融的新目标。


(1)赋能申请反欺诈


目前,银行信贷申请反欺诈环节已经引入了黑名单、多头借贷、实名信息核验等强金融属性的数据。由于监管对内外部数据治理趋严,银行将不再适合直接引入外部原始数据,后续可以通过联合建模方式,利用丰富的数据信息综合判断客户欺诈风险,提前过滤高风险客户。


(2)优化反洗钱模型


通过同态加密或秘密共享的加密方式以及横向联邦学习的安全聚合机制(Secure Aggregation),银行可充分利用各家反洗钱样本,在不泄露样本的前提下合作进行交互模型训练,最终使每个参与方都可得到一个相同的模型用以独立使用。通过这种方式可以让反洗钱模型更加稳定、效果更好。


(3)搭建联合建模实验室


联邦学习的基础在于组建联邦,只有联邦的数据足够互补和完整才能形成规模效应。组建联邦的关键在于信任,因此可以由银行方面牵头搭建联合建模实验室,依托联邦学习技术本身的安全性和银行的可信赖性,确保隐私数据不被恶意破解。同时,不断宣传推广联邦学习技术以及业务价值,可以吸引更多合作方参与,实现数据和技术共享,提升业务应用价值。


(4)探究“区块链+隐私计算”


区块链作为一个去中心化、数据加密、不可篡改的分布式共享数据库,可以保障隐私计算中数据交换涉及的用户隐私,也可以保证在多个参与方的隐私计算中模型训练数据的一致性。同时,在当前区块链价值的驱动下,可以激发更多参与方提供数据、更新模型的积极性。目前,已经有一些应用区块链的联邦学习机制被提出,如“深度链”。银行可进一步对“区块链+隐私计算”进行探究,挖掘联合模型的市场价值,对现有模型不断进行迭代优化。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存