查看原文
其他

民营银行生存法则“唯快不破”,华瑞银行风险特征计算平台如何做到实时响应

高玉娴 InfoQ数字化经纬
2024-09-16
嘉宾 | 丁清华 上海华瑞银行风控数据团队负责人
编辑 | 高玉娴
上海华瑞银行是我国首批试点的五家民营银行之一,2014 年获批,2015 年正式开业,秉承“服务实体经济,服务小微大众”的使命初心,坚持“聚焦普惠,建设特色鲜明的智慧银行”的战略定位。这意味着,其业务一方面要能够满足高并发,应对瞬时的多客户业务申请;另一方面还要满足实时性,支持快速(甚至是秒级)的业务决策。
在日前举办的 FCon 大会期间,上海华瑞银行风控数据团队负责人丁清华接受了 InfoQ 采访。他表示,民营银行想与其它传统金融机构竞争,只有“唯快不破”。拿贷款申请举例,不能让客户等 24 小时,而是需要做到准实时或实时响应。这就要求其风险系统架构可以实现准实时、秒级审批。
但是,和绝大多数金融机构一样,华瑞银行的风控信息系统建设也并非一步到位,而是在演进过程中逐步优化和迭代。比如,在华瑞银行成立初期,风险特征的计算功能耦合在贷款业务系统中,这造成了以下问题:一是架构不清晰,风险特征计算功能较弱,依赖于业务系统的功能;二是缺乏统一的特征管理平台,造成重复开发,资源浪费;三是变更频繁,日常特征变更及策略迭代都需要进行生产变更,增加系统运行风险。
随着大数据计算技术的成熟,华瑞银行通过与成熟商业机构合作,使用离线和实时计算技术,建设了风险特征计算平台。利用 Blink、DataHub 实现实时风险特征计算,利用 maxcompute 建设风险数据集市,离线计算风险特征,建设统一的应用平台实现风险特征的统一定义、计算、管理和服务调用等。
“未来,我们希望通过这个平台可以快速定义风险特征,比如,把一些功能开放给风险策略人员和模型人员,当他们发现新的风险情况时,就可以自主定义并新增上线一些特征,以及时地满足风险评估需求。”丁清华向 InfoQ 介绍,接下来华瑞银行将围绕“数据 + 风控 + 科技”共同建设的思路,继续完善风险特征计算平台功能,比如:为策略经理提供更便捷的特征定义、配置、计算、测试、回溯和上线;为模型经理提供特征分布监控、稳定性分析、特征重要性分析等功能;为产品经理提供系统运行监控、元数据管理和分析、使用分析等功能。
以下是对话全文(经 InfoQ 进行不改变原意的编辑整理):
InfoQ:请简要介绍一下华瑞银行风控体系建设以及布局背后的设计逻辑。
丁清华:目前,华瑞银行数字风控部门在内部构建了一个数字风控大脑。系统从 2020 年开始规划并且落地,主要包含了数据基础平台和风险数据集市。
其中的基础数据包括两类:一是从外部实时调用过来的数据,比如央行的征信报告、朴道和百行等持牌征信机构发布的三方数据信息等等,比如针对一些银行的新客户,就需要调用这些外部数据;二是银行内部构建的数据湖,它主要集成了行内已有客户的数据情况,比如过往申请信息、还款信息、交易行为信息等等。
基于这些基础数据,我们构建了风险特征计算平台,也称为“特征工厂”。而经过特征工厂计算后的数据主要划分为两部分:一部分是实时的,会提供给线上数字化风险审批系统,用于反欺诈审批和授信审批;另一部分是离线的,会提供给策略分析和模型算法人员,用于回溯分析,并不断修正和优化风控模型和策略。
InfoQ:可以结合具体例子介绍一下“特征工厂”是怎么运作的吗?
丁清华:特种工厂的作用是进行风险特征计算,其中的计算方法和流程是根据融资申请来的,不同的产品和风险策略经理会提出一系列不同的风险特征需求。
例如,第一步先做反欺诈,确定核验客户的身份真实性,包括查证提供的手机号和身份证号在公安系统或其他可信渠道中是否为有效号码,是否被识别为黑名单,同时还要对活体进行检测校验;
第二步,进行用户评级,从客户的基本信息、人行征信信息、收入信息等多维度数据,去评价客户的等级;
第三步,根据客户的等级,核定最终的授信额度和定价。
在这个过程中,每个阶段需要调用哪些数据源进行计算,是由流程中的具体风控决策人决定的。
InfoQ:那么,大数据技术是如何融入到我们整个风险特征计算平台中的?
丁清华:特征计算首先要满足高并发,因为银行业务要能够应对瞬时的多客户业务申请,这要求我们的 TPS 达到几百以上,整个计算过程达到秒级;其次,要满足实时性,尤其对于华瑞银行这样以线上业务为主的银行机构来说,在消费贷场景,很多情况要求我们能够快速提供贷款决策。
为了实现这两个标准和目标,一方面,我们通过自己编写的程序和功能模块,满足高并发的数据接入、数据获取、数据拿回等需求;另一方面,在一定多的数据基础上,我们在 2020 年成立了大数据风控部门,采用商业化 FLink 实时计算框架,通过将任务进行细致的拆分,借助它强大的任务调度和管理功能,实现资源的定制化、合理化配置。
InfoQ:在做计算框架选型时,我们主要考虑哪些因素?
丁清华:首先,产品的成熟度,比如在金融行业是否有丰富的实施案例;其次,产品服务商的服务能力,比如持续升级和售后的能力,以及出现问题后的响应能力;其三,技术在业界的认可度,例如某些技术门槛太高或者冷门的技术,我们尽可能不去选择,因为一个普及的技术意味着掌握技术的人更多,解决问题的速度更快。
特别是对于华瑞银行这样的中小型银行而言,在做系统选型决策时,都要尽可能全方位地了解相关情况,结合拥有的资源,匹配最合适的技术和方案,从而减少试错成本的投入和没必要的浪费。
InfoQ:目前整个风险特征计算平台运行情况如何,还有什么关键要突破的问题?
丁清华:现在我们的整套框架已经初具规模,下一个要攻破的问题就一个字——快。
我们希望通过这个平台可以快速定义风险特征,比如,把一些功能开放给风险策略人员和模型人员,当他们发现新的风险情况时,就可以自主定义并新增上线一些特征,以及时地满足风险控制的需求。
而不是像现在这样,需要依赖定期窗口的科技版本发布才能新增特征。虽然我们通过管理手段,目前已经可以增加科技版本发布的频次,但是这并不是最终目标。我们计划在明年第二季度可以实现上述这些功能,比如,为策略经理提供更便捷的特征定义、配置、计算、测试、回溯和上线;为模型经理提供特征分布监控、稳定性分析、特征重要性分析等功能;为产品经理提供系统运行监控、元数据管理和分析、使用分析等功能,支持该功能的是丰富维度的风控数据和特征,以及各类风控特征的定制模版及支持函数。整个建设过程紧紧围绕“数据 + 风控 + 科技”的思路展开,发挥风险数据、策略模型和科技人员在各自领域的专业优势。
其中的关键突破点是在整个数字风控大脑体系的所有关键系统中支持低代码化和热部署,以便严格区分科技版本变更和风险特征变更,从而在不涉及科技版本迭代的前提下,实现自主的风险特征定制和策略迭代。
InfoQ:之前行业内有蛮多人认为,除了互联网,比如阿里双十一这种场景,确实对实时性要求特别高需要用上 Flink,其他行业对实时计算的要求其实没有这么高,不一定非要用 Flink,在您看来是这样吗?
丁清华:对于华瑞银行来说,我们的业务主体都在线上,想与其他传统的金融机构竞争,只有“唯快不破”。拿贷款申请举例,我们不能像传统金融那样,让客户等待一段时间,而是尽可能做到实时响应。这就要求风险系统架构可以实现准实时、秒级审批。
除此之外,华瑞银行还有一块业务是与互联网公司合作的,例如我们作为资金方,有一部分主要来自互联网公司,针对这部分流量入口的贷款申请,它就会与互联网业务的实时性要求一致。假如我们的审批响应速度太慢,流量可能就会分发给其他的资金机构。
InfoQ:那么对于银行风控系统架构而言,除了实时性的要求,还有哪些别的要求是比较重要的?
丁清华:数据隐私问题是银行特别关注的。在获取数据之前,我们必须获得用户的授权和认可,以便合理合法地使用这些数据。因此,在具体协议上会有对应的规范,包括约定用户数据的采集范围、采集用途以及数据存储方式等等都必须符合监管要求。
除此之外,风控特征的数量和质量代表着金融机构的风险管理和风控水平。在金融行业,风控数据数量和质量基本上就决定了机器学习或人工智能能力的天花板,选择合适的模型只能逼近上限。当风险特征数量越多、维度越多,我们对客户主体的认知就越全面,对交易风险的评估也更精准。
而风险特征平台的价值在于,尽可能降低技术的使用门槛,以便风险策略经理可以更便捷地挖掘出更多的风险特征,同时支持这些海量的数据计算。
在这个过程中,我们会帮风险人员把基础数据抽象成他们看得懂的数据,包括数据码齐、梳理,明确统计维度,如果是离散变量该如何处理,连续变量又该怎么处理。比如,某个客户在不同规模的银行机构的贷款金额、最近一次贷款的时间、借贷次数、逾期金额等等,这些都是不同的统计维度。我们需要把这些基础信息整理好,提供给风险人员基于这些数据,再用对应的风险评估方法进行特征计算。
InfoQ:您认为如果把大模型放到现有的风控体系下,会发生什么样的“化学反应”?
丁清华:首先,风控业务有一个特点,即风控决策需要具有可解释性。当某笔申请贷款审批通过或被拒绝,确定了某个贷款额度,背后的原因要能够解释,比如申请人的收入状况、违约记录等等,这些都是依据。但是,大模型在面对千亿级的参数或特征时,背后是没有对这些风险特征进行定义的,它中间缺少了一层可解释性。
另一方面,在风控领域使用大模型还需要解决数据数量和质量的问题。一是样本量要足够大,二是特征维度要足够多。但是,某个金融机构自身说掌握的数据是特别有限的,可能是某一部分人群的数据特征,或者某个地域人群的数据特征。
从目前来看,行业里还没有任何一家机构可以掌握能够达到如此庞大规模和覆盖面的风险特征数据(比如全国所有个人的基本信息、违约记录、消费习惯、交易流水等等),绝大部分全国性数据主要还是在政府机构、监管机构(人行、银保监会等)部门。
所以,如果要实现风控领域的大模型落地,我认为还是需要自上而下去推进。基于某个领域大模型,各个金融机构再按照自身的客群定位进行参数的微调。
这也是为什么大模型目前的落地主要还是集中在客服、营销、代码辅助、内部知识库共享等场景,因为该场景在互联网上有足够多的公开数据进行训练。对于金融机构而言,风控是非常核心的业务,距离落地应用还有一定的距离。一个重要前提是,模型的可解释性和数据归集问题必须解决。
 内容推荐
11月19日-20日在上海成功举办的首届 FCon 全球金融科技大会,以「科技 + 金融,激发创新力量」为主题,汇聚了来自金融龙头企业的数百名技术高管,掀起一场探讨新时代金融科技未来的高潮。经征得大会分享嘉宾同意,InfoQ 数字化经纬为您奉上精彩演讲 PPT!关注「InfoQ 数字化经纬」,回复「金融数智化」即可获取 PPT,深度洞悉科技趋势,助您引领金融创新未来!


 福利通道
  • 关注InfoQ数字化经纬公众号,回复抽奖可以参与本周活动,有机会获得精美礼品。

  • 关注InfoQ数字化经纬公众号,回复「进群」加入数字化读者群交流。


今日好文推荐

银行如何以“价值链视角,数字化手段”思考规划落实中央金融工作会议精神

实现“数据资产当日达”,这家证券公司如何在内部推行“全民用数”?

中信银行:用 AI 搞定普惠型财富管理的高成本问题

平安银行:云原生转型背景下的质效探索与思考

广发证券:金融科技浪潮下的 IT 架构升级之道

继续滑动看下一个
InfoQ数字化经纬
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存