查看原文
其他

案例分享 | 联邦学习在洗钱风险管理中的应用展望

近年来,新的洗钱犯罪手法不断出现,洗钱行为隐蔽性更强,商业银行也在不断提升自身洗钱风险监测水平,从以专家规则、数据排查等传统的反洗钱监测手段向依托大数据、人工智能等新兴技术的反洗钱监测手段转变,通过对自身拥有的海量、多维度的数据进行分析挖掘,有效提高了客户洗钱风险识别的准确性。但是,在洗钱活动的放置阶段、分层阶段和整合阶段中,非法资金合法化的过程通常涉及多家金融机构及非金融机构,完整链路的数据很少只存在于单一机构。同时,由于《个人信息保护法》《数据安全法》《网络安全法》等国家法律法规关于数据安全的要求及行业竞争的存在,各机构普遍拒绝或不敢开放共享自身数据,加剧了“数据孤岛”现象,利用现有的技术手段很难做到在充分保护数据安全、隐私安全的情况下,实现数据的跨机构共享应用,给商业银行洗钱风险管理带来了巨大挑战。根据联合国相关部门的数据统计,每年通过全球金融系统洗钱的金额高达8000亿至2万亿美元,我国银行业反洗钱误报率高达95%。在此背景下,联邦学习由于其各参与方无需共享原始数据资源即可建立机器学习模型,各参与方可以在保护数据隐私、满足合法合规要求的前提下,解决“数据孤岛”问题,使得商业银行及监管部门可以应用联邦学习技术,实现不同行业、不同机构的数据安全共享,更加全面的了解可疑账户间的关联关系、交易时序及资金流向等,实现对洗钱行为的精准识别,降低误报比例。本文拟通过介绍联邦学习技术,探索商业银行如何应用联邦学习技术提高自身洗钱风险管理水平。另外通过对联邦学习技术本身的安全性和通用性的分析,指出大规模应用可能存在的问题。最后,为推动联邦学习的大规模应用,持续提升商业银行洗钱风险管理质效,提出相应的建议。
1

联邦学习技术简介
联邦学习(Federated Learning,简称FL)也称为隐私保护机器学习,是隐私计算的核心技术,其起源于Google在2016年提出的在不集中用户数据、保障用于隐私的情况下,实现谷歌输入法的智能预测功能。应用联邦学习,各参与方无需共享原始数据资源,而是只传输机器学习模型的梯度信息或参数等中间计算结果,进行信息交换、模型聚合,从而实现拥有不同数据源的各方联合建模,充分挖掘数据价值,实现了数据“可用不可见”的安全流通。联邦学习的建模效果和将整个数据集放在一处建模的效果一致或相差不大。目前业界已经有几个较为成熟的联邦学习开源框架,主要是微众银行的FATE框架、谷歌的TensorFlow Federated框架、百度的PaddleFL框架、OpenMinded的Pysyft框架等。
2

商业银行洗钱风险管理的FL应用

商业银行在洗钱风险管理中应用联邦学习技术,可以打破数据壁垒、实现数据的“可用不可见,可控可计量”的安全共享,同时全流程可验证、可追溯、可解释、可审计、可监管,为构建基于人工智能和大数据的洗钱风险管理体系夯实基础,对洗钱风险防控有重要的积极意义。本章将从洗钱风险管理的应用场景角度,具体阐述联邦学习在商业银行洗钱风险管理中的应用价值。


1.联邦学习在可疑交易甄别中的应用

目前,商业银行通过专家规则、数据排查等传统方式及大数据、人工智能等新兴技术对自身积累的海量、多维度的高质量、高价值的客户数据进行分析,识别客户风险和可疑洗钱活动。由于在洗钱活动的各个阶段中,非法资金在合法化的过程通常涉及多家金融机构及非金融机构。从整个资金的流通过程来看,仍然存在“数据孤岛”现象,商业银行单纯的对本机构积累的数据信息进行分析,不能全面的掌握非法资金流通的整个链路,不能全方位的掌握人物关联关系、账户关联关系、交易时序及资金流向等,难以有效识别洗钱行为,进而导致可疑交易的误排除或误上报。


根据中国人民银行发布的《银行业金融机构反洗钱现场检查数据接口规范(试行)》(银发〔2017〕300号)、《金融机构大额交易和可疑交易报告管理办法》,以及中国银保监会发布的《银行业金融机构监管数据标准化规范(2021)》(EAST5.0)要求,各商业银行所保存的数据要素标准基本一致,即数据特征维度重叠较多,可以应用横向联邦学习技术,各自在本地训练模型,并通过同态加密技术和协议进行参数交换,从而构建一个共有的联合模型,实现在保护本机构客户隐私、原始数据不出本地的前提下,合法合规地从多源数据中训练出更加准确的反洗钱可疑交易监测模型,进一步提升商业银行洗钱风险管理质效,以有中心服务器的联邦学习技术构建可疑案例监测模型为例(如图1所示)。

图1  联邦学习在可疑交易甄别中的应用


2.联邦学习在客户身份识别中的应用

客户身份识别、客户身份资料和交易记录保存以及大额和可疑交易报告是反洗钱的三大核心义务。客户身份识别要求商业银行在各业务环节,秉持“了解你的客户”的原则,对客户信息、身份资料等进行审核,以确定客户真实身份,并登记有关身份信息。在客户身份识别过程中,商业银行经常需要查询运营商、工商信息等。商业银行大多采用将客户身份信息通过网络传输给第三方,第三方进行数据匹配,并反馈结果,这样客户具体去哪些商业银行办业务就可能被第三方记录,第三方可能会利用这个数据对客户做进一步分析,导致客户隐私的泄露。


本文以客户实名认证为例,客户来商业银行办理业务,商业银行在对客户身份识别过程中,可利用联邦学习技术进行客户实名认证,可以实现隐私保护的效果,商业银行将要验证的客户身份信息通过本地模型处理后,与运营商通过本地模型处理后的数据,利用联邦学习中的联合模型进行处理,商业银行得到联合模型处理后的结果,最终实现客户的实名认证。这样,商业银行不知道运营商除被查询客户的以外数据,运营商也不知道商业银行所查询的数据,实现了客户信息不被第三方了解和储存的功能。


3.联邦学习在反洗钱模型共享中的应用及激励机制建立

我国商业银行分为不同类型,可以细分为政策性银行、国有商业银行、股份制商业银行、城市商业银行、农村商业银行、村镇银行等。不同类型的商业银行反洗钱模型建设能力差别很大,一般大型国有商业银行和股份制商业银行的反洗钱模型建设能力要高于城市商业银行和农村商业银行,洗钱犯罪分子往往也了解这种情况,更倾向于通过洗钱风险管理能力较弱的商业银行清洗非法资金。


我们可以考虑,如果某国有银行的反洗钱模型建设能力更强,对可疑交易识别的有效性更高,而某农村商业银行反洗钱模型建设能力较弱。农村商业银行想复用国有银行的反洗钱模型,但出于数据保护的考虑,不能暴露自身数据,而国有银行担心模型规则泄露,亦不同意将自建的反洗钱模型部署到农村商业银行。此时,可以应用联邦学习技术,农村商业银行将自身数据通过同态加密技术或安全多方计算技术加密后,传输给国有银行,国有银行应用自建反洗钱模型进行处理,并将处理结果加密后传输给农村商业银行,农村商业银行解密后进行应用,这样就可以保证农村商业银行有效应用国有银行的反洗钱模型,但是自身数据不被国有银行知道。


通过以上反洗钱模型应用流程,可以考虑建立共享反洗钱模型激励机制,针对开发能力强、反洗钱模型效果好的机构,可以通过联邦学习技术向其他机构共享自己所研发模型的使用权,并设计合理的收费机制。这样反洗钱模型研发能力较弱的商业银行可以花费较少的成本提升自身的洗钱风险管理能力,研发能力强大的商业银行则可以获得中间收入作为激励。


4.联邦学习在洗钱风险管理中其他方面的应用

近年来,反洗钱管理日趋严格,国家及监管层面政策频出,2022年中国人民银行、公安部等11部门联合印发《打击治理洗钱违法犯罪三年行动计划(2022—2024)》,在全国范围内开展打击治理洗钱违法犯罪三年行动,足以体现出国家层面对洗钱风险管理的重视程度,未来洗钱风险管理的手段和措施也会不断丰富和完善。本文认为在以下几个方面也可以应用联邦学习技术提高商业银行洗钱风险管理的有效性。


一是联邦学习应用于客户洗钱风险等级评定。商业银行一般通过定性分析和定量分析两种方式对客户进行洗钱风险等级认定。在定性分析过程中,可通过应用联邦学习实现法院、公安机关、监察机关、国安机关、海关、税务机关等数据与商业银行数据的跨机构应用,使得商业银行在对客户进行洗钱风险评级过程中及时发现客户已经存在的相关风险,提高客户洗钱风险评级的准确性。


二是联邦学习应用于客户尽职调查。商业银行一般对产生预警信息的客户采取尽职调查措施、对系统评级为洗钱高风险等级的客户采取强化尽职调查措施。在对客户尽调的过程中,商业银行可通过应用联邦学习,实现工商信息、户籍信息、运营商信息的跨机构共享应用,确保客户身份识别信息的全面性和准确性,提高客户尽职调查质量。


三是联邦学习应用于外贸行业洗钱行为识别。外贸行业是洗钱高风险渠道,可以通过高报进口价格及预付货款名义,将资金从境内转移到境外,这是一种典型的向境外洗钱的手法。所以对外贸相关交易,商业银行应该有效辨明虚假贸易或虚假价格、识别客户信息及关联企业、审核贸易外汇收支情况、核实海关报关单、分析账户交易情况等。应用联邦学习,可实现商业银行数据、工商数据、外汇管理局数据、海关数据的有效共享挖掘,及时发现通过外贸交易的洗钱行为。





3

联邦学习大规模应用面临的问题

根据目前研究现状,联邦学习能够实现跨行业、跨机构的数据安全融合,提高商业银行反洗钱管理质效。但是,考虑到若大规模应用联邦学习技术,仍然存在一些问题,主要表现在以下几个方面。一是技术复杂,安全上存在一定的风险。联邦学习的原理和框架都比较复杂,由于要实现跨域数据传输和大量使用密码学算法,使用性能存在一定的压力。同时,应用联邦学习技术,在模型输出及部署过程中,可能遭受模型更新攻击、数据攻击、逃逸攻击等,存在一定的安全风险。二是尚未形成完整的解决方案。数据安全需要端到端的全流程防护,从客户的授权、数据采集、存储、流通、融合、应用的全流程,都是需要防护的,目前联邦学习主要集中在数据融合环节,对于数据流通的整个流程尚未形成一套完整有效的方案,没有确定的标准可以参考。三是应用推广困难。目前国家层面、监管层面尚未对隐私计算相关技术的推广应用出台相应的法规政策,不同行业、不同机构大多还是处在尝试阶段,很多机构对新技术的应用处于观望状态,不敢真正地将自身拥有的数据通过联邦学习技术对外开放应用。



4

建议与展望

国家已经明确数据作为一种新型的生产要素,国务院印发《“十四五”数字经济发展规划》、国家发改委等9部门发布《关于推动平台经济规范健康持续发展的若干意见》,鼓励基于平台的数据要素融合创新,促进数据高效合规流通使用;人民银行印发《金融科技发展规划(2022—2025年)》,将“推动数据有序共享”“深化数据综合应用”作为新时期的重点任务,要求探索实现跨机构、跨地域、跨行业数据资源的有序共享。可见,国家层面、监管层面已经在逐步推动跨机构的数据共享。本文认为,联邦学习技术可以作为一种有效手段实现跨机构的数据应用,提高数据在洗钱风险管理以及其他方面的共享应用。但是,在联邦学习真正大规模应用于洗钱风险管理之前,还需要对以下几个方面进行完善。首先,持续开展技术研究。针对联邦学习技术的复杂性及安全性问题,商业银行应持续开展相关技术研究,对基于联邦学习的洗钱风险管理平台的底层安全技术进行规范和认证,对不同场景的功能明确相应的安全参数,用以规避技术安全性不明确导致的数据安全隐患,探索如何基于联邦学习技术最大化地提高洗钱风险管理质效。其次,建设行业技术标准和平台。由监管部门或监管部门指定的商业银行建设统一标准的基于联邦学习的洗钱风险管理平台,奠定大规模应用基础。在底层数据方面,明确可使用的数据范围、数据标准及数据要素含义等;在技术层面,明确不同场景或条件下的可用算法和协议、性能、安全标准;在管理层面,明确平台的使用说明、接入流程及应用费用、建立完善的认证、授权、审计机制。第三,加强政策指导和推动力度。国家层面出台相应的政策,明确各政府机构的数据可以基于联邦学习技术,在确保数据安全的前提下应用于商业银行洗钱风险管理,并制定可共享数据范围、数据标准等;中国人民银行作为反洗钱行政主管部门,发布相应的规章制度,鼓励商业银行探索基于联邦学习技术的洗钱风险管理的场景应用,建立相应的监管体系,推动商业银行积极主动应用联邦学习技术。
本文来源:金融电子化权归属原作者,分享仅供学习参考,如有不当,请联系我们处理
END


往期推荐


可信区块链隐私计算平台研究与实现
上岸!选择你的隐私计算导师!
《计算机研究与发展》2022刊登安全与隐私保护相关论文整理
对于多方安全计算,你是否也有这样的疑惑?
欢迎投稿邮箱:pet@openmpc.com参与更多讨论,请添加小编微信加入交流群

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存