其他
中国民生银行罗勇:联邦学习技术助力银行风控策略组合优化
利率市场化改革的深入和数字经济的发展,促使越来越多的服务向数字化、线上化迁移,突如其来的新冠肺炎疫情更是加速了这一趋势,银行开始谋求业务的数字化转型和突破。2021年《数据安全法》与《个人信息保护法》的出台,与《网络安全法》一同形成了数据合规领域的“三架马车”,监管政策强度日趋加大,银行数字化转型既要通过海量客户行为数据准确识别客户、营销获客、控制风险,又要确保客户信息安全,符合数据使用的法律规定,数据的保护意识和对数据价值挖掘的需求之间的矛盾开始日益凸显。在此背景下,隐私计算技术逐步受到关注,Gartner在2020年和2021年连续两年将隐私增强计算列为最重要的战略趋势之一,并预测到2025年,60%的大型企业机构将使用一种或多种隐私增强计算技术;2021年6月,麦肯锡在《Fintech2030:全球金融科技生态扫描》中认为,自动因子发现、知识图谱和图计算,以及基于隐私保护的增强分析将发挥更大的价值,并将其列为金融机构应关注的首要技术趋势。通过多方安全计算、联邦学习、可信执行环境等相关技术将数据价值连通,推动数据安全共享,在多方数据融合的基础上充分发挥大数据所产生的价值,释放数据红利,正在成为各界实现数字化转型、推动数据要素化发展的创新解决方案。“金融行业风控能力建设面临数据难题近年来,风险控制能力越来越成为金融行业的隐形门槛。信息不对称,个人、企业用户信用记录缺失,人工核验成本高,逾期客户的风险识别困难等,都对金融机构管控风险带来了很大挑战。特别是近几年金融业务快速发展,恶意欺诈、过度消费、重复授信等乱象浮现,并且手段越来越专业化、产业化、隐蔽化和场景化。而传统风控手段因维度单一、效率低下、范围受限等原因,越来越难以满足复杂的场景应用需求。金融行业需要各个行业维度的数据去覆盖各类业务产品与风控需求,从而能够使业务人员及时准确地洞察不同来源与业务场景的风险行为变化。而大数据分析的风控手段又常常依赖于数据,但数据滥用又带来了数据隐私安全问题。同时,并不是有越多的数据补充就越能有效提升风控能力。样本缺失、数据质量不高、有效数据维度欠缺等问题,使得通过挖掘数据价值来提升风控模型效果与保证风控数据的可用性在双向平衡性中进退维谷。传统的风险控制流程大致经历了两个阶段——传统风控和大数据风控。传统风控偏向线下,包含人工审核环节,审核时间长,用户体验不太好;大数据风控偏向线上,依赖海量的数据,人工和机器审核相结合,支持批量和实时处理,用户体验较好。然而,随着互联网的高速发展,大数据风控同样面临一系列挑战。总体而言,数据不足,分享不够。数据是大数据风控的血液。数据的可得性、全面性、准确性决定了大数据风控的生命力。金融机构可以在大数据风控的模型构建方面发挥主动性,也可以自己积累数据;同时,外部数据特别是互联网、政务数据也不可或缺。但目前很多政务等外部数据保存在不同地方,联通不够,导致众多的信息孤岛。数据保护意识和数据融合矛盾凸显。随着数据相关法规的陆续出台,个人隐私保护意识逐步增强,对数据的获取和融合难度也逐渐加大。易受到隐蔽化、团伙化的攻击。大数据风控的数据来源和运营过程都在线上。网络攻击可以在任何时候、任何地点发动,难以预测,隐蔽性强。这就要求风控策略加快迭代速度、缩短周期,同时还要保证不损失风控精准度。“联邦学习技术正成为解决金融风控问题的关键上述问题是金融行业风控领域的常见问题,而隐私计算技术的应用正在成为这些问题的一个有效的技术解。隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。它可以在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算,实现数据在流通与融合过程中的“可用不可见”。其中,联邦学习(Federated