观点 | 隐私计算在区域性银行的应用与思考——以鲁豫两省为例
欢迎金融科技工作者积极投稿!
投稿邮箱:newmedia@fcmag.com.cn
——金融电子化
文 / 中国人民银行临沂市中心支行 徐晓东
隐私计算技术概述
1.隐私计算技术路线逐渐明晰。隐私计算(或称隐私安全计算、隐私增强计算)是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,实现数据在流通与融合过程中的“数据不动价值动”“数据可用不可见”。隐私计算涉及密码学、人工智能、芯片等多领域技术,技术路线较多且处于快速发展阶段。当前业界主流一般认为,隐私计算可以分为3种流派:基于密码学的多方安全计算、融合密码学与人工智能的联邦学习、基于可信硬件的可信执行环境。
多方安全计算最早由姚期智院士提出的“百万富翁问题”引出,即两位富翁如何在互相不告知自身资产的情况下,比较谁更加富有。多方安全计算基于密码学原理,有严格的数学证明,安全性较高。多方安全计算包括混淆电路、不经意传输、同态加密、零知识证明等众多技术。
联邦学习最早由谷歌提出,用于解决多个手机终端联合建模训练输入法预测功能。人工智能的快速发展及在金融、医疗等领域的广泛应用而催生的数据流通融合需求,使得联邦学习近年来发展迅速。联邦学习是基于多方安全学习等技术的分布式机器学习算法,技术架构底层是同态加密、不经意传输等密码学算法,上层是逻辑回归、XGBoost等机器学习算法。联邦学习在国内产学研各界都比较活跃,以腾讯、阿里为代表的互联网公司在国际标准制定中也处于主要地位。
可信执行环境是通过软硬件方法构建一个安全区域,通过保证加载到该区域的程序和数据的完整性和隐私性,实现对代码执行与数据资产的保护。可信执行环境目前有Intel的SGX技术、ARM的TrustZone技术等。国内CPU也逐渐加强对可信执行环境的支持,飞腾、华为等CPU都实现了可信执行环境技术。2022年3月份NVIDIA宣布推出Hopper架构并发布基于该架构的首款GPU-NVIDIA H100,该GPU是全球首款具有机密计算功能的GPU加速器,有望大幅提升可信执行环境技术的性能,推动该技术大规模商用。
2.隐私计算技术仍待较大发展和突破。从3种流派分别来看,多方安全计算虽然具有较高的安全性,但由于基于密码学原理,对计算性能和网络性能要求较高,计算和网络传输压力是明文计算、明文传输的几十倍甚至上百倍,性能瓶颈成为阻碍实际应用的关键障碍。联邦学习在金融联合风控、联合营销等领域具有较为广阔的应用前景,但存在的问题是底层技术安全性尚存疑。联邦学习通过传递训练过程中的中间参数(例如梯度值)来避免直接传递原始数据的隐私泄露风险,存在攻击者通过中间参数反推原始数据的风险。同时,目前联邦学习大多只实现了逻辑回归、XGBoost等机器学习方法,对复杂深度学习模型支持不足。可信执行环境在通用性、灵活性和性能上具有较大优势,可以适用于成百上千个参与方、计算量大、安全假设低等复杂场景,但其技术实现高度绑定芯片厂商,需要确保芯片厂商的安全可信,也面临测信道攻击的风险。
隐私计算在区域性银行的应用现状
1.政策合规性要求驱动金融行业隐私计算加速应用。近年来,国内外均加强了数据安全立法。例如欧盟推出的《通用数据保护条例》(GDPR),国内出台的《个人信息保护法》《数据安全法》等,均提出加强数据隐私保护。在不断收紧的政策背景下,隐私计算“数据可用不可见”的技术特性,成为目前规避数据确权难、流通环节数据泄露风险的技术解决方案。
目前国有大行大多开展了实践探索。例如光大银行基于多方安全计算的企业级数据共享融合基础设施平台,集成秘密分享、同态加密、不经意传输、联邦学习等多种隐私计算技术,具备隐匿查询、联合统计、联合建模等功能,可解决集团内各企业间以及与外部企业数据共享融合时普遍遇到的明文获取困难、数据保护实施困难、数据共享利益分配难等棘手问题,有效推动数据安全共享。招商银行“慧点”隐私计算平台,从技术能力、行业影响力、数据覆盖范围等多维度选择了几家头部隐私计算技术服务商,实现了“慧点”隐私计算平台与多厂商跨平台的互联互通。
2.区域性银行大多处于早期探索阶段。前期我们选取了山东、河南两省具有代表性的几家区域性银行机构开展了调研。从调研结果来看,区域性银行对隐私计算持拥抱态度,但目前大多仅处于早期探索或规划阶段,离实际应用还有距离(如表所示)。
表 调研结果
从山东省情况来看,我们选取了山东城商行联盟和山东省农村信用社联合社,分别代表省内城商行和农村商业银行情况。城商行大多处于前期规划阶段,个别城商行开展了零星试点。例如济宁银行建设的基于联邦学习的普惠融资服务,融合行内数据和税务局、公积金中心等单位的外部数据,通过联邦学习进行联合建模,较好提升了信贷风控水平。农村商业银行大多处于前期规划阶段,对隐私计算应用仍待加强研究。
从河南省情况来看,我们选取了河南最大的2家城商行和河南省农村信用社联合社。中原银行在隐私计算方面开展了积极探索,目前已搭建了联邦学习测试环境,正逐步推广到反欺诈等业务场景。郑州银行正积极谋划,已将隐私计算平台建设纳入年度科技计划。农村商业银行大多处于前期规划阶段,对隐私计算应用仍待加强研究。
区域性银行隐私计算的困难与挑战
首先,隐私计算应用门槛较高,区域性银行技术、人力存在困难。隐私计算属于新兴技术,金融机构特别是区域性银行对该技术的整体认知较浅、认可度较低,市场开拓较为困难。同时隐私计算基于密码学、硬件等技术,上手难度大、部署难度高、学习曲线较为陡峭,对区域性银行的技术、人力等都提出了更高的要求。
其次,隐私计算技术仍存不确定性,区域性银行可能面临试错成本。目前隐私计算众多技术仍处于技术高速迭代期。如Gartner近年发布的技术成熟曲线显示,联邦学习尚处于“创新触发期”,距离成熟期预计有5~10年时间,区域性银行在技术选型时,可能存在技术路线错误导致资金、人力浪费的情况。鉴于隐私计算技术仍存不确定性,区域性银行可能持观望态度。
第三,行业监管与指导不足,行业发展缺少规划统筹。目前国家部委层面已经有多个文件指出要加强隐私计算应用研究。例如工信部《新型数据中心发展三年行动计划(2021—2023年)》提出,加强多方安全计算等数据安全关键技术创新突破与推广应用。人民银行《金融科技发展规划(2022—2025年)》提出,积极应用多方安全计算、联邦学习、差分隐私、联盟链等技术,实现数据可用不可见、数据不动价值动。但目前具体的技术标准特别是跨平台互通标准缺失,隐私计算厂商研发的平台技术实现原理差异较大,跨平台难以互联互通。
下一步建议与思考
首先,加强产学研用联合,共同推动技术突破。目前业内已形成较大规模的聚焦隐私计算技术的技术联盟,如中国信通院牵头成立的隐私计算联盟、人民银行牵头成立的北京金融科技产业联盟等,对推动隐私计算技术发展发挥了巨大推动作用。建议未来各联盟加强技术研发、标准制定、白皮书发布等方面的沟通协作,共同推动技术革新和应用落地。
其次,加强行业统筹指导,形成金融行业合力。建议人民银行积极联合产学研用各方、标准组织、技术厂商等力量,共同攻关技术挑战和应用落地堵点,扩大隐私计算跨平台互联互通行业共识,打造金融行业隐私计算最佳落地实践,从而帮助金融机构特别是区域性银行明晰技术应用路线,降低试错成本,真正发挥数据要素融合应用价值。
第三,加强金融科技管理,推动金融行业隐私计算有序发展。进一步发挥《金融科技发展规划(2022—2025年)》的指引作用,坚持依法合规、守正创新,强化针对新技术、新应用的安全研究管理,防范技术风口可能导致的厂商水平良莠不齐、虚假宣传等乱象,加强数据安全防护,以向善科技助力数字经济高质量发展。
(栏目编辑:韩维蜜)
往期精选:
(点击查看精彩内容)
● 观点 | 智能网联车时代下的科技保险——自动驾驶系统的风险分析及应对建议
● 观点 | 浅析疫情以来县域信贷政策传导效果及建议——以新宾县为例
新媒体中心:主任 / 邝源 编辑 / 傅甜甜 张珺 邰思琪