查看原文
其他

推出企业级联邦学习平台,开创数据要素合作新局面

科技筑梦 2022-08-28


推出企业级联邦学习平台

开创数据要素合作新局面


—— 数据要素流通 ——

      国家数据生产要素改革实践,为金融行业数字化建设指明了发展方向。在数据隐私安全保护法律法规监管下,为打破数据孤岛,业界提出数据可用不可见的联邦学习技术,促进数据流通下的融合应用。为推进金融数据的创新融合应用,工商银行软件开发中心聚力创新变革,上线同业领先、自主可控的企业级联邦学习平台,并完成工商银行与工银瑞信之间的高风险债券预测场景的联邦学习建模,实现了行内与子公司之间数据要素的高效流转,开创了数据要素流通合作的新局面。


01

联邦学习平台

  工商银行软件开发中心推出自研的联邦学习平台。平台具备数据安全引入、数据安全对齐、数据安全计算三大优势,为金融数据安全合规地流通和使用提供可靠的技术产品。

  •  数据安全引入:本平台通过工程改造完成了对不同联邦学习节点的网络连通,为“数据可用不可见”奠定安全基础。各参与方仅在自有节点进行原始数据的引入,从而保障了各参与方对自有数据的不出域且拥有对自有数据的绝对控制权。

  •  数据安全对齐: 本平台基于PSI隐私求交技术,在输出数据交集的同时不泄露各方独有数据信息,实现了对各参与方数据集有效、安全的ID对齐。

  •  数据安全计算: 本平台在联邦特征工程、模型训练等计算中,结合多种密码学算法和安全计算协议,通过交换加密的模型训练梯度,实现了联邦机器学习建模,避免了原始数据在计算过程中的泄露风险,达到了数据安全计算的目的。



02

业务试点成效

  基于工行自研的联邦学习平台,采用纵向联邦学习技术方案,利用行内沉淀企业法人资金情况、偿债能力等高时效数据+工银瑞信的债券的风险标签数据,完成工商银行与工银瑞信的数据“可用不可见”的联合建模,上线债券违约风险预测模型,并取得良好的落地成效。

该业务场景的落地,突破了工行集团内不同法人主体之间的数据壁垒,有效解决工银瑞信由于自有数据的局限性和所用公开披露数据的低时效性导致的模型效果不佳痛点。投产后经业务验证,工银瑞信与工行的交集企业的比例占95%以上,联邦模型AUC指标超过了0.8。违约企业前6%召回率提升7%;前11%召回率提升13%;全量召回率分位数降低了9%,联邦学习技术有效提升了工银瑞信对债券产品市场风险的预判能力。



03

未来展望

  工行自研联邦学习平台的首次发布,为数据要素高效流通赋能业务创新奠定了坚实有力的科技基础。与此同时,针对业界平台产品的异构性,工行牵头推进了《联邦学习金融应用技术规范》行业标准的编写和立项,在该行标中对异构平台的互联互通做出了统一的架构设计和规范制定,力求推动金融行业数据要素市场的合规、高效发展。

      未来,软件开发中心将积极顺应数据要素市场化的时代发展大势,发挥联邦学习技术优势,着力打造企业级联邦学习平台,为集团内外的数据要素流转提供安全、可靠、高效的技术支撑,充分挖掘数据价值,助力提升金融业务的价值创造,开创集团内外数据要素合作新局面。



大数据人工智能实验室供稿编辑

中心企业文化宣传团队出品


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存