查看原文
其他

浅谈以多方安全计算为代表的隐私计算技术

大话小数 中国金融电脑+ 2022-12-13

验“金”室


金融科技的发展和大数据的运用推动了整个金融业向数字化方向转型,但同时也产生了商业秘密和个人隐私保护等问题。近年来,隐私数据泄露事件层出不穷且愈演愈烈。2020年7月,《中华人民共和国数据安全法(草案)》公布,国家坚持维护数据安全和促进数据开发利用并重,以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。以多方安全计算为代表的隐私计算技术可确保数据在不离开本地的情况下,完成计算任务,实现数据的“可用而不可见”。


一、什么是多方安全计算


多方安全计算起源于1982年姚期智教授提出的百万富翁问题,问题的内容是在没有可信第三方的前提下,两个百万富翁如何在不泄露自己财产数量的情况下,比较出谁更富有,即两方间的安全函数计算。



多方安全计算可以在保证参与方隐私数据安全的前提下,让多个数据所有者在联合的数据上进行协同计算以提取数据价值,且不泄露每个数据所有者的原始数据,真正实现数据的“可用而不可见”。多方安全计算有秘密共享(Secret Sharing,SS)、同态加密(Homomorphic Encryption,HE)、混淆电路(Garbled Circuit, GC)等三大分支(详情可参考往期文章《一文带你了解多方安全计算》),传统保密技术与多方安全计算对比如图1所示。


图1 传统保密技术与多方安全计算对比


二、其他常用隐私保护技术

介绍及对比


在大数据产业快速发展的趋势下,数据保护的需求促进各类隐私保护技术发展,除多方安全计算外,其他隐私计算技术还包括可信计算环境、数据脱敏、差分隐私等。


1.可信计算环境

可信计算环境(Trusted Execution Environment,TEE)创建了一个与外部隔离的计算环境,用于部署计算逻辑代码及待计算的数据。已加密的隐私数据从外部环境送入到可信计算环境内,然后在内部解密成明文进行计算。由于相关明文及计算逻辑均位于可信区域,因此外部无法获取明文隐私数据。可信计算环境通常依赖于具体实现厂商的技术平台(如移动端、PC端等),常见技术包括Intel SGX, ARM TrustZone,AMD SEM/SEV等。


2.数据脱敏

数据脱敏是指从原始环境向目标环境进行敏感数据交换的过程中,通过一定方法消除原始环境数据中的敏感信息,并保留所需的数据特征。常用的数据脱敏技术包括部分屏蔽、替换、泛化等。数据脱敏既要保证有效性(确保数据隐私安全),又要保证真实性(对目标环境可用),需要在这两者中权衡,对可用性和通用性要求相对较低,通常为了特定的应用目标选择不同类型的脱敏技术。


3.差分隐私

差分隐私(Differential Privacy)是针对统计数据隐私泄露问题提出的一种新技术,是指通过对原始数据或者计算结果添加噪声来实现隐私保护,使得攻击者无法发现特定数据的存在,但会导致计算结果不精确。在实际应用方面,苹果和谷歌分别在iOS和Chrome中使用差分隐私技术来保护用户隐私。


表1 不同隐私保护技术的对比


三、多方安全计算在金融行业的

应用场景


随着多方安全计算相关产品和产业标准的不断发展,多方安全计算将为交易隐私保护、区块链交易信息保护、联邦学习、联合查询与统计分析和数据建模与预测等场景提供强有力的技术支持。


1.交易隐私保护

以金融机构向合作方输出人脸识别技术服务为例,通过多方安全计算技术,金融机构在仅掌握合作方客户人脸信息部分加密数据的情况下,为合作方完成其客户的人脸认证,满足合作方数据安全需求,具体流程如图2所示。


图2 人脸识别隐私保护流程


2.区块链

区块链为数据融合与流通进行记录和存证,但区块链上的明文交易数据存在隐私泄露的风险,结合多方安全计算技术,链上可记录密文数据,在密文下计算和验证区块是否被篡改,可联合链外数据核验链上数据的真实性。


3.联邦学习

联邦学习本质上是深度学习和分布式计算的结合,其核心思想是“数据不动、模型动”,由多个参与方共同完成分布式训练,其中由一个中央服务器(也被称为参数服务器)完成样本对齐、参数模型参数和中间结果的聚合。为保证在梯度更新和样本对齐时的隐私安全,可通过同态加密技术对本地训练获得的明文梯度加密,再传递给中央服务器,中央服务器在梯度密文状态下完成梯度聚合运算,从而实现明文梯度的明文保护。


4.联合查询与统计分析

在资质审查场景下,金融机构可借助多方安全计算技术,在不泄露客户具体资产信息的情况下,结合多个机构的征信信息、客户公共评价信息、商务经营信息等,实现对企业或个人的全方位资质评估(如图3所示),且能保证各方信息的安全。


图3 个人合格投资人认证流程


5.模型训练与预测分析

在金融领域的联合风控、精准营销建模场景,使用多方安全计算技术可将多方隐私数据联合在一起(如图4所示),基于密文数据进行计算,在确保明文数据不出域的前提下,提升模型的精度。


图4 多方数据联合风控建模


往期推荐


应用人工智能技术 打造人力资源自适应的网点管理新模式


浅析图计算技术及其在金融业的应用


浅谈纠删码如何减少大数据场景下的存储


边缘计算初探:什么是边缘计算,它能做什么?


如鱼得水——当金融科技遇上容器技术



FCC30+

长按左边二维码

关注我们不迷路


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存