查看原文
其他

“可信隐私计算”功能及性能测试观察

中国信通院 隐私计算联盟 2022-09-24

2021可信隐私计算高峰论坛暨数据安全产业峰会于12月21日召开。本次大会由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办,数据安全推进计划(DSI)、隐私计算联盟(PPCA)、金融数据智能联盟(FINDA)承办。



会上,中国信通院云大所大数据与区块链部工程师王思源汇报了“可信隐私计算”功能、性能的测试结果与测试观察。


以下为演讲实录


中国信通院云大所从2018年就开始聚焦隐私计算领域,经过多年积累,目前已经建立了相对完善的一套隐私计算标准体系,包括功能、性能、安全多个维度,并开展了对应的产品评测工作。在2021下半年开展的第五批“可信隐私计算”产品评测中,共完成了对46款产品的57次评测。除技术厂商外,一些金融机构、运营商也推出了自家产品。在数量上,仍然是联邦学习占据领先位置。

功能测试结果分析

在多方安全计算基础能力专项评测中,计算基础能力、管理功能部分的通过率较高。在本批次的MPC功能测试中,我们丰富了对MPC产品多算法支持能力的检验,新增了联合统计、PSI、PIR的相关能力测试项。PSI功能支持率很高,但是联合统计、PIR等功能的通过率较低,多算法支持能力仍有待提升。系统稳定性、容错性能力也需要进一步强化。


从联邦学习基础能力专项评测的结果中可以看到分类、回归算法测试通过率已经达到了100%,无监督、多分类、深度学习的测试通过率都较低,参测产品支持的算法类型都较为集中,算法多样性支持有待拓展。

在多方协同的隐私计算过程中,对各参与方贡献的评估是一个重要环节,有助于提出更合理的激励方式,在此前的评测中贡献评估很少有产品通过。本批有一定的提升,达到了23%的通过率,这也说明贡献评估相关方案开始逐渐落地。


可信执行环境基础能力专项评测共9个维度,综合来看,各产品的任务处理能力、环境验证、通信安全、一致性、计算机密性等部分的通过情况较好。抵抗侧信道攻击仍是当前难题,这点在测试结果中也可以反映出来。


在区块链辅助隐私计算基础能力专项评测中,产品计算能力、性能测试通过率较低,目前较多产品仅能支持比较少的计算类型,对于复杂计算功能的支持情况较差。大部分产品都是把区块链用做审计存证的,只有较少的产品更深入的融合了区块链技术,如区块链协调方功能的通过率就较低。


性能测试介绍与结果分析

隐私计算能够保护数据利用过程中的安全性和隐私性,但是这也带来了额外的计算与通信负担。隐私计算产品的安全、性能、准确性三者相互影响。因此我们设置了安全性和准确性两个门槛要求,在达标的情况下,计算耗时结果才是有效的。


以下为各场景的测试结果。首先是基础运算,在测试中,大部分产品都是基于秘密分享进行实现,左侧也给出了测评中出现的常用算法文献。各产品的基础运算功能普遍完备,计算效率高,千万次运算的耗时都是分钟级的,比较运算相对耗时较高,平均约18分钟。


联合统计的方法和基础运算类似,大多由各类联合基础运算和本地运算组合而成。考量方差和中位数两个算法,平均耗时都在分钟级。


在隐匿查询中,考虑了实际的应用需求,平衡计算效率和隐匿性,设置了百级不可区分度和百万级不可区分度两个测试项。在测试中主要用到的方法包括基于同态的xpir、sealpir,或是基于PSI方法实现的隐匿查询。在结果上,百级不可区分度下,万次查询平均8分钟,百万级不可区分度单次查询平均5分钟。

在安全求交中,根据各方数据量分布差异设置了平衡和非平衡场景,数据规模达到了亿级别。产品的实现方式主要包括基于公钥密码学的PSI算法,如盲化RSA、DH等;还有基于OT和扩展OT的PSI算法。产品的任务平均耗时在半小时左右,非平衡场景耗时相对少一些。


特征工程主要考验了产品多方联合计算WOE、IV值,在计算过程中,大多数产品都采用了加法同态的方式加密标签值并计算,也有部分产品采用了秘密分享的方式进行计算。在结果上,各场景的平均耗时在十分钟到二十分钟不等,多体现为各产品的工程化差异。


在联合建模部分,MPC产品方案以秘密分享为主。联邦学习主要是通过同态加密、差分隐私等手段来安全的交换、汇聚各方本地训练得到的中间数据。联邦学习产品中无可信第三方的方案也在增多。从测试情况上我们也能看出,当前大多数产品在联合建模上还有较大的提升空间,逻辑回归的平均耗时在小时级,联邦学习会相对快一些。XGBoost的计算更为复杂,平均耗时在两小时左右。


测试观察1

根据我们历年的测试整理,截止目前,隐私计算产品的数量已经达到了105款之多,2021年下半年新发布的产品就有17款。


测试观察2

产品数量爆发增长,除了需求推动外,开源生态的贡献也很大。Fate、TFF等开源框架降低了企业产品的开发时间和技术壁垒。但是,今年大部分产品也出现了较为明显的趋同性。未来,各产品也应在保留完整功能的前提下,提高自己的产品创新能力。

测试观察3

在全部参与评测的企业中,有超过三成的企业参与了多个不同项目的评测,这也说明了隐私计算多技术融合的趋势逐渐显现。在隐私计算分支技术间的多技术储备上,多方安全计算+联邦学习是最热门的组合方式。在外部技术融合上,区块链与联邦学习结合的占比最高,借助区块链能够支持隐私计算的可信审计,增强计算过程可验证性,有助于建立合理的激励机制和公平的协作环境。


测试观察4

在产品评测中,我们也看到基于隐私计算的数据流通交易平台的模式开始浮现。在传统的数据交易平台中引入隐私计算技术,能够加固查询服务、数据分析处理服务的安全性。未来,还可以结合区块链等创新技术,实现电子签约、服务授权、交易付款等流程的平台化。

测试观察5

从被测产品的性能表现来看,隐私计算的性能指标也在持续的提升,可用性进一步增强。效率的提升主要有以下两点,首先是算法的选择,根据场景选择适合的算法能够带来较为明显的效率提升。其次是对算法的工程优化。



未来,隐私计算的发展仍面临着安全、性能、互联互通壁垒等挑战,针对这些问题挑战,中国信通院云大所、隐私计算联盟、大数据技术标准推进委员会(TC601)也将继续扩展完善“可信隐私计算”标准体系,协同行业各方推动隐私计算健康发展,也欢迎感兴趣的行业专家参与到我们的标准、评测中来。


联系方式

wangsiyuan@caict.ac.cn

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存