查看原文
其他

《隐私计算白皮书(2021年)》正式发布(附下载链接)

隐私计算联盟 隐私计算联盟 2022-07-02

2021年7月20日,由中国信息通信研究院(以下简称“中国信通院”)、隐私计算联盟联合主办的“2021隐私计算大会“在京召开。会上,中国信通院云计算与大数据研究所所长何宝宏发布了《隐私计算白皮书(2021年)》(以下简称“白皮书”)。



近两年来,在政策驱动和市场需求同时作用下,隐私计算技术、产业、应用迅速发展,成为保护数据拥有者的权益安全及个人隐私的前提下,实现数据的流通及数据价值深度挖掘的重要方法。


白皮书从政策、技术、产业、应用、法律合规性全景式展示隐私计算发展状况,希望为产业界应用隐私计算技术提供参考指导,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设和数据流通过程中发挥更大的价值。


以下为发布实录


《隐私计算白皮书(2021年)》由中国信通院云大所联合隐私计算联盟的多家企业共同完成,主要涉及隐私计算概况、技术发展、场景应用、产业态势、法律合规以及挑战展望等多个方面。



数字经济时代的特点之一是将数据视作关键的生产要素,通过跨领域、跨行业、跨地域的机构间数据流通来释放要素价值。但是,在面临数据融合需求的同时,如何防止数据泄露、盗用和滥用仍是机构参与数据流通时面临的难题。


隐私计算正是平衡数据利用与安全的重要路径。近几年,工业和信息化部、人民银行、国家发改委、中央网信办等各部门先后在相关文件中提出推进隐私计算相关技术的研究攻关和部署应用,上周广东省也率先提出要构建包含隐私计算在内的新型数据基础设施。技术价值的凸显,再加上政策环境的助力,隐私计算在数据相关产业内悄然兴起,已成为数据流通领域内最受关注的技术热点。



隐私计算是涵盖众多学科的交叉融合技术,从20世纪70年代发展至今,逐渐形成了以多方安全计算、联邦学习、可信执行环境为代表的相对成熟的技术体系,为数据的隐私保护与计算提供丰富的解决方案。白皮书从底层硬件、各类协议、算法构成等多种角度,对这三大技术方向进行了分析。



多方安全计算(MPC)技术源于姚期智院士的百万富翁问题,是多种密码学基础工具的综合应用。MPC可以使多个非互信主体在数据相互保密的前提下进行高效数据融合计算,因此可实现“数据可用不可见”,具有很高的安全性。但是多方安全计算也面临一些问题,例如:密码学复杂的运算过程造成的计算性能问题,安全问题,不同技术间的加密数据不能互通造成的新的数据孤岛问题等。目前,MPC技术广泛应用于联合统计、联合查询、联合建模、联合预测等场景。



联邦学习是实现在本地原始数据不出库的情况下,通过对中间加密数据的流通与处理来完成多方联合的机器学习训练。


从算法应用角度来说,联邦学习广泛应用于联合建模、联合预测等场景中。从拓扑架构的角度分析,联邦学习可根据协调方式的不同,分为集中式拓扑架构和对等网络拓扑架构。集中式的拓扑结构由于存在中心计算节点,效率高,易于设计和实现;而对等式的网络拓扑结构,由于不需要可信任的中心节点,安全性更高,但设计难度较大。


当然,联邦学习目前也存在如数据和模型的隐私泄露、安全攻击及数据分布和质量无法支撑联合建模等一系列问题,仍需要进一步去解决。



可信执行环境(TEE)通过软硬件方法在中央处理器中构建一个安全的区域,保证其内部加载的程序和数据在机密性和完整性上得到保护。因支持多层次、高复杂度的算法逻辑实现、运算效率高被广泛认可,但其技术本身依赖硬件环境,必须确保芯片厂商可信。


作为一种更通用的平台,TEE提供了丰富的应用场景。TEE可单独或与多方安全计算、联邦学习等技术相结合,应用于联合统计、联合查询、联合建模及预测等丰富的隐私计算场景。



通过对隐私计算技术观察以及产品测试,给出了主要技术对比。技术成熟度部分引用了Gartner的观点。


在前面提到的关键技术中,多方安全计算通用性高和安全性高,但计算和通信开销大,性能相对较低;TEE通用性高,性能强,但开发和部署难度大,而且需要信任硬件厂商;联邦学习综合运用MPC、DP、HE方法,主要用于AI模型训练和预测。


除了这几类关键技术,同态加密、零知识证明、差分隐私、区块链等技术也常应用或辅助于隐私计算,详细介绍可参阅白皮书。



应用方面,根据中国信通院统计,当前隐私计算相关企业主要应用在金融、互联网领域和拥有大量数据源与数据流通需求的政务、医疗等领域。最主要的应用集中在联合营销、联合风控、智慧医疗、电子政务等场景。此类应用接近商业落地,能为企业更快带来收益,关注度较高。此外,也包括智慧能源、智慧城市等探索性应用。



从隐私计算本身的发展历程来看,国外企业是最早关注隐私计算的,早在2008年第一家专攻多方安全计算解决方案的技术厂商就已在丹麦成立。科技巨头中,微软从2011年开始深入研究多方安全计算、谷歌在全球率先提出联邦学习的概念、Intel打造SGX成为绝大部分可信执行环境实现方案的底座。但从总体的应用场景来看,目前国外隐私计算项目中的很大一部分都是面向区块链和加密虚拟货币的场景,面向大规模数据流通的应用场景还有待拓展。



与国外相比,我国企业开始布局隐私计算的时间更晚,但产业化发展的速度较快。自2018年开始,国内隐私计算进入了快速启动期,投入研究和发布相关产品企业数量几乎呈指数型增长。


伴随着技术概念逐渐普及,越来越多的行业客户开始愿意进行应用尝试。在2021年上半年中国信通院产品调研中,超过81%的产品进入了试点部署或实施阶段,比例较2020年下半年进一步提升,整体行业从研发试点阶段到全面实施阶段趋势明显。


从技术路线上看,三类技术路线在实现原理、开发难度和应用特点上各有侧重。



从产业发展的配套环境来看,相关企业和研究机构在学术研究、开源社区、标准体系等方面积极探索,推动着隐私计算向上蓬勃发展。


2011年以来的十年间,隐私计算领域的论文数量始终保持着不低于10%的增速,目前每年发文量稳步超越1000篇。可见理论研究层面对隐私计算的关注在持续增强。


开源社区的知识共享和多方协同有利于加快技术升级迭代和商业化项目落地的效率。国内外隐私计算领域的科技大厂和创业团队都在积极开源。尤其是以FATE为代表的联邦学习开源生态对工业化的落地应用有较大贡献。



作为技术的载体,产品如何构建、如何落地将对用户的业务形态产生重要影响,这就需要统一规范的技术标准。目前,从IEEE、ISO、ITU-T等国际组织到中国通信标准化协会(CCSA)、金标委等均在组织力量制定或发布隐私计算相关的技术标准。


国外标准内容以技术框架和功能为主,且大多由国内科技大厂牵头;而国内标准开始进一步向性能安全和互联互通拓展。中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)在云大所牵头下自2018年开始制定隐私计算领域的相关标准,在完成功能标准的基础上,正在加速完善隐私计算产品性能、安全性和跨平台互联互通的相关标准。



目前隐私计算行业整体处于规模商用的前期。2019年主要集中于技术科普和市场教育,2020年开始出现较多的产品POC,直到近期才开始出现规模化的招标与应用。


未来,随着技术应用的推广发展,隐私计算厂商的商业模式可以拓展到数据流通平台的联合运营者,此时技术厂商将更加深入到数据流通服务的角色中,对平台上基于隐私计算进行的数据流通活动进行利润分成,运营商、传统大数据转型企业和金融科技公司等掌握大量数据资源的隐私计算技术厂商将在这种模式下发挥出优势。


根据毕马威《隐私计算行业研究报告》预测,接下来几年国内隐私计算将快速发展,有望撬动千亿级的市场规模。在这个过程中,隐私计算行业的商业模式还需要继续孵化。



隐私计算的合规性也是备受关注的。总体来说,隐私计算是有助于提升数据流通的合规性的。对个人数据而言,目前我国法律规定的个人信息处理的合规路径主要有匿名化和授权同意两种。对匿名化而言,隐私计算技术由于控制原始数据不出本地,成为满足匿名化要求的重要一环。对非个人数据而言,隐私计算技术原始数据不出域、只传递梯度模型等特质也有助于满足《数据安全法》和《网络安全法》等要求的数据安全保护义务。



与传统方案相比,隐私计算的保护效果更有利于满足合规要求。但是,我们也需要充分审视技术方案的合规风险。 


原始数据的合规瑕疵是第一个风险点。就匿名化而言,当存在反向推演出原始数据等可能性时,隐私计算将不能达到“不可识别且不可复原”的要求。


第二,需要控制模型泄露的风险。因为当存在衍生信息、梯度等模型信息泄露时,隐私计算对数据的处理可能无法满足匿名化的要求。


第三,需要排除参与方的安全隐患。防止参与方恶意合谋获取其他参与方的数据等。


第四,在输出最终计算结果时,也需要确保输出的结果不存在数据泄露的风险。



尽管隐私计算的合规红线暂不明确,仍建议企业针对技术方案和管理制度的风险点,探索平衡合规、效率和可用性的发展路径。



隐私计算可以在一定程度上解决企业面临的数据合规难题,但是,安全、性能以及互联互通等方面的挑战仍然会限制隐私计算的推广和应用。


首先,算法协议安全、开发应用安全和安全共识都是当前隐私计算推广应用亟需突破的挑战。


其次,性能瓶颈也是阻碍隐私计算规模化应用的重要因素。隐私计算产品需要多个数据源或计算节点同时在线、同步计算、实时通信,存在较高的同步性与可用性的要求。同时,隐私计算也带来了更高的计算和通信开销,资源受限的参与方会直接拉低整个平台的性能。


最后是互联互通。对数据供应方和需求方来讲,往往面对着与不同的机构合作,需要部署不同的隐私计算平台的问题,造成系统建设重复和运营成本浪费。因此,互联互通壁垒正在成为隐私计算面临的新挑战。



隐私计算技术近几年得到广泛的关注和迅速的发展。然而,要实现大规模落地应用,仍需要在性能、技术融合、安全等方面进一步提升,以及在一些非技术因素上形成相关配套。 


未来,隐私计算平台有望成为数据合规流通基础设施的关键一环,在保证安全的前提下有效持续释放数据要素价值,促进数字经济高质量发展。



本次隐私计算白皮书编写汇聚了多方力量。面对这个日新月异、快速发展的行业,我们期待与业界共同守正创新,推动隐私计算行业健康发展,让隐私计算在数据要素市场建设和数据流通过程中发挥更大的价值!



白皮书联系人

袁博,yuanbo@caict.ac.cn



关注公众号,并在首页输入关键词“隐私计算白皮书”,获取下载链接。




往期推荐01

更新|隐私计算之联邦三部曲

02

重磅发布|“隐私计算联盟”正式成立

03

更新|隐私计算在金融领域的合规性分析

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存