《基于可信执行环境的隐私计算白皮书》发布
2022年5月,中国联通研究院与中国联通广东省分公司联合发布了《基于可信执行环境的隐私计算白皮书》。白皮书围绕当前TEE隐私计算的产业背景、技术生态进行深入分析,提出基于TEE隐私计算的技术方案和主流应用场景。
关注公众号并回复 20220624 获取完整报告
《基于可信执行环境的隐私计算白皮书》部分摘录:
隐私计算成为数据安全流通关键技术
隐私计算主要是解决多个参与方数据不岀本地,在保护数据安全的同时实现多源数据跨域合作的问题。利用隐私计算技术保障多方协作过程中敏感数据信息的安全,实现数据“可用而不可见”已经成为业界共识。从技术实现原理上看,隐私计算主要技术选型分两类,第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以可信执行环境为代表的基于硬件的隐私计算技术。
1.基于密码学的隐私计算技术提供更加安全的多方联合计算能力
密码学技术众多,包括多方安全计算、同态加密、差分隐私和联邦学习等,目前主要以多方安全计算为代表的。
多方安全计算(Secure Multi-Party Computation,简称MPC) 主要是解决多个互不信任的参与方各自持有隐私数据,通过分布式加密网络协同计算一个既定函数的问题。在保证参与方获得正确计算结果的同时,无法获得计算结果之外的任何信息。整个计算过程中,参与方对其所拥有的数据始终拥有绝对的控制,在保证原始数据安全隐私性的同时,对数据进行计算和分析,实现了数据可用而不可见。如下图所示:
联邦学习(Federated Learning,简称FL)作为隐私计算的另 一个主流路径,主要是解决不聚合参与方原始数据的前提下,逬行多方数据联合机器学习的问题,实现保护终端数据隐私的联合建模。在进行机器学习的过程中,各参与方可借助其他方数据进行联合建模。各方无需共享数据资源,即数据不出本地的情况下,进行数据联合训练,建立共享的机器学习模型。
2.基于硬件的隐私计算技术助力计算服务安全高效运行。
基于硬件的隐私计算技术主要指可信执行环境(Trusted Execution Environment, TEE),其核心思想是构建一个硬件隔离的安全区域,在这个安全区域内对隐私数据进行计算。数据参与方可以通过远程证明的方式对TEE环境可信度进行验证,从而保证计算环境安全。在数据传输时通过加密传输来保障数据的安全,在数据运算过程时通过TEE环境中执行加解密等保证安全。计算结束后,在TEE环境内销毁原始数据,确保原始数据不被泄露。
TEE隐私计算技术方案
(一)基于可信执行环境的隐私计算业务框架
结合当前对数据要素安全流通、数据高效治理的需求,构建了基于TEE的隐私计算业务框架,包括可信硬件、TEE能力适配、业务平台以及可信应用四个部分。
TEE隐私计算技术方案支持丰富的可信应用包括计算时数据保护、密钥保护、隐私查询、数据加密存储、计算模型保护等。
(二)TEE隐私计算可信应用
1.计算时数据保护
随着大数据、云计算、AI等技术被广泛应用,尤其在金融、政府、社会治理、传媒等诸多领域各企业间都存在数据孤岛问题。采用TEE隐私计算技术可为多方数据联合计算提供安全保护能力。
该应用场景使用TEE计算环境作为安全沙箱,实现多方数据可用而不可见。不同计算参与方将各自加密后的数据通过安全链路传至TEE计算环境中,在TEE中进行数据解密并进行联合计算,如联合用户画像、金融风控预测、社会风险识别等。计算结束后将计算结果通过安全链路返回给各个参与方,原始数据则在TEE环境中进行销毁。
TEE隐私计算技术可以有效保护在计算时数据的安全性,防止原始数据泄露,同时也可以满足企业间数据高效协作、联合计算的需要。
2.密钥保护
密钥生命周期管理包括密钥的产生、分发、存储、使用、更新、归档、撤销、备份、恢复和销毁等环节。密钥安全是数据安全、系统安全的关键要素。为了增强密钥的安全性,通常将密钥进行加密存储或引入专用的密钥设备。使用TEE隐私计算技术,在硬隔离的TEE环境中进行密钥管理,可以简化传统密钥管理的复杂性,又保证密钥生命周期运行环境安全可靠。
密钥保护应用场景在TEE计算环境中实现密钥生成、管理等功能,同时支持通用加密算法。一方面收到用户密钥请求时使用密钥生成功能生成随机密钥、证书等安全凭证,并通过安全链路传递给用户;另一方面也支持在TEE中使用生成的密钥结合通用加密算法对原始数据、预测结果等进行加密计算。当密钥过期、失效时,在TEE环境中对密钥进行销毁,增强密钥生命周期整体安全性。
3.计算模型保护
多个企业利用在生产过程中积累的数据进行联合建模分析,为了得到更精确的结果,这些企业可以引入具有成熟算法模型的合作伙伴。在这种场景需求下,采用TEE隐私计算保证算法模型安全。
图3-4中是计算模型保护典型场景,用户A与用户B掌握各自数据集,通过用户C将其模型算法构建在TEE隐私计算环境中,数据提供方的数据经加密安全链路传至TEE运算环境,采用算法提供方的AI模型进行建模分析,经过分析后将分析结果传递给数据提供方。同时经过训练可以进一步优化算法提供方的AI模型。计算任务结束后,可以将模型销毁或将优化后的模型返回给算法提供方。
通过TEE隐私计算对算法模型实施安全保护,可以防止算法的泄露问题,同时也可以在不获得合作伙伴原始数据的前提下,利用其数据对自身的算法进行进一步优化。
4.数据加密存储
数据作为企业资产管理的一部分,关键性数据比如经营分析数据、 财务数据、生产数据等更是具有极高的价值。政企客户通常极为重视这类关键数据的隐私性保护,为防止泄露要求对数据进行加密存储。使用TEE隐私计算技术可以为客户提供数据加密存储能力。
该场景使用TEE计算环境作为数据加密模块,用户通过远程证明对TEE环境进行验证,并在TEE环境中生成密钥。客户关键数据在TEE环境内进行加密,加密后的数据可储存在TEE环境中,也可以存储在外部介质中。
数据加密密钥和加密过程发生在TEE环境内,使用TEE隐私计算技术进行数据加密存储可以防止内存泄漏等造成的数据安全隐患。
5.隐私查询
在金融、电商、社区治理等领域需具备针对用户身份进行隐私查询能力,如通过指纹,人脸等信息对人员身份进行比对认证。在医疗领域同样存在对患者疾病病历、基因测序等数据的隐私查询。这些隐私数据往往来自于多个政府部门或企业。基于TEE隐私计算技术是实现这类具有隐私查询需求场景下数据可用不可见的有效方法之一。
在该类隐私查询场景中,在TEE隐私计算环境中构建数据汇交、统计、查询能力。数据提供方将各自的原始数据经加密安全链路传递至TEE隐私计算环境中进行数据汇交与统计分析。数据查询方调用查询接口对其所需的内容发送隐私查询请求,TEE环境中的查询模块根据数据查询方的身份权限向数据查询方返回查询结果。同时也可以结合区块链等技术对数据查询方的查询操作进行存证。
采用TEE隐私计算进行隐私查询,数据提供方的原始数据与查询的整个过程置于硬件隔离的TEE隐私计算环境中,可以实现多方数据的联合汇交,丰富数据库的同时有效降低敏感信息泄露的风险。
报告目录
详细内容请在公众号后台回复 20220624 获取完整报告。
END
往期推荐:
隐私计算头条周刊(6.12-6.18)
个性化广告的未来:通过隐私计算技术实现用户个人信息及隐私全生命周期保护(附报告)