其他
附下载丨《可信密态计算白皮书》
9月26日,蚂蚁集团发布了《可信密态计算白皮书》(以下简称《白皮书》)。白皮书对数据流通行业的趋势、可信密态计算(TECC)技术体系,以及应用场景和未来发展方向进行了深度剖析。
(公众号回复“20220927”获取报告)
编写过程中,蚂蚁集团在隐私计算联盟指导下,与众多行业专家共同进行了深入探讨,希望通过白皮书为数据密态时代的技术发展提供框架和指引,加快新兴技术的推广普及。
以下是白皮书核心内容摘要。
数据密态时代的三个阶段及技术要求
《白皮书》指出,随着我国《关于构建更加完善的要素市场化配置体制机制的意见》、《关于构建更加完善的要素市场化配置体制机制的意见》、《“十四五”数字经济发展规划》等政策文件支持数据要素的发展,数据流通成为必然趋势。在《数据安全法》、《网络安全法》、《个人信息保护法》、《密码法》、《民法典》等法律法规要求、行业对网络与数据安全的诉求,以及技术成熟度上,整个数据流通领域即将告别数据明文时代,开启数据密态时代。数据密态指的是数据以密态形式流通,实现数据流转、计算、融合、制造、销毁的全链路安全可控。数据密态时代的核心是:数据要素安全可靠地流转,需要经过严谨专业的安全评估、保护和检验,并不是简单地做一些脱敏、加密处理,就能够保护数据的安全。数据密态时代,每个阶段的技术要求和应用侧重不同,需要经历三个发展阶段,依次是:“计算密态化”、“大数据密态化”、“数据要素密态化”。
可信密态计算(TECC)技术体系
关于隐私计算实现的数据安全,行业共同认为现有技术基本能够满足特定场景的隐私计算需求,但是对于目标数据量大、参与方多、场景多样的数据中心,单一的技术显现出了不足。经过研究发现,将可信执行环境和密码协议结合,能够很好地对现有技术进行互补,获得更为优秀的综合能力,这一技术发现通过可信密态计算(TECC)得到了实现。可信密态计算(Trusted-Environment-based Cryptographic Computing,简称TECC),是指将数据以密态形式在高速互联的可信节点集群中进行计算、存储、流转的一种可信隐私计算技术,实现数据持有权有效保障、使用权出域可控,支撑任意多方大规模数据安全、可靠、高效地融合与流转。TECC具有可信节点内进行密态计算、数据持有方与计算方的解耦、域外可控的数据密态封装等基本特征,可以通过安全编程语言、形式化验证、多级别可信节点等进一步提升安全性和适用性。基本特征包括:
可信节点内进行密态计算:任一可信节点分区内仅出现密态数据,没有任何明文信息,使得TECC可以抵御硬件漏洞、增加防御纵深。可信节点提供的安全隔离环境和远程认证代码逻辑的能力,使得TECC可以抵御合谋攻击、恶意敌手攻击。 数据持有方与计算方的解耦:解除因数据持有方直接交互带来的公网传输限制,突破性能瓶颈;计算逻辑不受数据持有方的数量、数据分割形式等影响,突破适用性瓶颈。 域外可控的数据密态封装:将密态数据和使用规则封装在一起,确保密态数据在脱离数据持有方物理区域后仍然不会被窃取且只能按指定规则使用。此特性是构建密态大数据平台、多平台的互联互通的核心。
安全编程语言和形式化验证:采用安全编程语言、形式化验证等手段,确保内存安全、密码实现一致性等关键安全属性。 多级别可信节点:允许采用包括软件、TPM、TEE等在内的多种可信技术,适应不同的安全性和成本需求。 容忍部分节点被攻破:单个或少数可信节点分区被攻破,不影响安全性。可通过将风险节点放置在同一分区抵御供应链攻击。
抵御现实攻击
性能接近明文
支持任意多的参与方
高可靠性和极具竞争力的成本控制
实现数据持有权和使用权分离
可信密态计算(TECC)的应用及技术演进
可信密态计算(TECC)目前已经在蚂蚁集团得到了成熟应用,实现了金融级的安全和稳定性验证。实践结果表明,TECC可以高效完成隐私求交、隐私保护机器学习、密态数据分析。在隐私求交案例中,TECC使用计算量较低的密态比较替代了复杂的非对称运算,性能得到大幅提升。在隐私保护机器学习案例中,TECC使用了全流程密态计算,包括训练、离线预测、实时预测等环节。在密态数据分析案例中,TECC通过支撑标准的接口,能够让大量业务人员快速地使用到密态计算能力。TECC支持任意多的参与方、支持复杂的运算逻辑的特性,还能在综合性密态数据中心(如东数西算)等得到应用。在综合性密态数据中心中,通过数据胶囊等能力,形成了一个集密态计算、密态存储、全流程管控等综合能力的计算中心,服务于东数西算等大规模的场景。在实测中,TECC可以在分钟级完成亿级ID求交、千万级XGboost隐私机器学习训练、5000万行密态排序。这一性能可以充分满足产业规模化落地的需求。
结语
可信密态计算(TECC)核心创新之处在于,将密码学协议、可信计算技术和全栈可信技术相结合,获得了显著更高的综合能力,将多个参与方、一个行业或者多个行业的数据以密态的形式汇聚起来,为密态时代发展提供核心能力。
《白皮书》中多次提到,可信密态计算的演进和优化,离不开技术融合、密态生态的发展。TECC是多种技术融合的创新,整体技术成果的演进,也需要支撑性技术的提升,如TEE系统,需要更加成熟的、可供产业使用的TEE种类。而广泛使用的机器学习生态和数据分析生态,包括Pandas、Ray、Spark、SQL、NumPy等,机器学习类包括TensorFlow、PyTorch、sklearn等,都能支撑TECC为明文计算提供对应的密文计算。来源:蚂蚁技术AntTectEND
往期推荐:
隐私计算头条周刊(9.18-9.24)
招标 | 近期隐私计算项目招标中标20(数据交易、区块链、数据安全)
热门文章:
姚期智院士:数据、算法、算力为何是数字经济核心技术?
附下载 | 2022年隐私计算技术与行业应用报告合集(33份)
招标 | 近期隐私计算项目招标18(联通、不动产、股权市场、银联等)