其他
横向联邦学习下隐私保护安全聚合:问题,方法,与展望
横向联邦学习
2
成对加性掩码路线Google在CCS'17提出的基于成对加性掩码的安全聚合方案是经典方案之一,该方案基于客户端之间协商的成对加性掩码,在安全聚合中利用加法或者减法茫化真实输入。而成对加减掩码在最终的加法聚合中可以成对抵消,从而实现了安全聚合。然而,该方案主要面向cross-device问题,因此需要补充额外的技术处理设备掉线带来的影响:1. 为了解决设备掉线带来的正确性问题,该方案额外引入了Shamir's 秘密分享技术将茫化种子安全分享到所有用户,从而所有用户构成一个全连接图。以便在线客户端恢复掉线客户端种子并将其茫化作用抵消;2. 为了解决设备资源受限带来的隐私泄露问题,该方案引入了双盲(double-masking)技术。
该方案的具体过程和分析可以参考文末给出的链接[1]。然而,该方法也存在着很大的性能问题,尤其是大规模的使用Shamir's 秘密分享带来的计算和通信开销。为了进一步优化性能,CCS'20将每一个客户端的邻居节点限制在O(logN)以提升性能,并分析了在该情况下的隐私性等问题。该论文的详细解读可以参考文末链接[2]。除此之外,还有许多工作在CCS'17的方案上继续展开,例如为了抵抗恶意服务器,VerifyNet 进一步引入了双线性技术等。浅见:基于成对加性掩码的安全聚合技术更适合轻量级客户端的安全聚合,只需要一个服务器,而且允许部分客户端和服务器合谋,安全性好。不过,该方案需要客户端-服务器之间多轮通信,而且只支持加法聚合。
3
同态加密路线
将同态加密技术应用到FL中以保证梯度(或权重)的隐私最早是在Phong等人在TIFS‘17提出[3]。利用同态加密的加同态性质可以很直接的实现密文下的梯度加法聚合。然而,同态加密巨大的计算开销是制约其发展的重要瓶颈。而且密文膨胀也会带来巨大的通信负载。为了提供足够的计算资源,基于同态的方案一般面向cross-silo场景。为了提升TIFS'17的方案效率,USENIX ATC'20上Zhang等人发表的[4]将量化技术和同态加密结合,从而提升同态密文批处理编码梯度的效率,进而减少加密等操作的次数和密文数量,从而提升系统性能。该方案的阅读笔记可以参考文末链接[5]。浅见:基于同态加密的安全聚合技术目前受计算限制比较大,但是方案构造简单友好。不过目前该技术思路下的聚合方案还是大多面向加法聚合,并且该方案下客户端不能和服务器合谋。虽然目前也有多密钥同态方案可以借鉴,但是性能会更受限制。
4
秘密分享路线
基于秘密分享的方案令客户端将梯度或权重以秘密分享的形式传送到多个不完全合谋的服务器上,多个服务器之间利用安全多方计算方案实现安全聚合。5
展望
上述梳理了一些面向横向FL的安全聚合技术方案,不同的方案各有优劣。然而,对于FL和安全聚合,我们也需要认识到:1. 虽然每次聚合能够保护客户端的私有输入,但是聚合结果还是要公开给用户。结果的公开对于隐私的泄露是多少需要注意,之前一些研究也在探究FL中聚合结果造成的隐私泄露;2. 除此了横向FL,面向纵向FL的安全聚合研究还比较少,虽然也有一些技术试图解决这个问题,例如PrivColl,但是性能通信等需要进一步的提升探索;3. FL在分布式的场景下,更容易受到计算节点的恶意攻击。面向恶意攻击的高效安全聚合方案也是迫切需要的。6
参考链接与文献
[1] https://zhuanlan.zhihu.com/p/83786131[2] https://zhuanlan.zhihu.com/p/403179338[3] Phong, L.T., Aono, Y., Hayashi, T., Wang, L., & Moriai, S. (2018). Privacy-Preserving Deep Learning via Additively Homomorphic Encryption. IEEE Transactions on Information Forensics and Security, 13, 1333-1345.[4] Zhang, C., Li, S., Xia, J., Wang, W., Yan, F., & Liu, Y. (2020). BatchCrypt: Efficient Homomorphic Encryption for Cross-Silo Federated Learning. USENIX Annual Technical Conference.[5] https://zhuanlan.zhihu.com/p/326712188[6] Corrigan-Gibbs, H., & Boneh, D. (2017). Prio: Private, Robust, and Scalable Computation of Aggregate Statistics. Symposium on Networked Systems Design and Implementation.[7] https://link.springer.com/chapter/10.1007/978-3-030-41579-2_40
[8] https://www.sciencedirect.com/science/article/pii/S0167404820300985
[9] https://eprint.iacr.org/2021/993
译者简介:董业,本科毕业于山东大学计算机科学与技术专业,目前在中国科学院信息工程研究所攻读博士学位。主要研究兴趣包括隐私保护、安全多方计算、同态加密和机器学习。知乎:酸菜鱼。
往期推荐
隐私并集计算 Shuffle-based Private Set Union:Faster and more secure
同态加密开源框架整理
国际信息安全顶级会议ACM CCS2022论文合集整理(上)