论文分享|一种基于本地化差分隐私的网格聚类方法
论文名称:一种基于本地化差分隐私的网络聚类方法
论文来源:计算机学报
论文作者:东南大学倪巍伟教授,博士生张东月、张森、付楠、候立贺
论文链接:http://cjc.ict.ac.cn/online/onlinepaper/zdy-2023115113610.pdf
本文背景
随着移动互联网应用的不断深入,产生了大量个体数据,采集分布在不同终端上的数据进行聚类可以发现人群行为模式,支撑应用服务的深入开展.然而这些数据往往包含个体敏感信息,在缺少可信数据采集者的情况下,直接采集数据进行聚类存在泄露个体数据隐私的风险.
近年来,本地化差分隐私(local differential privacy,LDP)以其严谨的数学理论基础得到隐私保护领域研究者的持续关注.现有基于LDP的聚类研究多数采用基于划分的聚类方法,存在仅适用凸状分布数据以及聚类质量损失较大问题.
针对该问题,聚焦网格聚类,提出基于LDP的隐私保护网格聚类方法.
首先,设计网格划分评估指标,通过调节网格划分粒度调控网格密度估算误差和簇边缘信息损失,指导网格结构选取;
然后,在服务器与终端间构建循环反馈机制,利用数据分布信息迭代优化扰动粒度,降低差分噪声注入量,在保护终端数据隐私安全的前提下,提升网格密度估算精度;
最后,在服务器端,提出基于网格结构的自适应网格聚合方法,提升隐私保护聚类质量.理论分析和实验结果表明,所提方法在兼顾各终端个体数据隐私的同时,对不同分布数据有良好的聚类效果.
主要贡献
1. 提出基于本地化差分隐私的网格聚类方法AGCluster,采用解析影响聚类最终结果果成因,优化网格结构和扰动粒度的思想,调控差分噪声规模,实现隐私保护与聚类质量的兼顾。
2. 设计网格划分评估指标,量化网格划分粒度对网格密度估算误差和簇边缘信息损失的影响。
本文研究过程
本文的研究过程主要包括以下几个步骤:
1. 阐述了本地化差分隐私的基本概念和应用场景,分析了现有差分隐私聚类方法的不足之处。
2. 提出了基于本地化差分隐私的网格聚类方法AGCluster,详细介绍了该方法的实现过程和关键技术,包括网格划分、网格密度估算、簇中心扰动和聚类结果输出等。
3. 设计了一系列实验,验证了AGCluster方法在不同数据集和隐私参数下的聚类效果和隐私保护性能,并与其他差分隐私聚类方法进行了比较。
4. 对实验结果进行了分析和讨论,总结了AGCluster方法的优点和不足之处,并提出了未来改进的方向。
实验结论
本文来源:计算机学报
分享仅供学习参考,若有不当,请联系我们处理。
END
热文
2.论文详解丨基于错误学习难度实现联邦学习的高效差分隐私安全聚合
推荐