隐私计算头条周刊(11.6-11.12)
POLICY FOCUS
INDUSTRY HIGHLIGHTS
ADVANCED TECHNOLOGY
1.密钥泄漏及其解决方法
2023年10月16日至18日,中国西安举办了第一届数据安全与隐私保护国际研讨会DSPP2023。此次会议由多个机构共同承办,涵盖了数据安全和隐私保护的相关议题。研讨会中,黄欣沂教授分享了有关密钥泄露攻击的研究成果。他团队针对密钥隐私窃取和密钥强制托管两类攻击,提出了改进方案,包括采用重随机加密和可隐写加密进行密文清洗和净化,以及通过算法替换攻击方式提取随机数来验证密文是否携带隐匿信息。
2.走进零知识证明系统一Plonk之KZG承诺方案
PLONK是SNARK中最重要的零知识证明系统之一,相比Groth16具有通用和可更新的可信设置等优势。但缺点是证明大小较大,可能影响以太坊网络上的gas fee。多项式是证明系统的基础元素,通过KZG多项式承诺方案实现验证。PLONK使用批处理技术,允许在单个步骤内承诺多个多项式。这些技术使得PLONK在数据安全和信息安全领域具有竞争力。
3.论文分享|FedFed:特征蒸馏应对联邦学习中的数据异构
本文提出了一种名为FedFed的即插即用联邦学习模块,通过特征蒸馏的方式解决了数据异构问题。实验证明,FedFed在异构数据场景下可以显著提升联邦学习的性能和收敛速度。文中还讨论了性能-隐私困境,并提出了通过共享数据中极少部分信息的方式来解决数据异构问题的问题。最后,该研究设计了FedFed框架,其中包括定义性能敏感特征和性能鲁棒特征、特征蒸馏以及隐私保护等方法。实验证明FedFed在不同数据集和实验设置下都显著提高了模型的准确率和收敛速度。
4.联邦学习系统攻击与防御技术研究综述
本文是关于联邦学习系统攻击与防御技术的综述,讨论了数据安全和信息安全方面的问题。文中概述了联邦学习的定义和应用,并详细定义了安全属性,总结了攻击方式和防御手段。攻击方式包括投毒攻击、对抗样本攻击和推理攻击,防御手段包括数据消毒、鲁棒性聚合、异常检测、对抗训练、知识蒸馏、剪枝和其他方法。最后,提出了联邦学习的未来研究方向。这篇综述对数据安全和信息安全的相关问题进行了全面讨论,对进一步的研究和应用具有指导意义。
5.自适应样本加权的联邦学习算法
论文题为“FedSW: Federated Learning with Adaptive Sample Weights”,由分布式人工智能实验室2020级博士生赵兴莹与沈栋教授合作完成,并在计算机科学领域顶级期刊Information Sciences发表。研究发现,联邦学习中由于客户端数据集的统计差异性导致模型参数波动,影响训练的稳定性和模型的收敛性,提出基于自适应样本加权算法的解决方案。实验结果显示该方法在不同数据集上能显著改善算法性能,提高准确率,并有效减少噪声影响。
6.自适应裁剪的差分隐私联邦学习框架
基于自适应裁剪的差分隐私联邦学习框架提出了一种有效解决数据安全问题的方法。该框架通过梯度裁剪和添加动态高斯噪声,保障了参与者的隐私,并提升了模型精度。实验结果表明该框架在隐私保护和模型性能方面都有显著的提升。此外,对本地训练次数和批次大小进行分析,并进行了实验验证。该研究得到了国家自然科学基金及其他基金的资助。
7.IEEE TPDS 2023 | 基于有损通信的联邦学习模型传输策略
联邦学习是一种分布式学习方法,它通过互联网将分散的客户端与参数服务器连接起来,完成模型训练。然而,在有损互联网传输条件下,现有的模型更新传输方法存在一些问题。本文提出了一种有损通信下联邦学习的传输策略,利用UDP协议实现数据传输的高效利用,并通过压缩、前向误差校正和重传技术设计了FedLC算法来控制传输的流量和数据包的丢失率。实验结果表明,该算法能够在给定训练时间内显著提高模型的精度,减少传输的流量。本文的研究成果对于优化联邦学习的模型更新传输具有重要意义。
RECOMMENDED READING
1.国家数据局成立,我国数据要素产业步入发展新阶段
2023年3月,中共中央、国务院印发《国务院机构改革方案》,部署组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,由国家发展和改革委员会管理。国家数据局的成立对于数据产业和数字经济的发展具有深远影响。这一举措将统一和协调数据管理,促进数据流通和创新应用,为数字化转型奠定基础,打破数据孤岛,提高数据资源整合和共享的效率,推动数据产业与实体经济的融合。国家数据局将成为数据安全的纽带,保障大数据产业和数字经济高质量发展。
2.案例分享丨一种基于隐私计算的数据交易模式研究
数据的交易常常导致个人隐私泄露和滥用的风险。基于隐私计算的数据交易模式通过使用密码学技术和隐私保护算法,将数据进行加密和匿名化处理,以保护个体隐私。数据作为一种虚拟的生产要素,具有可复制性和创新性等特点,因此在交易和流通中面临着一些独特的挑战。基于隐私计算的数据交易模式采用安全多方计算等底层技术,确保数据的隐私性和安全性。传统的数据交易模式存在数据泄漏和滥用的风险,而隐私计算的数据交易模式可以解决这些问题。以上是关于数据安全和信息安全的摘要内容。
3.一种基于隐私计算的数据要素资产评估模式研究
基于隐私计算的数据要素资产评估模式结合了隐私保护和数据价值评估的需求,使用隐私保护技术对数据进行处理和计算,确保数据隐私和评估的准确性和有效性。基于隐私计算的数据要素资产评估模式可应用于金融、医疗、社会福利、电子商务等领域,保护数据隐私的前提下,对数据集的价值和特征进行精确评估。
4.2023全球隐私保护行业现状和未来展望
2023年,随着科技的不断发展,隐私的概念变得复杂而重要。数据泄露和监控技术的崛起成为我们面临的挑战。了解数据泄露的后果以及监控技术的运作方式对于保护个人和组织的隐私至关重要。个人可以通过使用强密码、VPN等方式保护在线隐私,组织可以采取数据加密和定期安全审核等措施来保护用户数据。隐私倡导者和立法也在努力推动更强大的隐私保护。
5.隐私计算工程师必备的五项核心技术盘点
随着数字经济快速发展,隐私计算备受瞩目。隐私计算实现安全共享和分析数据,提供数字化解决方案。随着数据安全和隐私保护法规加强,隐私计算工程师将成为热门职业。作为隐私计算工程师,需要掌握技术知识和实践经验,关注差分隐私和安全多方计算两大基础技术。差分隐私通过加入随机噪音保护个人隐私,被广泛应用。安全多方计算允许多方联合计算,保护隐私数据。以上是隐私计算工程师必备的五项技术基础和实践路径。
6.使用多方FHE进行协作隐私保护的肿瘤数据分析案例
在2022年NORD突破性峰会上,FDA局长Robert M. Califf强调了实际世界数据和实际世界证据在临床研究中的重要性,特别是在罕见疾病和肿瘤领域的合作需求。数据和隐私挑战是跨境数据合作中的难题。通过全同态加密(FHE)技术可以在不暴露原始数据的情况下对加密数据进行计算,此技术在肿瘤数据分析中已经得到应用。研究人员合作使用FHE技术进行了隐私保护分析,包含623名患者和24个变量的结肠癌患者生存数据集。研究结果与精度目标相符。
7.2023年美国人如何看待数据隐私,是否有变化?
2023年的一项研究发现,美国人对数据安全和隐私的担忧持续上升:71%的人担心政府使用个人数据,67%的人对公司使用个人数据知之甚少,73%对公司数据收集持有缺乏控制感。此外,77%的人不相信社交媒体CEO会对数据滥用负责,70%的人不相信公司会对人工智能使用负责任。另外,89%的人担心儿童在线隐私,34%的人在过去一年中经历了数据泄露或欺诈。为了解决这些问题,需要政府、企业和个人共同努力,确保个人数据的安全和隐私得到妥善保护。
8.数据共享,贵阳试点“鹰眼执法”探索川渝黔滇四省(市)联合打非治违新模式
11月8日,贵州举行2023年川渝黔滇四省(市)交通运输综合执法联席会议暨数字化执法演练活动,重点讨论数据共享和打非治违。会议推出了“数字打非治违”平台和《高速公路交通运输综合行政执法指南》,强调数据共融和精准打击非法营运。通过“鹰眼执法”终端,贵州省已成功查处400余起非法营运案件,确保数据安全和信息安全。交通运输综合执法部门与公安部门、交通管理局等多部门联合执法,通过数字化执法系统实现了快速发现、稳定跟踪、智能识别、精准打击。川渝黔滇四省(市)将共同构建一体化治理格局,为推进交通强国建设提供法治保障。
9.日均超2.5亿单,隐私运单如何实现个人信息“加密”
当前,我国日均快递业务量已超3.3亿件,个人信息保护面临严峻挑战。隐私运单通过加密处理等技术手段,实现快递个人信息的加密保护。然而,隐私运单在实际推广中仍存在一些问题,如影响派送效率和上下游信息壁垒未打通等。为满足寄递用户个人信息保护需求,国家邮政局将建立通报机制、推动互联互通等措施,并加强查处信息安全违规行为,提高信息安全风险管控。以上是关于快递信息安全的相关内容。
10.大语言模型的七大网络安全热门应用
飞速发展的人工智能和大型语言模型(LLM)正成为网络安全变革的力量。人工智能推动网络安全主动、智能防御,结合人类专业知识是最佳方式。企业需整合新技术保护数字资产。人工智能和大语言模型推动的五大网络安全技术创新:数据处理、模式识别、持续学习、自动决策、多模态数据分析。大语言模型应用也适用于防御和进攻网络安全策略。人工智能的七大网络安全热门应用:异常检测、自动事件响应、行为生物识别、网络钓鱼检测、恶意软件检测、用户认证、安全自动化。基于大语言模型的五大网络攻击:复杂网络钓鱼、智能恶意软件、深度伪造攻击、自动化社会工程、人工智能辅助的网络间谍活动。人工智能和大语言模型为网络安全带来重要的变革。
11.李开复率队问鼎全球多项开源大模型榜单
李开复创办的AI 2.0公司零一万物发布了首款开源大模型Yi系列,其中Yi-34B在多个领域取得了全球第一的成绩,包括英文测试榜、中文能力排行榜等。该模型以小博大,仅有一半参数量就超越了其他大模型。同时,Yi-34B还刷新了大模型的上下文窗口长度,可以处理约40万汉字超长文本输入。Yi系列制成的秘诀在于自研规模化训练实验平台和强大的AI Infra团队的支持。零一万物目前正在研究专长于数学和代码的大模型。
END热门文章:招标 | 近期隐私计算项目招标中标46(中国民航、江苏瑞中、中国移动、北京生态环境局等)
CNCC论坛分享丨数据合规与治理:如何从皇帝的新衣到金钟罩铁布衫?
笔记分享 | 组队学习TEE(1)— TEE-数据安全新范式