隐私计算,到底是个什么神仙技术?
大模型如何在隐私计算中应用?
目前前沿的隐私计算技术有哪些?
在隐私计算落地方面,目前的核心挑战是什么?
2023年5月27-28日,9:00-12:30,DataFun将举办用户隐私与数据安全峰会,联合信通院、蚂蚁、百度、OPPO、华为、光大科技等企业和单位的9位专家共同策划,邀请20余位隐私计算领域的专家就隐私计算的核心技术进展、最新应用实践等内容,进行最深入的剖析分享,让大家深度了解用于用户隐私防护的前沿技术,以及推进隐私计算技术在企业的全面落地!
▌峰会日程
▌峰会组织
个人介绍:中国科学技术大学学士,中国科学院大学信息安全博士。主要研究数据安全与隐私保护、应用密码学等领域,曾在EUROCRYPT、KDD、S&P、SIGMOD、USENIX'Sec、VLDB等顶级会议发表相关论文数十篇。他先后在阿里巴巴和蚂蚁集团从事安全多方计算、同态加密、机密计算、差分隐私等前沿技术的研究与应用,研发的技术已被用于保护数千万消费者的数据安全。个人介绍:刘吉博士,现任百度研究院资深研究员,百度数据联邦平台负责人,OASES(OpenAI System Security Alliance)智能终端安全生态联盟的专家委员,CCF普适计算专委执行委员。2017年于微软研究院、法国国家信息与自动化研究所获得博士学位。曾以终身雇员的身份在国际顶级金融软件公司Murex工作。目前主要研究方向为联邦学习、分布式机器学习、大数据及分布式系统。在NeurIPS,ICML, AAAI,IJCAI, KDD, TPDS, TKDE等国际顶级计算机会议和期刊发表多篇学术论文。曾合作发表《Data-Intensive Workflow Management For Clouds and Data-Intensive and Scalable Computing Environments》书籍。他担任NeurIPS,TPDS等国际顶级计算机期刊和会议审稿人。个人介绍:王俊,博士,CCF区块链专业委员会执行委员,OPPO研究院隐私计算实验室负责人。曾任职于新加坡科技局(A*STAR)与卢森堡国家邮政总公司,分别担任研究员与高级专家。就职于卢森堡国家邮政总公司期间兼任欧洲共同利益重大项目 (IPCEI) 卢森堡邮政首席专家。在TDSC, ESORICS, IJCAI, ISSTA等高水平国际会议及期刊上发表多篇论文。
个人介绍:刘巍然,工学博士,毕业于北京航空航天大学,在 ACM CCS、USENIX Security、VLDB,ICDE,TDSC 等 CCF 推荐会议期刊发表论文 20 余篇,已授权发明专利7项;知乎密码学领域优秀答主,出版专著 1 部《密码了不起》,译著 2 部《实用安全多方计算导论》、《魔法数学》,电子译著 1 部《动手学差分隐私》。主导研发的开源库 mpc4j 入选中国隐私计算联盟开源工作组。个人介绍:秦湛,浙江大学网络空间安全学院副院长,百人计划研究员,于2017年美国纽约州立大学布法罗分校获得计算机科学与工程博士学位,同年加入德克萨斯大学圣安东尼奥分校任助理教授(终身轨)。他的主要研究领域包括大数据和物联网中的数据安全与隐私保护技术、人工智能及其应用安全,以及云计算安全外包。30余篇论文发表在IEEE TIFS、TDSC、IEEE会刊等重要期刊和ACM计算机与通信安全国际会议(CCS),IEEE分布式计算系统国际会议(ICDE),ACM知识发现与数据挖掘会议 (SIGKDD)、ACM多媒体大会(Multimedia)等顶级国际学术会议上,论文曾获得2017年IEEE IWQoS最佳论文奖以及2018年ASIACCS最佳论文奖。演讲题目:本地差分隐私保护下的数据流有限内存高频项统计Local Differentially Private Heavy Hitter Detection in Data Streams with Bounded Memory演讲提纲:Top-frequent items detection is a fundamental task in data stream mining. Many promising solutions are proposed to improve memory efficiency while still maintaining high accuracy for detecting the Top-items. Despite the memory efficiency concern, the users could suffer from privacy loss if participating in the task without any privacy protection, since their contributed local data streams may continually leak sensitive individual information. However, most existing works solely focus on addressing either the memory-efficiency problem or the privacy concerns but seldom jointly, which cannot achieve a satisfactory tradeoff between memory efficiency, privacy protection, and detection accuracy.In this talk, we present a framework HG-LDP to achieve accurate Top-item detection at bounded memory expense, while providing rigorous local differential privacy (LDP) protection. Then, we identify two key challenges naturally arising in the task, which reveal that directly applying existing LDP techniques to the framework will lead to inferior "accuracy-privacy-memory efficiency'' tradeoff. Therefore, we propose two new LDP mechanisms to instantiate three advanced schemes under the framework, which respectively address the hurdles caused by the large size of the item domain and by the limited space of the memory. We conduct comprehensive experiments on both synthetic and real-world datasets to show that the proposed advanced schemes achieve a superior "accuracy-privacy-memory efficiency'' tradeoff, saving 2300x memory over baseline methods when the item domain size is over 41k .个人介绍:彭力强,现工作单位瓴羊。2011年毕业于中国科学技术大学,获学士学位;2016年毕业于中国科学院信息工程研究所,获博士学位。曾获2018年获中国密码学会“优秀博士学位论文”奖。在研究所工作期间,作为负责人承担了国家自然科学基金青年基金、“十三五”国家密码发展基金密码理论研究课题等项目。曾在JoC、DCC等期刊会议上发表论文22篇。现主要工作内容为数据隐私保护方案的设计与实现。演讲提纲:隐匿查询方案是适用于数据检索的隐私计算方案,它可以有效保护查询方的隐私。本次演讲主要介绍基于同态加密方案的单次隐匿查询方案和批量隐匿查询方案。个人介绍:顾振博士现就职于阿里巴巴达摩院计算技术实验室,主要研究兴趣为隐私计算软硬件联合优化设计,曾参与达摩院、双子座实验室与蚂蚁链联合共创的联邦学习同态加速器设计与发布,参与实现达摩院自研业界首个全同态加密数据库的研发,成果收录于VLDB、DAC等国际高水平会议及期刊。顾振博士毕业于清华大学集成电路学院,师从李树国教授研究高性能密码芯片设计,在校期间参与高性能ECC、RSA的设计与研究,并参与全同态加密硬件加速的研究。演讲题目:隐私计算中的多层次计算技术-以全同态加密为例个人介绍:张嘉恒刚刚博士毕业于加州大学伯克利分校的计算机科学,导师为Dawn Song教授,即将加入新加坡国立大学计算机系担任助理教授。他的研究兴趣包括应用密码学,计算机安全和数据隐私,特别是零知识证明以及其在机器学习和区块链上的应用。张嘉恒博士曾在密码学和计算机安全顶级会议CRYPTO,Oakland,CCS,USENIX Security上发表多篇论文。博士期间曾获Facebook全球博士奖学金并且在Meta,NTT research,阿里巴巴和期智研究院从事科研实习。演讲题目:高效的零知识证明:理论与实践 Efficient Zero-Knowledge Proofs:Theory and Practice演讲提纲:In this talk, we discuss a cryptographic tool named zero-knowledge proof from both theoretical and practical perspectives. In theory, we present Libra, the first zero-knowledge protocol with optimal prover time, fast verifier time, and succinct proof size. Libra also has excellent concrete efficiency in practice. In practice, we present the first solution for building trustless and permissionless cross-chain bridges in blockchains using zero-knowledge proof. In addition, we discuss how to apply zero-knowledge proof to machine learning and make the protocol practical to guarantee the integrity of machine learning models by the example of the decision tree model. These applied ZKP protocols have rigorous security guarantees along with practical efficiency.个人介绍:兰晓,四川大学网络空间安全学院/研究院助理研究员、硕士生导师。本科毕业于四川大学,博士毕业于中国科学院大学(信息工程研究所),美国西北大学访问学者,四川省海外高层次人才。研究兴趣包括应用密码学,包括认证密钥协商协议、安全多方计算、隐私计算等。目前已在相关研究领域发表论文20余篇,包括IEEE TIFS、IEEE TDSC、ACM CCS等CCF A类国际会议和期刊论文。主持和参与多项国家自然科学基金重点项目、青年项目、重点研发青年项目、四川省科技厅项目、四川大学博士后研究项目,获四川省科技进步一等奖1项,国家发明专利授权3项。演讲题目:安全多方计算技术如何助力分布式数据安全聚合演讲提纲:数据库领域的大量统计分析算法在大数据上表现更佳,但当数据隐私成为新的考量因素后,分散持有数据的参与者因担心数据泄露,不愿意将数据共享出来,从而无法发挥大数据的汇聚效应。本报告介绍了如何基于安全多方计算技术实现数据聚合算法的分布式安全计算,从而让协同计算的各参与方能够在不共享数据的前提下,实现数据的安全聚合。具体来说,本报告将以分位数近似算法Q-Digest(2004)为例,介绍我们近期与美国西北大学Xiao Wang、密码科学技术全国重点实验室郭晖合作发表在IEEE TIFS上的研究工作。通过我们的改进,算法可在分布式环境下安全运行,且能高效地为参与运算的各用户提供对其输入的隐私保护,为数据深度利用提供技术支持。
出品人:闫树 中国信息通信研究院 云计算与大数据研究所 副主任个人介绍:闫树,理学博士,中国信通院云计算与大数据研究所大数据与区块链部副主任,高级工程师。主要研究方向为数据流通、大数据产业等。牵头编写《大数据白皮书》《数据流通关键技术白皮书》《多方安全计算技术与应用研究报告》《知识图谱白皮书》《城市大数据平台建设白皮书》《大数据产业统计口径研究报告》及数据流通、可信数据服务、多方安全计算、联邦学习等相关标准。参与编写工业和信息化部十三五、十四五《大数据产业发展规划》及多项地方政策规划编制。袁博 中国信通院云计算与大数据研究所高级业务主管,隐私计算联盟办公室主任个人介绍:袁博,中国信通院云计算与大数据研究所高级业务主管,隐私计算联盟办公室主任。参与国家大数据规划、数字经济等政策文件、报告起草,负责国内数据流通规则与技术的标准和报告编写,牵头多项隐私计算行业标准制定,构建国内首个可信隐私计算理论体系、标准体系和测试体系。演讲提纲:分析隐私计算互联互通产生的背景、原因、现状和问题,介绍行业对隐私计算互联互通的解决思路、方法路径、和实践案例。茹志强 中国移动通信集团 信息技术中心大数据BG总监个人介绍:茹志强同志入选中国计算机学会CCF第十二届全国代表大会全国代表,是国标 CDA 首批技术合伙人、中国人工智能学会CAAI(吴文俊人工智能科学技术奖)评审库专家以及中国隐私计算联盟电信工作组联席组长,北京市数据字区技术组副组长。茹志强同志在可信数据要素安全流通与隐私计算领域,5年内承担2项部委级重大研发攻关项目,1项国家重点工程实验室项目,获得国际奖励4项,省部级奖励2项,获得国家发明专利5项,在途专利24项,发表论文2篇被IEEE和EI索引收录。演讲题目:梧桐大数据要素流动与隐私计算技术创新助力国家数字化转型发展演讲提纲:成果背景和意义、成果主要内容及创新点、成果自主性说明、总体效益、成果可推广性说明。听众收益:本项目,通过1+X隐私计算架构以及安全求交、联邦学习、隐匿查询、多方安全计算技术的研发和落地,聚焦全网隐私计算统一技术底座能力的研究与优化,致力于解决传统数据要素流通不能兼顾要素价值与隐私保护的困境以及市场及国家政策对基于隐私保护的新型数据流通范式需求问题。该项目的成功实践,为大数据对外价值经营及产品打造提供有力技术工具,进一步助力国家数智化转型发展。个人介绍:硕士学历,毕业后就职于中国建设银行上海数据中心(2009-2015),上海数据分析中心(2015-2018),上海大数据智慧中心(2018-今),目前在建行大数据智慧中心负责包括隐私计算在内的结构化、非结构化数据挖掘领域新工具、新算法和新模型的研究、引入、开发和应用。1. 了解隐私计算出现前银行业怎么和外界进行联合数据应用个人介绍:他是FATE开源社区开发专委会核心成员,微众银行人工智能资深研究员,曾就职于百度,腾讯。一直从事人工智能,机器学习,联邦学习,大数据等领域的研发和应用落地。申请联邦学习相关技术专利100多项和发表多篇有影响力的学术论文。演讲题目:FATE-LLM: 开源助力联邦大模型建设个人介绍:毕业于华中科技大学,蚂蚁集团高级技术专家,专注于隐私计算、机器学习。作为SPU研发负责人,负责密态编译器和运行时的架构和研发。演讲提纲:MPC 协议专注于环或者域上的基础计算,但真实世界中需要用高级语言写复杂的机器学习算法。如何将高级语言写的算法代码使用 MPC 协议执行就变成了一个有趣的问题。SPU通过编译的手段,将原生机器学习代码编译到 MPC 运行时上执行,为用户提供了无感的AI编程体验,并且可以达到 SOTA 的性能效果。本次演讲将介绍 SPU 的设计理念,用法和效果。
个人介绍:北京大学硕士。18年入职华为,从0-1搭建信息流推荐系统;负责语音识别多轮对话等技术落地;负责广告推荐算法技术演进;端云联邦学习系统架构设计;纵向联邦学习架构设计与商业落地等。已授权推荐系统联邦学习发明专利5篇,参与互联网广告隐私计算平台技术要求规范标准制定。个人介绍:黄晨宇博士,目前在腾讯担任大数据高级工程师,毕业于香港科技大学计算机科学与工程系,研究兴趣包括联邦学习、隐私计算等。2. 基于电路隐私求交的全匿踪联邦 XGBoost3. 高效全匿踪联邦 XGBoost 的挑战和优化3. 基于多方安全计算的联邦 XGBoost 优化个人介绍:王俊,博士,CCF区块链专业委员会执行委员,OPPO研究院隐私计算实验室负责人。曾任职于新加坡科技局(A*STAR)与卢森堡国家邮政总公司,分别担任研究员与高级专家。就职于卢森堡国家邮政总公司期间兼任欧洲共同利益重大项目 (IPCEI) 卢森堡邮政首席专家。在TDSC, ESORICS, IJCAI, ISSTA等高水平国际会议及期刊上发表多篇论文。演讲提纲:以联邦学习、安全多方计算为代表的隐私计算能在不泄露原始数据的前提下,对数据进行计算与分析,实现数据价值挖掘。区块链技术由于其去中心化、数据不可篡改性,可以对不信任方的数据操作进行可信存证,做到数据使用可审计、可追溯,现实隐私计算过程中数据全生命周期可审计,使得隐私计算更加安全、可信。本次报告主要讲解以联邦学习为代表的隐私计算与区块链技术的结合方式与应用场景,并介绍其最新进展与可能的挑战。个人介绍:负责星云Clustar隐私计算相关产品规划和管理,具备多年人工智能落地经验和金融行业业务经验。2. 算力方案(联邦学习异构算力方案介绍和落地实现)1. 如何让异构算力方案可以兼容各类联邦学习平台?2. 面对联邦学习性能瓶颈,如何搭配异构算力,构建数据要素流通基础设施?个人介绍:吕培卓,中国科学院信息工程研究所2020级博士。主要研究方向为神经网络后门攻击与防御,神经网络水印技术。目前,他以第一作者发表CCF-A类论文两篇(Usenix Security, IEEE TDSC),CCF-B类论文一篇。演讲提纲:最近,深度神经网络的后门攻击受到了广泛研究。后门技术往往使得被注入后门的模型在良性样本上表现良好,而在后门样本(附加触发器)上产生恶意行为。几乎现有的后门攻击都需要访问原始训练/测试数据集或与主要任务相关的数据才能将后门注入到目标模型。然而,这在许多场景中是不现实的,例如隐私相关的训练数据。在本文中,我们提出了一种新颖的“data-free”后门注入方法。我们收集与主任务无关的替代数据,并过滤掉冗余样本以提高后门注入的效率。我们设计了一种新的损失函数,其使用替代数据将原始模型微调为后门模型,我们优化了微调方法以平衡后门和主任务的性能。另外,最近,窃取高价值和大规模的深度神经网络 (DNN) 模型变得普遍。被盗模型可能会被重新商业化,这侵犯了原所有者的知识产权 (IP)。检测被盗模型的 IP 侵权是非常具有挑战性的,因为微调、修剪、功能等效攻击等能够破坏被嵌入的水印。在本文中,我们提出了一种名为 HufuNet 的新型 DNN 水印解决方案,以检测IP 侵权。此外,HufuNet 是第一个在理论上证明的可以保证对微调攻击具有鲁棒性的水印。1. 如何在无主任务数据前提下往预训练模型中注入后门攻击?2. 如何在无主任务数据前提下保证预训练模型在主任务上的有效性?
个人介绍:孟丹博士现为OPPO研究院高级隐私计算研究员,负责隐私计算平台的研发工作以及隐私计算在业务场景中的应用。主要研究领域包括隐私计算、AI安全、深度学习。在国际会议、期刊发表论文20余篇,申请专利50余项,是隐私计算领域多项国际、国内标准的主要参与人和起草人。个人介绍:日本筑波大学工学博士;阿里安全双子座实验室成员;「猎豹」两方计算框架;主要研究课题是多方安全计算;全同态加密算法的应用。演讲题目:Squirrel: A Scalable Secure Computation Framework for Training GBDT 基于两方安全计算的梯度提升树训练框架演讲提纲:本次演讲的内容基于 USENIX‘23 的工作。我会介绍如何使用高性能的多方安全计算(MPC)算子去完成梯度提升树(GBDT)的训练。与基于联邦学习的 GBDT 训练框架,如 SecureBoost 不同;本案满足在半诚实模型下的可证安全;能够做到训练过程不会泄漏任何中间值,如样本梯度和样本分布等敏感的信息。1. 如何通过切换 Ring LWE 和 LWE 两种同态加密的形式;实现高吞吐的加密速率 & 低带宽消耗2. 提出一个**两轮**交互的协议;计算秘密分享值的(近似)sigmoid 函数。个人介绍:李宏宇,蚂蚁集团,隐私计算部资深安全专家,复旦大学和东芬兰大学计算机科学博士。中国人工智能协会会员、人工智能伦理道德专业委员会(筹)委员。研究领域涉及隐私计算、数据安全、深度学习等。长期致力于推动隐私计算在银行、保险、电力、政务等领域的落地应用,在隐私计算平台标准化、互联互通实践、数据安全流通方面拥有丰富经验。演讲提纲:数字经济转型升级进一步深化,数据要素大潮奔袭而来,对数据技术安全与发展的平衡提出了更高的要求。隐私计算尚处发展早期,还需持续的技术攻关和丰富的应用打磨。在真正成为可规模化的数据基础设施、助力数据要素价值普惠的路上,在开源生态中的链接互通过程中,一起探讨隐私计算的技术融合、技术共建、技术突破。2. 如何通过技术融合创新解决数据流通中的信任和安全问题个人介绍:中科院计算所硕士,负责京东站内推荐广告精排业务,曾主导京东广告精排图模型落地、广告系统合规改造等相关工作。演讲提纲:放眼当前新信息时代的大环境大背景,广告营销业务面临着隐私约束带来的多重挑战。本次分享将阐述京东站内广告业务在隐私保护背景下遇到的挑战,并介绍基于匿名化保护的群体技术以及在京东站内推荐广告场景的合规改造及实践工作。1. 隐私合规背景下传统推荐广告算法服务面临哪些挑战?2. 合规约束下,如何应用匿名化方法实现隐私保护、用户体验、流量效率的兼顾?个人介绍:目前就职于OPPO研究院,负责隐私计算联邦学习的探索和落地。曾参与cross-silo、cross-device、vertical等不同数据分布情况下的隐私计算系统的架构设计、研发和实际落地。发表多篇隐私计算相关论文。演讲提纲:介绍业界主流端云隐私计算系统的设计,实际业务可能遇到的问题,并介绍端云协同隐私计算在OPPO研究院的探索和实践。个人介绍:毕业于北京科技大学计算机科学与技术专业微体系机构方向,先后任汽车之家软件工程师,负责大规模、高性能在线广告系统性能优化;滴滴集团技术专家,从0到1搭建了智能引擎深度学习平台,在线策略系统;蚂蚁金服技术专家,参与“隐语”开源隐私计算框架建设。目前任杭州金智塔科技首席架构师,全面负责隐私计算框架建设与业务落地。演讲题目:金智塔“智隐”平台架构设计与公共数据落地实践
个人介绍:光大科技有限公司大数据研究团队负责人,目前负责金控集团联邦学习生态系统的建设和技术创新,参与了多个隐私计算行业标准制定,是联邦学习开源项目fate专家技术指导委员会成员。他拥有10余年的大数据、人工智能系统设计经验,并在金控集团应用领域中实现了技术创新,其创新成果获得多项行业奖项。个人介绍:李定洲,银联项目管理专家、国内早期TEE研究专家,曾参与和牵头了TEE、隐私计算领域多项行业标准、团体标准的编制落地工作,获得过人民银行金融科技发展奖、上海市技术发明奖等多个奖项。目前正在负责银联隐私计算互联互通条线工作。演讲提纲:本次演讲将就当前金融业异构隐私计算平台互联互通的最新研究成果进行分享和介绍。主要内容包括:1. 集聚产业各方的隐私计算互联互通课题该如何组织推进?个人介绍:现任职于中银金融科技有限公司创新研究中心隐私计算实验室,担任算法工程师一职。主要负责主流隐私计算算法的应用研究,设计与实现多场景下多方联合建模的最优解决方案。2. 实践经验分享:大赛经验分享+业务应用案例分享1. 知识收益:听众将深入了解隐私计算在金融领域的必要性,包括数据隐私保护的重要性和隐私计算技术的在金融领域的应用方向。2. 实践经验分享:通过中银金科的大赛经验分享和业务应用案例分享,听众将获得来自实践者的宝贵经验。这些分享将涵盖实际应用中的挑战、解决方案和成功案例,帮助听众拓展实践能力和应用思路。
3. 展望和启发:演讲将对金融领域隐私计算应用进行展望,为听众提供未来发展的思路和启发,从而在自己的工作和研究中思考隐私计算的应用可能性和价值。
王春凯 中国再保险(集团)股份有限公司信息技术中心/创新孵化中心 高级工程师
▌关于我们
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过3000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章900+,百万+阅读,16万+精准粉丝。