多起村干部被灭门案,需要反思了!

高铁打人者身份被曝光,人脉资源碾压普通人!却遇到了硬茬

OPPO芯片业务解散不一定是坏事

明确了!任期届满后,他不再寻求连任!

去泰国看了一场“成人秀”,画面尴尬到让人窒息.....

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

沙龙分享 | 数牍科技单进勇:隐私计算助力通信数据价值的安全释放

隐私计算联盟 隐私计算联盟 2022-08-28




2021年8月25日,为推进隐私计算技术在通信行业应用,隐私计算联盟(PPCA)、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)联合召开“隐私计算通信行业应用沙龙”。数牍科技密码学研究专家单进勇博士就《隐私技术与创新实践》做主题分享。



01隐私计算相关背景


继《数据安全法》9月1日落地实施起,《个人信息保护法》也将于11月1日起实行。数据和信息安全被推到了风口浪尖。尤其是即将出台的《个人信息保护法》中,明确指出企业应当遵循最小、必要等原则,保障个人在信息收集、存储、使用、加工、传输、提供、公开、删除等环节的知情权与决定权,互联网行业的合规压力明显增加。在法律法规和监管制度的要求下,构建一个安全的数据协作、流通的技术环境具有极大的战略意义及紧迫性。隐私计算作为数据安全协作的技术推动力在此背景下备受关注。


那么从技术的角度看,隐私计算如何能够解决当前数据开放流通场景中面临的瓶颈呢?单博士在沙龙分享中提到数据开放流通现状有两个核心难题,即安全性和可用性。安全性除了指要保证数据的合规使用之外,还包括对企业等机构核心数据资产的安全保护。目前,企业等机构内部数据的安全相对可控,但当涉及到对外合作时,仍存在核心数据不敢共享、不愿共享、不能共享的现状,导致可用性降低。当然,随着数据要素市场化配置的不断推进和完善,数据开放是数字经济时代的必然趋势。目前有一些政府部门也在积极推动数据开放平台的试点;大型集团企业内部各部门间共享数据意识明显增强,部门之间的“数据壁垒”正在被打破;以及隐私计算服务技术厂商的兴起,提供如联邦学习,安全多方计算等隐私保护技术来满足数据开放流通的需求。


但总体而言,单博士在分享中指出,数据共享开放平台的建设仍存在诸多难点:如何从价值密度低的海量庞杂的数据挖掘出有用的信息;实时场景下,如何满足实际应用中复杂多样的需求等;尤其是当前相关产业中存在过度收集信息、大数据杀熟、非法买卖、泄露个人信息等问题,在行业监管收紧之后,企业间数据的开放协作,如何兼顾安全性和可用性的平衡。


隐私计算解决了传统数据开放方式的数据安全隐患。传统数据协作的手段是将用户的私有数据上传到某个平台上,然后进行模型训练或者用户群圈精准筛选。但是在这个过程中,要输出模型以及目标人群数据来满足业务的需求,同时用户的私有数据也需要出本地,或者至少有一方的数据要出本地。单博士提到,即使这些数据做了脱敏或者匿名化的处理,其价值仍然还是非常高的。如果被留存下来的数据进一步流入到数据交易的二级市场,也会损害原数据拥有者的利益,甚至导致个人隐私信息的泄漏。基于隐私计算技术的数据协作方式,可以做到各方原始数据不出库,同时基于密码学、安全多方计算、联邦学习构建可信数据管道,通过AI建模、隐私查询、联合统计等满足上层应用场景的需求。


02什么是隐私计算


那么,什么是隐私计算呢?隐私计算是实现数据保护及隐私和数据流通的关键技术手段。通过用户授权、数据使用协议,以及对数据的采集、存储、使用、转让、共享及公开披露区分管理,来实现数据的所有权不转移,使用权细分可控。单博士认为,隐私计算要达到协作与效率、安全与隐私和监管与审计三方面的平衡。


隐私计算功能应用主要可以概括为四个方面,即联合查询、联合统计、联合建模及联合预测。到具体的业务场景中,需要结合实际需求用到几个功能模块的组合。


1、联合查询

多方数据集隐私求交与融合,支持数据集内容和数据集规模的隐私保护方法,如PSI、PIR。


2、联合统计

对多个不同实体的数据集共同进行统计分析,以解决单个实体样本不足、分布不均无法为数据分析和挖掘提供可信结果等问题,如统计分析和特征分析。


3、联合建模

联合多个数据实体来扩充样本数量或者丰富特征维度,训练出效果更好的模型。


4、联合预测

当联合建模完成之后,各参与方可能只掌握部分模型或者模型参数的秘密碎片,尤其是纵向联合建模的场景;另一个场景是一方拥有完整模型,一方拥有样本数据。


03隐私计算在数字营销领域的应用及实践


运营商大数据资源有着得天独厚的优越条件,数据具有可靠性高、覆盖面广、特征丰富、时效性强等特点。数牍科技基于隐私计算安全协作的工程能力优势,结合运营商的数据资源优势,目前主要在广告投放、流量反欺诈、营销等场景的开展应用尝试。


其中,数牍科技在和运营商合作中已有成功案例落地。数牍科技作为隐私计算领域的全栈技术及基础设施服务商,以“促进数据流通协作,挖掘数据深层价值”为使命,对接运营商的高质量数据源,帮助广告主在自身数据不出库的前提下进行人群洞察和高转化人群挖掘,并支持RTA投放等广告服务,真正实现“人群筛选个性化,流量优选实时化”。同时数牍科技也提供流量反欺诈服务。针对网络诈骗、交易诈骗、虚假流量、盗号盗卡、薅羊毛用户等欺诈手段,数牍科技通过隐私计算,融合运营商的高质量数据,使用联邦学习建立实时欺诈模型,专注于识别虚假曝光、虚假点击、虚假下载等欺诈行为,有效评估渠道质量,提升广告主流量反欺诈能力,降低企业广告投放或营销活动中的欺诈损失。


04隐私计算在金融反洗钱、反欺诈等场景的发挥重要作用


数牍科技联合运营商,在赋能保险、银行等金融客户在数字化运营、精准营销、反洗钱、反欺诈等场景发挥重要作用。


在数字化进程推动下,越来越多的金融机构正在探索引入外部数据,采用隐私计算技术助力银行反洗钱的开展。在反洗钱场景应用实践过程中,数牍科技应用联邦学习等隐私计算技术,帮助银行引入通信运营商数据,为银行反洗钱业务中补充了50+对应特征维度,帮助双方进行隐私计算联合建模,通过隐私保护集合求交技术对双方用户ID进行匹配,帮助双方在不交互原始数据的前提下进行安全合规的数据协作,为反洗钱场景模型补充了更多有效数据,提升银行反洗钱识别能力。


分享到最后,单博士介绍了数牍科技完全自主研发隐私计算产品Tusita,基于联邦学习建模、多方安全计算框架及大数据系统,已实现了包括多方安全匹配、多方数据分析、多方数据清洗、多方安全建模及报告、多方安全预测、数据匿名查询、ID隐私融合等的全流程的多方隐私计算。平台帮助多方用户在原始数据无需暴露的前提下进行联合建模及计算,达到数据可用不可见、用法及用量可监控的目的,目前已在金融、电信、消费品、政务多个领域中进行落地。


未来,数牍将继续发挥与运营商深度合作优势,共同打造安全合规、健康可持续的数据协作生态,赋能广告营销、金融等行业的数字化转型。



往期推荐01

《隐私计算白皮书(2021年)》正式发布(附下载链接)

02

聚焦隐私计算 激活数据流通——2021隐私计算大会在京召开

03

重磅发布|“隐私计算联盟”正式成立

文章有问题?点此查看未经处理的缓存