大数据时代,谁来“锁住”隐私?【星特写】
大数据与人工智能时代背景下,数据在各行各业应用日益广泛,数据的价值愈加凸显,数据泄露和滥用造成的影响和损失也越来越大。近年来,随着隐私计算技术的出现,数据共享即将告别瞻前顾后的窘境,引领“主动出击”新趋势。
1
什么是隐私计算?
天冕大数据实验室总结,涉及保护隐私的相关计算技术主要包括:
1、数据加密
1)同态加密
允许用户直接对密文进行特定的代数运算,得到的仍是加密的结果,将其解密所得到的结果与对明文进行同样的运算结果一样。
2)密文搜索
在实现数据共享方面,公钥加密比对称加密更有优势。对称加密大多适用于单用户场景,而公钥加密可应用于多用户场景。
3)安全多方计算
是解决一组互不信任的参与方之间在保护隐私信息以及没有可信第三方的前提下协同计算问题而提出的理论框架。
2、数据失真
通过扰动原始数据来实现隐私保护。基于数据失真的隐私保护技术包括随机化、阻塞、交换、凝聚等。差分隐私也是热门的数据失真的隐私保护技术。
3、限制发布
即有选择地发布原始数据、不发布或者发布精度较低的敏感数据,以保护隐私,主要技术手段是数据匿名化。
随着个人信息保护法草案的出台,在保护数据隐私的前提下解决数据孤岛问题上,隐私计算被多个行业视为颇具潜力的解决方式。在产业端,隐私计算应用场景不断扩展。
在政务行业,隐私计算可以提供政府数据与电信企业、互联网企业等社会数据融合的解决方案。在一些地方政府的相关规划里,隐私计算有望成为下一个应用推广的重点。
在医疗行业,通过隐私计算技术,医疗机构与保险公司之间可以在不共享原始数据的情况下分析投保者的健康信息。中国科学院上海生命科学研究院计算生物学研究所郑广勇表示,隐私计算与医疗大数据行业结合是恰逢其时,随着医疗行业的不断发展,大众会对隐私计算、多方计算概念越来越认同,也更加愿意分享数据。使用联邦计算、隐私计算的方法共享医疗数据,让更多的人从医疗健康数据当中获利,可以推动2030健康中国的目标及早实现。
在金融行业,隐私计算需求尤为突出,该行业是数据密集型行业,也是数据需求密集型行业,其风控、营销等能力都高度依赖于数据的支持。
移动互联网、云计算、大数据等技术的高速发展给金融领域带来了很多创新应用,创造了很多新的业务模式,也极大地提高了金融业务的效率。这些金融科技创新的前提和基础往往是大量新型的个人信息数据的加工利用,而其中包含大量的个人隐私数据,比如身份、住址、行踪、收入、社会关系、兴趣爱好等。这些隐私数据不断地被收集,并且在不同服务提供商之间交流传递,极有可能违背用户的意愿,同时也有可能被一些机构截获,并把这些数据用于非法用途,用户的隐私没有很好的得到保护。
金融机构在隐私保护方面面临两大挑战:一是金融机构要确保自身的数据(包含存储在金融机构的个人数据)不会被非法盗用;二是金融机构必须合规使用个人数据,遵循《通用数据保护条例》(General Data Protection Regulation,GDPR)等隐私保护规定,不以个人信息泄露为代价。
目前,国内隐私计算产品主要应用于金融行业的风控和获客,即多家金融相关机构在不泄露客户个人信息的前提下对客户进行联合画像和产品推荐,在多头借贷等场景下能有效降低违约风险。
从产业视角来看,隐私计算已成为当下创投圈的热点话题,国内外众多互联网及科技巨头纷纷投身该赛道,一批创业企业也各有所长,显示出了强劲实力。
金融级隐私计算技术服务商蓝象智联定位于金融级隐私计算服务,其创始团队主要来自阿里巴巴、蚂蚁金服等头部科技或金融机构,拥有很深的行业实践经验和资源积累。在具体产品上,公司核心产品已通过工信部和公安部认证,目前已被应用于多家银行、运营商和零售商业客户。同时,公司也在参与工信部等行业多方安全计算标准的制定。
未来,隐私计算将广泛应用于金融、保险、医疗、物流、汽车业等众多拥有敏感隐私数据的领域,在解决数据隐私保护问题的时候,也帮助缓解行业内的数据孤岛问题,为大量AI模型的训练和技术落地提供一种合规的解决方案。
随着社会发展进入数据要素时代,移动互联网进入下半场和国际局势的变化莫测,数据要素问题变得更加复杂。脑极体认为,在隐私计算领域,公民数据安全使用的法律定位、企业内和企业间的数据的分析应用以及全球性的数据跨境交易流通,都面临着前所未有的挑战,在各个环节也还都存在各自的问题。
第一,在隐私计算关于公民数据安全使用上,我国的法律尚未对隐私计算是否合法做出明确规定。在现有规定中“未经被收集者同意,网络运营者不得向他人提供个人信息”,而隐私计算的目标就是基于多方数据的计算,原则上破坏了这一要求,但同时又适用于“经过处理无法识别特定个人且不能复原”的例外条款。这些成为制约隐私计算发展的首当其冲的法律瓶颈。
第二,隐私计算在企业内应用还存在一定难度。比如大部分企业的数据规范性和数据质量难以支撑隐私计算对于参与方数据一致性的要求。隐私计算本身的复杂性和计算效率对于企业的大规模商用提出较高要求,试错成本高。另外,隐私计算对于真正受益的用户而言,存在一定的“黑盒”效应,人们很难理解和信任隐私计算技术,普及接受成本较高。
第三,全球数据跨境交易和流动面临重重困境。比如,不久前美国政府对TikTok的发难,其中一条就是指责其收集美国公民数据,严防其将数据存放到中国的服务器当中。之前谷歌曾收到法国数据保护监管机构开出的5000万欧元的高额罚单。
这些隐私计算的应用困境,亟待多方面主体的共同解决,既有全球各地区和国家政府的积极推动,特别是法律法规对隐私计算的权责界定,也要有大数据相关企业对于企业数据治理力度的持续投入。
对于推动隐私计算发展的相关技术公司,现在也有一系列新的发展趋势出现:
区块链技术的出现,为隐私计算提供了新的解决方案。
软硬件协同和平台整合,正在大幅提升隐私计算的性能和便利性。
隐私计算也正在向大规模分布式计算迈进,其实现方式也更加多样化。
在数据越来越有价值,数据安全越来越重要的“数权时代”,隐私计算将成为用户数据安全保护和企业发挥数据价值之间,最重要的那道把关者。隐私计算企业要在其中扮演着数据管理方和服务方的角色,为其提供全方位的数据保护,并进行数据“资产”的全面运营。可以预见,隐私计算将在未来企业间、组织间的数据治理和数据协作,以及像人工智能、新基建等新兴数字产业的商业应用中发挥出举足轻重的作用。
相关阅读: