《基于联盟链技术的隐私保护金融应用研究报告》:“隐私计算+区块链”为建设高效、安全的数据要素市场提供技术基础
近日北京金融科技产业联盟数据专委会发布《基于联盟链技术的隐私保护金融应用研究报告》。报告分别从数据共享在金融领域应用的痛点难点问题、区块链的的发展现状,隐私计算与联盟链结合的可行性,给出了基于联盟链的隐私保护数据共享架构方案,最后,报告从隐私保护数据共享的合规及政策方面提出了遵循知情同意原则维护个人信息安全、落实断直连保障征信信息安全共享、完善监管标准体系、加快市场化场景应用落地四方面发展建议。
关注公众号并回复“20220804”获取完整报告
数据共享在金融业应用的问题
在大数据时代,一方面国家要建设数字经济社会,支持数据开放共享、互联互通;另一方面,数据的交叉比对使反推匿名化后的用户信息变得更加容易,因此,数据开放共享带来的隐私泄露问题,也不得不受到重视。构筑用户数据隐私保护和数据安全保护的屏障,在依法合规前提下实现数据共享,成为金融领域利用数据的重中之重。
隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。隐私计算实现了“数据可用不可见,数据不动模型动”、“数据可算不可识,数据可控可计量”、“不共享数据,而是共享数据价值”。隐私计算本质上是在保护数据隐私的前提下获取数据的价值。然而,基于隐私计算技术实现隐私保护的数据共享,在实际应用中也面临许多挑战与问题。
1.数据要素确权问题
商品交易的前提是明确商品的产权归属,数据要素交易也是一样。然而,数据作为信息时代人们身份标识、生产生活轨迹、资产和交易簿记的对象和信息载体,其信息主体、数据来源、生成过程、法律属性和内容特点千差万别,很难界定其产权归属。
作为公共事务管理和权利救济机构,相关政府部门、司法机关和行业组织也在日常工作中生成和积累了大量的公共数据,这些公共数据很多从生成目的和基本属性上都具有公共属性,一般认为应当公开、共享,但经过处理加工后又可能产生经济利益和商业价值,由此产生了公共数据与数据产品、数据服务之间的产权划分问题。
2.数据交易定价问题
当前数据要素市场尚未完善,各方机构尤其是金融机构对高质量的数据诉求高,存在数据寡头对数据定价不合理、交易双方存在交易欺诈、交易价格不透明、数据质量难以保证等问题,从而引申出合理定价的必要性。
数据要素不同于其他生产要素,数据要素具有一些独有特性,例如易复制性、可加工性等。易复制性使数据要素的转移成本几乎为零;可加工性使得数据可以以不同的形态出现(如加工标签指标、算法模型、知识策略等),且加工过程中数据不会被消耗,反而能产生更多数据,这也会衍生出数据重新封装后二次倒卖的公风险。这就要求数据要素在定价时需在传统定价方法(如成本法、收益法、市场法等)的基础上,融入数据质量维度、数据应用维度、数据风险维度等影响因素。
隐私计算与区块链结合可行性分析
隐私计算是以多方安全计算、同态加密、联邦学习和可信执行环境等为代表的现代密码学和信息安全技术,在保证原始数据安全隐私性的同时,完成对数据的计算和分析,实现数据的“可用不可见”。隐私计算保障了计算过程中原始数据的隐私安全,但不可忽视的是,隐私安全的保护只是实现数据合规共享流通中的一环。在数据的流通与共享过程中,还存在着如前文所述的数据确权、数据定价、数据交易存证监管、数据交易恶意节点探查等问题,这些问题恰恰是隐私计算所不能解决的。想要让隐私计算中数据更高效、安全地互通互传,需要引入更多的安全机制。
利用区块链的去中心化、不可篡改、不可伪造等特性,可实现数据溯源、智能合约自动执行等能力,恰好可以提供隐私计算过程中数据全生存周期的全闭环管理,使过程更加安全、可信。
1.匹配程度分析
隐私计算和联盟链的匹配程度可理解为研究隐私计算与区块链技术的相融度间题。下面将通过双方的网络拓扑、技术特性等方面进行探讨。
(1)网络拓扑与技术特性分析
网络拓扑分析:无论是隐私计算还是联盟链,他们的初衷都是解决在没有第三方可信机构的前提下如何合作共营的问题。因此,当使用这两项技术时,可以将他们都设计成分布式架构,如图5所示。
在联盟链中,参与方拥有的节点一般称为区块链节点,他们之间组成的网络称为区块链网络;同理,在隐私计算中,参与方拥有的节点一般称为隐私计算节点,他们之间组成的网络称为隐私计算网络。
技术特性分析:在联盟链中,每个参与方拥有一个或多个区块链节点,这些节点可能承担共识、记账等工作。他们利用共识算法等机制保证节点间的最终一致性,利用哈希链状结构、冗余账本保证数据防篡改与可溯源,从而保证数据在链上是可信的。
在隐私计算中,每个参方拥有一个或多个隐私计算节点,这些节点可能承担计算、协调、数据提供、数据授权等工作。他们利用密码学算法、安全通信协议等技术,在不泄露数据隐私的前提下保证计算结果准确无误,计算过程安全可信。
综上所述,在技术特性方面,联盟链技术与隐私计算技术所关注的内容是不同的。前者侧重的是数据存储的存储可信性,而后者侧重的是数据计算过程的隐私性,详见表3。
(2)隐私计算与联盟链的互补性
联盟链介于公有链与私有链之间,是多个组织或机构参与的区块链。即:联盟链是由多个私有链组成的集群,由多个机构共同参与管理的区块链,每个组织或机构管理一个或多个节点,其数据只允许系统内的机构进行读写和发送。联盟链具有准入机制,仅限特定某个群体的成员和有限的第三方参与。数据提供方和使用方等须经过资质审核后才能加入,且必须遵守约定的数据流通规则。联盟链还可以通过分级的权限控制及预先设定的智能合约更好地规范数据流通行为,进一步保障链上数据合法合规。
联盟链的运行机制与多方机构联合起来完成一个隐私计算任务的过程有很高的契合度。联盟链在数据授权、存证和交易记账方面有着天然的优势,能解决隐私计算所存在的数据难验证、交易难溯源、多方难互信、多方难协作等问题。联盟链使得隐私计算过程可验证、可溯源、可信任、易实现多方协作。业内专家普遍认为,联盟链将成为隐私计算产品的标配。
(3)匹配程度总结
在网络拓扑方面,两者都是分布式架构;在技术特性方面,隐私计算与联盟链技术并不冲突,而是相辅相成、相互补充。此外,隐私计算与区块链去中心化的特性,以及解决数据安全问题的终极目标相匹配,但双方的实践方式有所不同。隐私计算保证的是数据的隐私性,而联盟链保证的是数据的一致性和可验证性。
两项技术的配程主要表现在以下三个方面:
数据流动和保护的统一。区块链构建全网统一账本,通过交易实现信息流动。隐私计算则实现数据隐私保护,为数据价值流动提供技术支持。
分布式体系架构的统一。区块链是分布式体系架构,各方自治协作保障事务一致性。隐私计算同样是分布式体系架构,各参与方通过协同计算完成数据价值的共享。
生产力与生产关系的统一。区块链构建参与方之间一致、稳定的生产关系。隐私计算则构建数据要素价值流通的规模化生产的生产力。
2.应用价值分析
在隐私计算应用中引入区块链技术,可凭借其去中心化、不可篡改、不可伪造等特性,针对性地建立起隐私计算所需的信任桥梁,满足隐私计算过程透明监管的需求。
基于区块链技术,数据在计算、流通、使用、销毁等多个环节中,都可以做上链验证和保存,其记录可以结合相关管理手段对数据确权和定价做出有效参考;隐私计算的中间流通结果,可以通过智能合约进行验证,判断其有效性,防止计算过程中发生主观作恶行为,防范恶意节点的攻击;链上的记录公开、透明、不可篡改,可以满足数据溯源,为审计监管提供协助;签名算法的应用可以确保参与节点的真实可信。
在隐私计算无可信第三方参与的情况下,所有参与方可以在链上用智能合约来实现计算过程协调的相关功能需求,由参与方之间共同治理隐私计算过程,公开透明,权责对等,避免了中心化协调方参与带来的隐私泄漏的风险。
区块链技术和隐私计算技术的融合应用,能够很好满足未来大规模数据流通的安全、可信、可控需求,二者结合可共同构建一个算前、算中、算后的可信、可审计的数据要素流通系统。
计算前:可利用联盟链技术的防篡改性保证计算数据的真实性、一致性;
计算中:可利用隐私计算技术确保参与运算数据的隐私性,以及运算结果的准确性;
计算后:可利用联盟链不可篡改、不可伪造的凭证记录,实现监管机构对计算过程的审计、审查。
综上所述,隐私计算技术和区块链技术在数据合规共享应用这一场景下,很大程度上做到了能力互补。既能在数据共享过程中有效保护数据的隐私性,实现数据的安全流通,又能为数据的真实性、数据确权等合规问题提供帮助,实现全流程可记录、可验证、可追溯、可审计,解决了双方技术在单独使用时面临的难点问题,达到“1+1>2”的效果,为建设高效、安全的数据要素市场提供技术基础。
报告目录:
报告内容节选:
END
隐私计算头条周刊(7.24-7.30)
《数字中国发展报告(2021年)》:加快隐私计算技术应用,推动数据要素价值加快释放
附下载 | 2022年隐私计算技术与行业应用报告合集(33份)