精彩回顾 | 富数科技政企总监崔如德作为嘉宾出席《2022数据要素安全流通论坛——联邦学习专场》并发表主题演讲!
4月29日,由《数据要素安全流通白皮书》编委会主办的《2022数据要素安全流通论坛——联邦学习专场》在线上举行。
本次论坛受邀出席嘉宾有华东江苏大数据交易中心总经理汤寒林、中国网安区块链与数据安全产品线总师白健、星云Clustar解决方案负责人章立强、天翼电子商务区块链研究院技术总监徐潜、富数科技政企总监崔如德。
《数据要素安全流通白皮书》编委会由华东江苏大数据交易中心、国家工业信息安全发展研究中心、国家金融科技测评中心三方共同组成。全程由国有数据代运营首倡者、领跑者数据宝ChinaDataPay协办。
精彩回顾
富数科技政企总监崔如德作为嘉宾出席此次论坛,并围绕“数据要素流通之联邦学习范式探析”主题进行分享。
01
数据要素流通迎新范式
崔如德表示,如果数据要想作为要素流通需要解决两个大问题:(1)个人信息隐私保护(2)市场价格稳定保障。如果个人信息隐私保护问题不能得到有效解决,那么它更可能变成一个社会的灾难,如电信欺诈、广告骚扰等。从市场持续性讲,要保障市场价格稳定,如果市场价格机制混乱,那么数据要素的流通就缺乏长久的势能。
崔如德分享了数据要素流通的常见范式,(1)上传-下载:下载复制数据(2)API:接口调用数据,这2种范式很难去解决上述数据要素流通需要解决的两大问题。而(3)联邦学习:算法模型取得结果而非原始数据,这种范式同国家层面对数据的要求是非常吻合的,如规定用途、用量、最小必要和授权同意原则。通过对这三种范式进行对比,发现文件、API等数据要素是数据明文转移,是数据复制、明文转移和原始数据转移,存在大量问题,如个人信息隐私保护。而基于联邦学习的数据要素流通是知识交付,是数据可用不可见、基于场景交付和保护原始数据,契合规定用途、用量、最小必要和授权同意原则。
崔如德还尝试对联邦学习方式进行剖析,认为基于联邦学习实现数据要素流通有三个要素来组成,缺一不可。第一个要素为算力,第二个要素为数据,第三个要素为模型。
基于上述理解,崔如德表示,富数科技设计了一套联邦学习范式数据流通平台基础架构。
02
主要模式
崔如德结合实践经验,总结了基于联邦学习范式的主要数据流通模式,包括点对点合作、多方合作、生态平台和数据跨境。
点对点合作模式中,针对银行拥有用户的资金交易关系网,运营商拥有用户的通话社交关系网,两个关系网因为数据存在两大企业无法融合互补。富数的多方安全图计算方案,解决银行侧和运营商侧通过图计算技术,对双方关系图进行灰度染色,助力小微企业贷的团伙反欺诈。富数首创的“多方安全图计算”中,实现(1)确保各方原始数据不出域;(2)融合银行内部数据与政府、电信等外部数据源,打破现有数据壁垒;(3)准确识别企业集群背后复杂关系链条和欺诈风险;(4)构建安全、高效的风控平台,提升银行整体风控水平。
多方合作模式中,崔如德表示,随着数据合作的拓展,场景往往需要多个机构数据支撑,或者某个数据有多个数据应用方,因此需要实现跨平台互联互通、资源互联、算法互联和跨平台可信存证等。
生态平台模式中,利用联邦学习“构建安全桥梁,释放数据价值”,打造数字要素价值流通的底座。崔如德表示,最近特别热的领域就是数据交易所,数据交易所的模式很好解决了数据的一些问题,比如上海数据交易所提的“交易交付分离”概念,在这种交付层面,是数据和数据打交道,是数权思维,可以借助联邦学习解决流通问题,而通过交易平台解决资金清算问题。所以数据交易所这种模式,相当于有两套平台,一套是交易管理平台,一套是联邦学习数据交付平台,这两个平台是衔接的。
数据跨境模式中,在美国力推CBPRs体系,欧盟主导GDPR的世界跨境数据流通格局下,在美欧安全港框架、隐私盾被废后,隐私计算或将成为中国方案。崔如德表示,数据跨境是一个非常复杂的问题,涉及的不单单是个人隐私保护问题,还涉及国家信息安全问题,以联邦学习为代表的隐私计算技术有可能在数据跨境上做出更多的贡献。
03
问题挑战
数据要素流通是个系统性工程,不单单需要联邦学习厂商,更需要多方参与,共建数据要素生态系统。崔如德将数据要素流通面临的问题挑战分为三大类别:数据共治、数据合规、数据监管。
崔如德表示,数据治理已经是一个老生常谈的问题,但在数据要素流通模式下的数据治理是一个新的课题,很少看到相关的研究,数据要素流通模式下的数据治理和数字化转型的数据治理不同,数据要素流通模式下的数据治理是将数据变成资产而不是资源。
在数据合规层面,尽管出台了很多数据相关的法律法规,但对数据的理解仍然是传统数据的范式,缺乏对人工智能等新型技术下数据合规面临的新课题,对联邦学习模式下的合规研究依然苍白乏力。
在数据监管层面,新范式、新模式下的数据要素流通,需要新的监管措施,因为数据流通的形式、形态变了,不能用传统的监管模式。并且当前审计不同于以前,还需要对应用场景、算法模型等是不是合规进行审计。
01 |
02 |
03 |
04 |