精彩回顾 | 天翼电子商务区块链研究院技术总监徐潜作为嘉宾出席《2022数据要素安全流通论坛——联邦学习专场》并发表主题演讲!
4月29日,由《数据要素安全流通白皮书》编委会主办的《2022数据要素安全流通论坛——联邦学习专场》在线上举行。
本次论坛受邀出席嘉宾有华东江苏大数据交易中心总经理汤寒林、中国网安区块链与数据安全产品线总师白健、星云Clustar解决方案负责人章立强、天翼电子商务区块链研究院技术总监徐潜、富数科技政企总监崔如德。
《数据要素安全流通白皮书》编委会由华东江苏大数据交易中心、国家工业信息安全发展研究中心、国家金融科技测评中心三方共同组成。全程由国有数据代运营首倡者、领跑者数据宝ChinaDataPay协办。
精彩回顾
天翼电子商务区块链研究院技术总监徐潜作为嘉宾出席此次论坛,并围绕“隐私计算之联邦学习的探索与实践”主题进行分享。
01
数据要素市场化中的困境
什么是生产要素?生产要素是指进行社会生产经营活动时所需要的各种社会资源,是维系国民经济运行及市场主体生产经营过程中所必须具备的基本因素。生产要素的组成是个变化的概念,随着社会的发展而变化。十九届四中全会《关于构建更加完善的要素市场化配置体制机制的意见》中,首次将数据列为生产要素。
徐潜表示,当前数据要素市场化存在诸多困境,第一个困境是宏观环境趋严,数据隐私违规近年已成为数据行业高频暴雷点,各国、地区已加紧立法,对数据的采集、授权、转移、保存、使用等进行全面规范化,监管日趋严苛。我国2021年关于“数据安全”法律和政策密集出台,对数据要素市场进行合规规范的同时,也在要求数据要素的加速流动,如《数据安全法》、《个人信息保护法》、《全国一体化大数据中心协同创新体系算力枢纽实施方案》等。
第二个困境是孤岛问题严重,可以从两个角度来看,第一个角度是外因,主要表现为“三岛”问题,(1)数据资产孤岛:数据资产之间隔离、跨地域隔离、跨行业隔离,海量数据跨域难;(2)云服务孤岛:跨云之间的数据隔离,算力隔离,海量数据跨云难;(3)网络孤岛:内网、外网、专网、区域网之间互通难度大,安全隐患高。第二个角度是内因,主要来自于企业内部的文化、流程以及规章制度等要求,企业往往抱着谨慎、安全的原则,不敢共享数据要素,因“合规”问题,数据协作难。
数据价值的发挥在于数据融合,现有的数据融合模式存在数据协作方式低效,数据融合成本高、风险高,数据留存等诸多问题,伴随着《网络安全法》、《数据安全法》、《个人信息保护法》等法律法规及行业监管条例的相继出台,也使得传统数据融合模式无法持续。
第三个困境是各方需求不同,如(1)政府监管方,既要促进数据融台,又要立法保护数据,隐私缺乏有效监管手段,数据安全难以控制;(2)数据提供方,不敢也不能对外提供明文数据,盈利困难,无法获取额外数据对自身数据进行补充;(3)数据需求方,获取数据困难,还承担了违规风险,获取数据少、质量差导致业务停滞不前;(4)数据拥有者,部分场景个人隐私无法保障,数据私有权属被侵犯。
为解决数据隐私和融合的矛盾,徐潜表示,隐私计算是具备可行性的技术方案之一,不同于传统数据融合,隐私计算具有以下特点:(1)数据无泄露风险:计算前数据无需解密、转移、集中;(2)去中心化:针对可信环境而言,无需可信第三方参与,仅在各自环境中执行计算;(3)密文计算:动态保存加密状态下的数据可直接参与计算。
02
天翼数据融通平台
徐潜分享了天翼数据融通平台,该平台针对数据安全信任、数据跨域流通、数据隐私保护等痛点,依据“数据可用不可见”原则,构建安全隐私、高效通用、去中心化的数据流通合作基础设施,打破数据孤岛,促进数据安全融合,提升数据使用价值。该平台已实现三大类数据服务能力:(1)隐私查询(2)可信数据分析(隐私求交集、隐私求和、安全大小比较等)(3)多方数据协同建模(联邦学习),解决多方数据聚合业务模式下数据流通中的隐私违规问题。
天翼数据融通平台基于区块链+安全多方计算,对过程数据上链,保证计算全流程可追溯,使用智能合约进行计算任务调度、任务审批、贡献度统计,通过中立的代码统计确保各个参与方的利益。
天翼数据融通平台自主掌控与权威认证,是首批通过中国信通院联邦学习和区块链辅助隐私计算功能权威认证的产品,国企第一家具备多方安全计算可信执行环境、联邦学习、区块链辅助隐私计算中国信通院权威认证的自主可控产品。
此外,天翼数据融通平台已完成“密流计算平台”与微众银行“FATE”在MPC和联邦学习算法上的联通。
天翼数据融通平台具备“功能领先、自主研发、权威认证、区块链融合、兼容性强”的产品特性和优势。(1)功能领先:产品算法种类、性能、用户体验、国密支撑等处于优势地位。除常规机器学习联邦算法,已支持部分神经网络算法,并在算法性能上持续优化。(2)自主研发:全系统自主研发,具备自主掌控MPC&联邦学习&区块链全栈产品化能力,对外部厂商和开源系统无任何依赖。(3)权威认证:底层算法通过专家委员会评审审查,保障安全可靠,通过2020年中国信通院第一批联邦学习,第二批安全多方计算,区块链辅助隐私计算等权威评测,获得产品证书。(4)区块链融合:与电信区块链技术融合,在区块链上进行数据服务的存证,授权,计费等,确保计算全流程监管可审计。(5)兼容性强:实现密流平台与目前最大的开源项目(FATE)互联互通。
03
典型案例探索
徐潜分享了天翼数据融通平台在实际隐私计算应用中的典型案例,主要包括4个典型的应用案例。第一个应用案例是在电信集团内部的精准营销(5G PLUS会员营销)案例,天翼数科输出技术服务并提供部分用户特征数据;中国电信大数据和AI中心提供一定时间范围内购买5G PLUS用户的标签信息,天翼征信有限公司提供用户行为、兴趣等特征数据。训练完成后,中国电信大数据和AI中心可将新的时间范围内的用户购买行为输入给模型,查看评分在指定阈值的覆盖度,以此检验另一方(天翼电子商务有限公司和天翼征信有限公司)数据与购买行为的关联度。‘’电信5G PLUS权益用户推广系统‘’可面向包括运营商、金融机构、公共政务数据方等多类用户,不仅可以保证联合建模过程中各参与方私有数据的隐私安全,同时保证模型效果。
第二个应用案例是多方安全数据分析联合实验室,该案例由苏州人行牵头,参与方达30余家;项目主要为有效配合打击治理通信网络新型违法犯罪专项行动,按照”共建、共享、共用”模式,建设金融科技应用风险监控平台,实现跨机构、跨行业风险信息规范共享和系统互联互通,拉通区域金融机构风险数据共享,整体提升区域金融风险态势感知、综合性分析评估和差异化处置能力。能够实现“数据保密管理、黑灰名单共享、一人多卡、客户异议、精准阻诈和查询留痕”等多个业务模式。
第三个应用案例是银行&运营商联合反诈,场景设计为(1)运营商基于通信规则具备易感人群名单库,而银行具有实际受害人的名单库,这两部分群体存在重合;(2)通过安全求交,基于联邦学习使用电诈标签构建银行层面的电诈模型;(3)可以以银行现有行内反电诈的策略集为基础,增加运营商的易感人群名单,提高异常开卡的电诈识别率;(4)也可以双方基于受害者与易感者的交集,基于共有数据集合进行联邦学习,探索联合反诈模型;(5)引入时间维度,建立资金流、通信行为关联分析价值意义。
第四个应用案例是基于人社数据的就业关怀,项目背景是基于多方数据安全流通解决方案来实现地方人社数据与运营商数据安全合规融合,并实现进一步统计分析等目的。业务流程为(1)社保、人社局提供需要查询的身份证信息,调用人社环境下的MPC;(2)运营商各自部署一套同构MPC平台,通过碰撞求交的方式,查询出各自运营商所属的手机号信息;(3)在各自运营商内部,规则匹配出结果信息;(4)将结果信息,是否劳动力外流、是否就业等信息进行汇总,依据业务需求进行短信通知或社保记录等操作。
01 |
02 |精彩回顾 | 中国网安区块链与数据安全产品线总师白健作为嘉宾出席《2022数据要素安全流通论坛——联邦学习专场》并发表主题演讲! |
03 |精彩回顾 | 星云Clustar解决方案负责人章立强作为嘉宾出席《2022数据要素安全流通论坛—联邦学习专场》并发表主题演讲! |
04 |精彩回顾 | 锘崴科技解决方案总监孙国庆作为嘉宾出席《2022数据要素安全流通论坛—多方安全计算专场》并发表主题演讲! |