2022 IDEA大会|数智新基建:数据流通和隐私保护
IDEA 2022大会第二日上午,IDEA研究院AI安全普惠系统研究中心讲席科学家王嘉平、清华大学社科学院经济所副所长戎珂教授、深圳数据交易所总经理宋家骅、IDEA研究院AI安全普惠系统研究中心首席科学家蓝晏翔,以“数智新基建:数据流通和隐私保护”为主题展开圆桌对话,从产业实践、技术路线、顶层设计等多个角度深入探讨下一代数字经济基础设施将如何发展。
2022 IDEA大会「数智新基建」圆桌现场
随着互联网的大规模普及,计算已经无处不在,计算成为像水、电一样的基础设施,渗透到生活的方方面面。十九届四中全会以来,“数据”正式被认定为一种新的生产要素加入到经济生活中。在这种形势下,“数据”在计算基础设施上的流通成为了人们非常关注的问题。
除了要基于大规模数据计算出更好的结果外,计算是如何发生的、数据作为计算的原料应该如何流转等,这些计算的过程将是下一代数字经济基础设施要着重关注的问题。
IDEA 2022大会第二日上午,IDEA研究院AI安全普惠系统研究中心讲席科学家王嘉平、清华大学社科学院经济所副所长戎珂教授、深圳数据交易所总经理宋家骅、IDEA研究院AI安全普惠系统研究中心首席科学家蓝晏翔,以“数智新基建:数据流通和隐私保护”为主题展开圆桌对话,从产业实践、技术路线、顶层设计等多个角度深入探讨下一代数字经济基础设施将如何发展。
数字经济成高质量发展“新引擎”
新一代基础设施呼之欲出
数字经济作为高质量发展的新引擎之一,要有与之配套的新一代基础设施。
蓝晏翔博士认为,“每次技术革命都将给基础设施带来重大的变化,蒸汽革命以铁路为基础设施代表,铺到世界各地;信息革命则让互联网成为水电煤一样的存在。 数据作为第四次科技革命浪潮的 ‘石油’ 和数字经济时代的重要生产要素,也需要有新的基础设施与之适应。”
区别于传统生产要素,数据具有可复制性、非排他性、时效性等特点,这决定了数字经济的基础设施从根本上有别于传统经济。
“在数字经济发展过程中,未来的数据基础设施的概念和以往传统只做基建和服务器的概念不一样,数据交易所作为平台也是一项非常重要的基础设施。” 宋家骅表示,“数据交易所不只是大家以为的‘单纯给市场交易的买卖双方提供交易平台’,而是作为平台赋能数据流通全过程中的参与各方,让存储的数据在关键基础设施里发挥更大的价值,进一步释放数据要素价值。这才是我们建设数字基础设施的目的所在。”
数智新基建机遇与挑战并存
数据有效流通成数据价值释放关键
随着数字经济的深入发展,数智新基建既要把握机遇,也要直面挑战。近年来陆续出台的《数据安全法》、《个人信息保护法》等法律法规,使得企业在数据利用和交易方面不仅面临政策和制度上的挑战,对技术也提出了新的要求。
“数据要素市场目前还处于初级阶段,在实践中,不仅面临数据要素市场如何快速发展、如何培育市场主体等问题,也存在‘企业不敢交易、不愿交易甚至不能交易’等市场顾虑。解决交易流通,不仅要靠制度上的顶层设计,还要通过技术来解决数据的安全与合规问题。” 宋家骅结合深圳数据交易所过去一年多的实际工作,从数据交易的实操层面分享了自己的看法。
2022 IDEA大会「数智新基建」嘉宾对谈
王嘉平博士认为,“数智新基建所面临的挑战,不仅仅是在交易的实操层面或者交易所的架构层面。从更广泛的社会面来看,越发重视隐私保护的大众以及拥有数据资产的企业,都在期待一种合理、合规的数据安全使用方案。数据的流通特别是不同主体间数据的有效流通,是下一代数字经济基础设施必须解决的问题。”
“只有确认了数据是属于谁的,数据才能有效流通。数据交易后进入到数据分析、生成产品等后续阶段,此时最大的问题还是安全。” 戎珂教授在强调“数据确权与数据安全对数据有效流通的重要性”的同时,就“如何进一步释放数据价值”提出了具有参考意义的方案,“第一个环节数据源要做‘广’,鼓励所有的数据生成,并完成数据确权后的数据流动;第二个环节数据交易所要做‘大’;第三个环节数据产品分析要做‘深’,深入到行业里去,才能真正释放数据价值。”
戎珂教授精彩分享
发展与安全可以兼得
隐私计算助力数据安全流通
数字经济的未来要发展与安全并举。如宋家骅所言: “数字经济的未来一定是两条腿走路,发展与安全缺一不可。”
“数据进入资产表就变成了企业的资产,在交易过程中首先要保证企业数据不会通过一次或几次的交易造成流失。保证交易的同时保证企业数据资产安全,就需要至少让这个数据‘可用不可见’,更进一步可能叫做‘可控可计量’,在资产维度解决企业发展的后顾之忧。” 蓝晏翔博士表示,“IDEA研究院正在通过隐私计算技术,为整个数据基础设施的建立做出一点小小的努力。”
“不论是从理论还是实践角度来看,技术都将在这一轮的数据交易工作中发挥非常关键的作用。隐私计算等技术已经深度应用到深圳数据交易所诸多数据交易产品的研发当中。”宋家骅还就此展开分享了一个实际案例,“我们(深圳数据交易所)通过企业数据合规服务工作站引进了一些数据技术企业,通过隐私计算技术形成数据产品,屏蔽原始数据中个人隐私等敏感信息,现已形成商业化产品,需求方、数据应用方、数据源等多方都因此受益。在这个过程中,技术起到了非常关键的作用,让一些原来涉及到敏感信息无法使用的高价值数据活了起来,这些原来沉睡着的数据现在变成了一个有商业价值的数据产品,大幅提高了企业数据可用价值范围。这只是第一步,未来还有一系列相关数据产品可以开发。”
隐私计算互联互通
激活数据要素流通生态
当前不同隐私计算厂商的技术路线“百花齐放”,联邦学习、多方安全计算、可信执行环境三种主流技术路线各有优劣。百花齐放的时代如何继续往前推进?
圆桌嘉宾一致认为,“隐私计算互联互通,将极大激活数据要素流通生态。”
“尤其是在技术上更多的互联互通,更多技术标准能够尽快建立起来。作为数据交易所,希望引进更多的应用场景,有更多的需求才有更多的技术迸发,有更多科技人才进入到这个领域,才能研发出更好的技术。”宋家骅还表示,“我们也正在和IDEA研究院AI安全普惠系统研究中心合作,尝试把隐私计算不同技术路径的互联互通往前推进一点点,让不同的技术路径都能在数据交易市场里往前走。”
“多条技术路线要共同发展,互相结合。软硬件结合起来也是一种方案,比如可信执行环境结合联邦学习。”蓝晏翔博士分享了团队近期的成果,“目前IDEA研究院自主研发的新一代机密计算协处理器SPU(Secure Processing Unit)结合联邦学习,在实现‘数据不动模型动’的同时,还实现了高性能、大吞吐量的运算。
新一代机密计算协处理器SPU
不仅如此,在可信执行环境的加持下,大家互相看不见,我既看不见你的数据,你也看不见我的模型,真正实现了数据与模型双重可用不可见,兼顾数据方和模型方的利益,这对于合作生态的发展与壮大是非常有意义的事情。”
SPU结合联邦学习大幅提效
戎珂教授表示, "技术到位之后,培育生态、建立生态信任才是真正要做的事情。比如,以后能不能做到只要做隐私计算我就用SPU,生态信任不仅需要约定俗成的东西,也就是标准,也需要时间。”
“的确,数据安全流通有赖于隐私计算技术的发展与各项标准的完善,建设有序的数据要素流通体系与良性生态体系,也需要团结更多力量、做更多更好的技术往前推广。” 王嘉平博士表示,“IDEA研究院将与数据提供商、数据需求方、技术提供方、监管方等参与者们一起推动自由高效的数据流通生态的建设。”
IDEA大会由IDEA研究院创院理事长、美国国家工程院外籍院士、前微软公司全球执行副总裁沈向洋发起,致力在粤港澳大湾区搭建一个分享人工智能技术和凝聚数字产业力量的国际化交流平台,发布年度科技趋势与创新产品,将前沿对话落实到数字经济时代的实践中。