隐私计算专家问答,涉及数据跨境、ChatGPT、医疗与政府数据的互联互通
从商业化落地角度来看,确实有一些客户构建了自己的互联互通平台,它可能是一个数据应用方,和它所提供数据的机构使用不同的隐私计算平台。这时,需要建立互联互通的底座,包括去做互联互通实质性的交互开发,这已成为现在商业化的常态。
广义的可信执行环境就是大的信创范畴,包含数据库、服务器、各种各样的服务器操作系统等等来达到可信。狭义的可信执行环境,比如英特尔的SGX,是真正的可信执行环境。TEE是一种单独的技术,是在计算平台上以软硬件方法构建的一个安全区域,保证在安全区域内加载的代码和数据在机密性和完整性方面得到保护。
目前,对于这类纯粹的公共数据开放,障碍是最小的。比如说一些环保的信息、治理的信息、统计类信息或者群体类信息开放,几乎没有什么障碍。阻力比较大的是涉及主体信息的数据开放,不管是以个人为主体还是以企业为主体,这类数据往往价值更大、更直观,从风险角度来说也是挑战最大的。所以也导致了各地方政府对于这类数据开放的程度、颗粒化细化程度和开放时间的步调会形成比较大的差异。
随着隐私计算技术的推广和被信任,“数据二十条”等政策的发布,越来越多的行业标准和测评认证机构给予隐私计算技术以肯定,隐私计算势必会逐步改善这件事情,但是从进展来说政府数据开放的进度仍远远落后于商业化数据开放的进度。
隐私计算还有两大问题也不能忽视,第一个是效率,隐私计算数据处理效率问题亟待解决。另外一个问题是隐私计算需要配套机制。此外还包括大众对隐私计算的认知,新技术要想完全推广应用不是特别容易的事情,特别是这类非常前沿、有挑战性的技术。
目前很多企业实行报备机制,比如报备哪些数据要离境,数据要用于什么目的等等。从监管的视角来看,企业是不是如自己所宣称、报备的那样,输出数据和报回数据内容是一致的,这实际上是一个监管问题。应用隐私计算技术,并给出一些方案和探索实践,主要是从监管这个角度来说。在数据可用不可见的情况之下,去验证这些企业所宣称的与实际的行动结果是否一致,是否符合国家政策法规的要求,仍需要隐私计算厂商继续去做探索和实践。
刘新海:通过研究全球征信,我发现其实在没有隐私计算之前,数据跨境早就实现了,比如欧美之间的通商数据早就跨境了,人都可以流动、数据自然也跟着动了。具体的例子像欧盟一体化,它的征信数据是可以跨境流动的,他们当时是在机制的设计下就搞成了,那是十年前的事,当时还没有隐私计算。
现在有了隐私计算技术,我觉得会更好。目前粤港澳大湾区数据、征信为什么推不动,最重要的问题是没有一个非常强有力的“领导”,当然监管也需要有人来推动。另外隐私计算技术在国内要想大量应用,需要一步一步地推广,一步一步地解决跨境问题、征信问题、AI问题以及数据孤岛的问题。
隐私计算技术所谓的流派之争,并不是在商业化实践层面,更多是在学术层面有争议。商业化实践的层面更多围绕行业的一个领域、客户的具体需求给出最优解决方案,这个方案包括技术本身,也包括它的商业性价比,这其实才是真正推动一项技术快速迭代和产生大规模应用的出发点。
我们当然希望有理想化的技术可以解决全部的问题,理论上来说,密码学、同态加密等这些技术的组合可以解决绝大部分技术场景的问题,但是因为计算复杂度、性能、网络带宽消耗等问题,导致在商业化的过程中遇到了各式各样的问题,无法真正取得大量商业案例的落地,这才有了大家去研发新的、更轻量化的技术体系。
从我的角度来看,通用型技术就是一套融合引擎。刚才谈到ChatGPT,它并不是一个技术而是一类技术,仅仅靠着一类技术仍然不能够去开发出超级人工智能模型,还需要喂进去大量的数据,这正好补充了一点,对数据跨境,摆在面前最实际的问题就是ChatGPT需要数据喂它的时候,如果你用的是境外的ChatGPT,可能数据就已经出境了。
前几天有很多国家,包括国内的一些机构,在讨论要不要断掉ChatGPT现阶段的使用或者限制,说明一项技术即使通用也可能产生很多意想不到的负面东西,所以需要综合更多的技术,或者更多的方案才能变成让各方都满意的解决方案。在我看来,ChatGPT在不远的将来也会引入隐私计算等技术,堵上当前数据泄露或者隐私泄露的“坑”。
吴凡:通用取决于从哪个角度去看,对于厂商和供应方来讲,我认为是不可能通用的。目前隐私计算的技术框架有3种,即依赖硬件的可信执行环境,依赖密码学的MPC及同态加密,依赖人工智能的联邦学习,这些技术路径不可能通用。
但是从用户的角度讲,最终肯定是通用的,因为用户最终只看到一个结果——是不是计算效率够高、是不是算力很少、是不是能达到精确的计算结果。这是整个行业努力的一个方向,即用各种各样不通用的技术方式,最终达到给用户通用的结果和感受。
姚明:集中精力做好一件事,那就是不断地去打磨从底层技术研发到服务客户的完整体系,给客户简单、易用、好用的产品服务体系。
刘新海:ChatGPT的巨大成功逼出来一个大招,类似的模式是不是能用到隐私计算中,比如产学研的整合。拿征信来说,央行征信中心每年有大量的经费,这些是否可以投入到大规模的应用上,用最顶尖的人才,年轻人挂帅,把这种研发的机制学过来,对隐私计算将来的突破,以及真正实现新型基础设施建设,是非常重要的。
来源:零壹财经,作者:楚济慈,版权归属原作者,分享仅供学习参考,如有不当,请联系我们处理。
END
往期推荐01案例分享 | 光大证券数据安全治理体系建设与实践02AI遭“围剿”!欧洲、中国之后,美国出手对ChatGPT 进行监管!03《数据安全产品与服务观察报告》发布,数据防泄漏领域迎来新机会!