查看原文
其他

富数 in WAIC | 隐私计算赋能可信 AI,为数字化战略打下坚实安全底座

Fudata 富数科技 2022-07-02
2021年7月8日,世界人工智能大会在上海拉开序幕。7月8日下午,世界人工智能大会重要论坛——「构建 AI 产融新生态论坛」在世博中心成功举办。
 
国家互联网信息办公室副主任杨小伟、上海市委常委、市委宣传部部长周慧琳、中国工程院院士邬贺铨、美国艺术与科学院院士、清华大学讲席教授、智能产业研究院院长张亚勤、中国互联网投资基金管理有限公司董事长吴海、国家互联网应急中心党委副书记卢卫、亚信安全总裁陆光明等来自政府主管部门、研究机构和企业的多位重要代表出席了论坛。富数科技作为隐私计算代表企业出席了论坛演讲

图 / 富数科技 CEO 张伟奇在论坛演讲

富数科技 CEO 张伟奇以「隐私计算赋能可信 AI」主题,发表了 AI 面临的数据安全问题,介绍了隐私计算的技术发展和行业发展情况,以及如何用隐私计算技术帮助 AI 解决隐私保护和数据安全问题,受到全场高度关注,引起行业热议。
 
隐私计算让 AI 守住数据安全的底线
 
过去几年,人工智能作为硬核科技,在安防、金融、政务、医疗等领域发挥了巨大价值,但深究我们就会发现,目前在人工智能领域,无论是深度学习还是机器学习都离不开大数据样本的「喂养」,传统 AI 需要收集样本到一个本地化的平台,然后通过集中化的算力训练出优质的模型。
 
这会面临两大问题:首先,深度学习的训练样本是哪里来,训练样本又是如何流通的? 数据是否得到了授权?特别是个人轨迹、财产信息等,我们将如何保护个人隐私甚至国家的关键信息的数据安全?其次,AI 公司加工出来的模型,其知识产权又如何得到保护?

在数字经济趋势和数据安全保护的时代背景下,隐私计算应运而生,并且在 2020 年得到市场广泛认知。其本质上是利用密码学的手段,实现在数据不出库的情况下进行联合计算、联合建模,以开放且合规的方式充分发挥数据价值。


图 / 富数科技 CEO 张伟奇在论坛演讲

从数据拥有方的角度来看,因为数据并不会出库,数据的隐私保护问题自然迎刃而解;而从使用方的角度,他们实际上要的也不是数据本身,而是数据在某个这个特定场景下的评分,即模型的结果。
 
正是隐私计算技术实现数据「所有权」和「使用权」分离的特点,使得隐私计算被学术界、行业市场和监管等高度认可,目前来看也是数据要素安全互通的唯一解决方案
 
隐私计算需要不同技术融合使用
 
隐私计算技术的理论研究早在 1978 年就开始了,发展到现在已经比较成熟,因此理论的安全性上是可以自证清白的,我们现在所做的也不是发明隐私计算的理论,而是研究学习先进的密码学论文, 在结合算力和需求,在算法工程上进行优化和产品化。
 
随着隐私计算热度陡增,大家也听闻了纷繁复杂的技术名词,比如同态加密、差分隐私、不经意传输、混淆电路等等。隐私计算的技术具有碎片化的特点,并不存在使用某一种方法就能解决所有问题,而是要根据这些技术的优劣,针对具体的问题进行组合使用。

图 / 隐私计算行业技术理论错综复杂

不同的技术之间可以相互叠加,相互加强。比如联邦学习可以实现联合建模过程中,双方数据不出库的联合建模,保护数据样本,叠加TEE又可以在硬件层面保护模型的参数,而基于 MPC的联邦学习,又比基于半同态的联邦学习快一个数量级。
 
这也是富数科技一直以来的技术路线,即坚持全面而综合的技术自研
 
中国隐私计算行业发展速度超过欧美
 
Gartner 从 2019 年开始关注机密计算(Confidential Computation)、隐私增强计算(Privacy Reinforcement Computation)等相关领域,目前这个市场还处于 Gartner 曲线的上升期,行业正面临商业落地的突破期,如果可以实现商业层面的大规模应用落地,隐私计算技术才能真正发挥其价值。
 
在国际市场上,早前 Facebook 和 Google 受到欧盟 GDPR 高价罚款一事震动全球,两家企业开始大量投入了隐私计算以达到政策合规,而在中国,由于数据开放流通与隐私保护(数据安全)之间的矛盾日益激化,隐私计算在过去两年获得飞跃式的发展,无论是对技术的重视程度,还是政策法规的制定,目前都已超过美国。
 
在富数科技看来,国内隐私计算发展可以划分为三个阶段:

图 / 国内隐私计算行业发展三部曲

第一阶段重点是 2020 年,这是一个市场教育年,行业从 2019 年底的5家迅速发展到上百家,市场呈现百花齐放,同时也不免鱼龙混杂的局面,这给客户在选择真正的厂商造成困惑:隐私计算到底哪家强? 
 
第二阶段主要是 2021 年, 金标委和信通院制定了工程化安全和性能的检测规范,银行卡检测中心和信通院都各自完成了头部 5 家的检测,目前市场上全部通过工信部和金标委评测的一共 4 家,包括腾讯和阿里在内,富数也是其中一家;
 
第三阶段正在来临,虽然第二阶段标准把头部厂商挑选出来了,但同时也存在一个问题,即不同厂商之间技术是不能互通的, 每家厂商后面可能代表不同的数据源,难道要让某家银行为对接 10 个数据源而采购 10 家厂商的技术产品吗?长此以往我们将发现,行业会从解决「数据孤岛」问题变成解决「技术孤岛」问题。 

如果不实现这个互联互通,隐私计算不可能成为一个有生命力的行业。
 
因此,富数科技和行业头部机构一起,参考 Android 操作系统和 APP 的模式,创造性地提出了「统一资源协议」的思路,让不同技术厂商之间达成互联互通。我们乐观估计,明年年初互联互通规范将完成,不仅如此,未来在国际上制定相应的互通互通规范。 
 
富数让场景落地,加强隐私计算生态建设
 
论坛上,富数还展示了隐私计算如何帮助 AI 保护隐私,比如在金融和运营商领域利用多方安全计算的图计算,实现跨领域的反电信诈骗的案例。

现如今,中国乃至全球都在数字经济发展的拐点,目前数字化转型是上海的一号工程,文汇报在今年 4 月份的文章中直言不讳,目前面临的一个卡脖子问题就在于:数据权益、隐私保护和数据安全。

而隐私计算通过多方安全计算、联邦学习等技术,有望为中国数字化转型打造一个安全底座,在未来「东数西算」发展全国大数据中心一体化建设的背景下, 隐私计算也将发挥重大价值。
 
富数科技成立于 2016 年,是一家懂建模、懂金融、懂密码学的机构,2017 年进入隐私计算领域,以先发优势领跑行业,持续在标准制定、技术和商业落地三个方面构建护城河,未来公司将继续加大在研发、商业化和标准制定的投入, 让隐私计算技术成为 AI 发展的坚实安全底座。

- END -

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存