“未来,所有的计算都将是隐私计算。”
——“安全计算教母”宋晓冬
隐私计算对未来中国新兴科技产业发展到底有多重要?在回答这个问题之前,我们先来看看隐私计算在香港的落地案例。香港科技园具有一个以隐私计算技术为核心的“AI验证平台”,现在已经成为多个香港政府机关和企业正在使用的公共SaaS服务。基于该平台可以在确保数据隐私安全受保护的前提下进行AI能力的验证。在一些招投标场景或是AI大赛中,想要遴选出更优秀的AI,通常的做法是要求各AI提供方描述算法原理,或者视频展示,而无法量化地验证各AI提供方技术上的优劣。通过AI验证平台,建立数据使用黑箱机制,数据经授权使用,通过智能算法进行计算,既保护AI模型IP,同时保护招标方或大赛数据方提供的数据隐私安全,能够让AI提供方使用更贴近真实场景的数据而非传统删减式的脱敏数据,对模型进行训练和测试,真正做到公平公正且有效的AI能力验证。该平台由国内隐私计算企业“翼方健数”负责承建。翼方健数首席科学家张霖涛介绍到,在香港的一个招标案例中,AI验证平台把真实数据与参与投标供应商的算法模型同时在平台中进行验证,招标方和供应商都只能看到最终的验证结果,同时又不能盗取原始数据或算法模型。由于使用了隐私计算,招标方才能够直接提供真实数据,而不是有可能导致最终结果可能会因此出现误差的虚拟或脱敏数据进行模型验证;而AI供应商也在隐私计算的支撑下,无所保留地拿出了自己的AI模型进行投标。
在诸如翼方健数的隐私计算企业的支持下,越来越多的场景突破了原本的瓶颈,据了解,上述模式是翼方健数众多场景中的一个突破。数据一旦开始有机会通过隐私计算技术实现流动共享,无需分享原始数据就能释放数据的价值,就能实现数据持有方、数据需求方和数据服务方的多方共赢,推动行业和大数据领域的发展。
SaaS服务的数据安全“考核”
数据是数字经济时代的核心生产要素,也是社会发展新的生产资料,数据的应用伴随数字化工具以云的方式降临在个人、组织中。企业早已通过引入各类SaaS产品、AI服务结合包含自身在内的多源数据进行数智化赋能和优化。例如电商平台基于历史交易数据加以AI能力可以进行销量预测;消费品企业通过自身沉淀的第一方用户行为数据以及第三方数据实现营销自动化提升复购率等。随着人工智能的发展,专业化的智能SaaS服务也迅速成长起来。对于这些SaaS服务商而言,客户往往有数据隐私安全方面的顾虑。“SaaS服务商是否有足够的能力保护客户及自身的数据资产安全?”过去一段时间,层出不穷的服务型企业数据泄漏事件甚至通过非法销售个人数据获利等事件,证明了这样的担心并非杞人忧天。我们先来看什么是传统意义上的“计算安全”,一般包含了网络安全、数据安全和计算安全。网络安全是大家熟悉的防火墙、安全传输协议等,确保数据传输环节安全。在具体的数据安全部分可以通过加密文件系统,或进行访问控制。计算安全,例如进程之间的隔离,使用虚拟化或容器化方式实现。但是这些方法并不能够解决数据共享和隐私的问题。例如如何在相互不信任的多个计算环境中保证数据安全,授权,完整性,溯源和数据血缘等,保证数据可获得,这是传统技术无法解决的。翼方健数面对这样的挑战,打造了全流程的系统安全保障,翼方健数自研的XFS(XDP File System)文件管理系统,从底层设计开始,提供跨机构,多管理域的安全存储架构。在XFS中,数据全程加密,密钥由数据所有者而不是系统管理员拥有,对使用场景授权,而不是对使用人员授权,从而保证数据在计算过程中的完整性,保证可溯源。其通过了来自园区千余家企业的数据安全和运行效率考核。
SaaS服务的自循环智能进化,还欠一个安全有效的方法
数据指导业务这件事,早在ERP盛行的信息化时代就已经开始萌芽。而随着数字化进程的加速,SaaS、AI产业的不断发展完善,企业在从粗放转向精细化运营时,更加剧了对数据价值的挖掘。从效率的角度来看,目前企业在数字化系统建设时,优先考虑的是遴选市场中的成熟产品或解决方案,其次才是自建。这也是国内SaaS厂商与AI产业近几年加速发展的原因。但问题也随之而来——AI升级,势必需要投入大量并且高质量的数据供机器学习。那么,SaaS公司可以使用客户的数据对产品进行AI能力的迭代升级吗?尽管第三方SaaS、AI或其他厂商大多会与企业明确数据权属,但持有数据的企业依然不免担忧数据安全等相关问题,毕竟这些数据要在厂商的系统里运行,或者直接从系统里产生。尤其是在高新技术、生物医疗、政企合作等对数据安全性有更高要求的领域,服务于这些企业的AI需要数据进行升级,只有以数据为中心,以数据驱动的AI才能构建成功的AI系统实现生产力提升。若是服务商将模型给到客户,在客户的环境进行训练,或许能打消客户对数据资产受到威胁的顾虑。但这又带来了新的问题——服务商同样担忧自己的算法泄露乃至逆向分析。随着隐私计算技术的成熟,问题逐步有了转机。隐私计算就是在保护数据安全的前提下,实现对数据的分析计算,达到对数据“可用不可见”的一种技术。更广义一点讲,隐私计算就是能让相互不完全信任的实体之间进行数据和算法协作的一系列技术手段。在这个场景来说,隐私计算就像是一个能够让数据和算法在其中正常运转的“黑盒子”。而前文提到的SaaS产业。国内SaaS产业之所以能够快速发展,或多或少与数据的“越权使用”有关。像智能客服或语音外呼等系统,这类SaaS产品中的数据,所有权无疑都属于企业客户,SaaS产品本身不应该产生或未经授权使用企业相关的销售线索、会员信息或者公司员工信息等数据。
一个显而易见的情况是,SaaS服务商需要依靠这些数据来进行产品优化或模型训练等相关工作,用来进一步提升自身的产品竞争力、指导自身的业务决策。近年来随着法律法规的完善,对通过数据获利(例如兜售数据)实行了更为严厉的查处,其发生频次也大幅降低。尽管SaaS厂商会与客户企业明确数据使用边界,但过程中依然不免存在数据安全方面的隐患。这一问题在软件本地化部署的信息化时代并不明显,但随着云计算SaaS模式的流行,问题与矛盾越发突出。拿当下最火爆的私域流量运营举例,企业用户希望把自己客户的社会属性、商业行为行为数据加以利用,来提升经营效果,而这个数据分散在企业若干的SaaS(或非SaaS)的业务系统中,数据应用的问题随之而来。数据治理问题:数据的治理由谁来做?客户自己还是SaaS厂商?数据的归口和标准由谁来制定?
数据权属问题:企业想要达到目的,必须要更高效、更合理的应用数据,但数据的应用需要SaaS业务系统的支持,这个数据应不应该开放给SaaS厂商?
数据应用条件:根据不同业务、产品特征,SaaS厂商的业务模型需要快速迭代来适配企业需求,迭代方向需要数据的指引,但这个数据是企业所有,SaaS厂商要提供更先进的业务支持,该如何与企业达成数据应用的条件?数据在SaaS厂商和企业之间该如何传递?
数据应用方式:SaaS厂商与企业之间的数据关系从管理到应用,要做哪些合法、合规的准备?用什么技术或方案?
这些痛点,已经是横亘在SaaS厂商与企业之间含糊而暧昧的裂痕。而隐私计算成了弥合SaaS产业中数据持有方和数据使用方两端需求的最佳方案。通过隐私计算,SaaS厂商可以在不碰数据的情况下,利用数据进行相关的计算处理,在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。隐私计算可以把数据的所有权和使用权分开,通过黑盒机制,令企业只与SaaS厂商共享数据的使用权,SaaS厂商无法明文查看,但却可以使用数据产出计算结果,为企业制定更灵活的流量运营策略;改进更符合企业业务特征的SaaS产品。虽然当下,数据安全的信任为题仍具有一定的争议。但可以预见的是,即使数据安全问题依旧是一把“达摩克里斯之剑”,也无法阻止SaaS与AI产业势如破竹的发展,隐私计算技术所能带来安全性、高效率、低成本等巨大价值,值得成为未来数字化厂商们重点关注方向。
网络化是必然趋势,隐私计算能否为AI、SaaS带来颠覆性变革
除了现有企业数据能够被安全可控地使用起来,隐私计算是否能够帮助SaaS和AI产业汇聚大量且高质的数据呢?答案是肯定的。隐私计算通过“数据可用不可见”的能力,在保护数据隐私安全的前提下,汇聚并实现数据共享使用,从而更好地发挥出数据在人工智能领域发展过程中的支撑性作用。通过构建数据网络,帮助数据在可管控、可度量且受隐私安全保护的前提下为SaaS和AI产业的发展提供数据上的助力。
不仅仅来自于产业对数据的诉求,张霖涛表示,数据价值的需求方希望尝试不同算法在数据上抽取模型或获得预测结果;需要利用多种计算资源降低成本,提高生产力;厂商需要将从数据中得到的洞察提供给更多的应用,服务更多客户;由于对数据及算法合作方的不信任,对原始数据和客户隐私的保护诉求,合作开展需要更多约束和条件。数据利用的难度与价值都在同步地提升,将被迫持续引入第三方乃至多方。在与日俱增的需求和要求的推进下,IT架构愈加复杂化,网络化也是必然趋势,新的局面将催生“数据和计算互联网”,翼方健数始终致力于成为数据和计算互联网的先行者和运营商。在这个庞大、复杂的网络结构里,SaaS产业和人工智能,无疑是数据价值流通的直接受益方。不只是SaaS和AI产业,在垂直领域中,我们也看到了行业对隐私计算能力的认可。去年11月,由翼方健数召开的首届DataX大会上,在其圆桌论坛部分,共计来自医疗、科学、生物信息、云计算、营销、国企、高校等不同领域的专家都认为,在未来10年隐私计算100%在其所在行业会被采用,并且未来10年里,全世界的计算里有百分之多少会采用安全计算形式。其回答的平均值高达82%。行业甲方的认可,势必也会影响到乙方的技术选型和合作。对此,张霖涛回应到,事实上我们正在与一些SaaS和AI服务商进行相关合作,并且获得了来自客户的甲方对此的肯定和赞许。自2020年以来,由于隐私计算在数据安全等方面的重要作用,使得隐私计算在如今数字化逐步迈入深水区的过程中开始越发受到重视,而这正是翼方健数等隐私计算企业快速增长的原因。据悉,翼方健数2021年的各项业绩相比2020年均实现强势增长,包括营收增长7倍,客户数量增长3倍,员工人数也实现翻番。随着IoDC在全球各地部署,数据和计算互联网的雏形已经初步形成。翼方健数的爆发,其实正是隐私计算行业正在繁荣的一个缩影。据KPMG的预测,我国隐私计算系统的销售和服务收入规模在3年之内有望触达100~200亿的市场空间。拉动隐私计算行业增长的,是来自亟需被唤醒的AI的心声;其背后支撑着的,是将在3年内产生超过全球1/4数据量的数字浪潮。“在深度解锁数据价值的过程中,隐私计算必不可少。面对未来爆发式增长的需求,我们认为,未来所有的计算都是隐私安全的计算。作为数据和计算互联网的运营商和推动者,翼方健数将与各行业一起,推进数据的安全流通,帮助各行各业早日达成人工智能的“数据自由”。”张霖涛说。