查看原文
其他

隐私计算:数据洁净室的优点和缺点

Phoebe Spanier 开放隐私计算 2024-01-09




对于那些有大量数据需要处理,甚至数据驱动型的公司来说,数据洁净室(Data clean rooms )这个概念肯定不陌生,它作为隐私计算技术之一,正在被越来越多的公司所接受并使用。
通过数据洁净室,企业在与其他组织共享自己私有数据的公司(例如外包合作伙伴和研究机构)时,可以确保自己的数据在协作过程中不会暴露。
同时,和其他的隐私计算技术一样,数据洁净室同样可以帮助公司在共享数据的时候遵守隐私法规,允许公司与第三方共享数据,而无需实际共享基础信息。
但每一项技术都有优缺点,数据洁净室也一样,接下来我们将一起探讨它有哪些优势,同时又有哪些缺点?

数据洁净室的优点

数据洁净室最大的好处在于处理数据隐私和数据治理等关键问题,具体包括:

能遵守大部分隐私规范

数据洁净室可帮助企业遵守基本隐私法规,例如《通用数据保护条例》(GDPR) 和《加州消费者隐私法案》(CCPA) 中规定的法规。对于广告领域的公司来说,数据清洁室是一种隐私友好的解决方案,用于分析受众、定位广告和衡量效果,提供了一种通过使用即将过时的第三方 cookie 从共享数据中获得信息的方法。

数据所有者拥有控制权

数据洁净室通过匿名共享数据来促进协作。即使将用户级数据添加到数据清理室,也不会向其他方公开;从这个意义上说,所有者不会放弃对其数据的控制权。例如,数据清理室可以帮助银行解决地址过时的遗留问题,银行可以通过邮政公司可以匹配其客户地址,以便银行可以更新其邮件列表,而无需向邮政公司披露其客户数据。

多功能且性能相对优秀

在数据洁净室中,可以使用流行的编程语言(如 Python 和 SQL)分析数据。数据洁净室支持包括机器学习在内的高级分析,并且通常提供快速的结果。对于广告商来说,一些数据洁净室提供了跨各种分销渠道的广告活动效果的整体视图。例如,对于媒体活动,数据洁净室可以提供各种分析:消费者旅程、受众重叠、覆盖和频率,以及使用 AI 和机器学习的组合建模和场景规划。
简而言之,数据洁净室一方面通过保护隐私和确定治理来解决数据团队和隐私团队的关键痛点,另一方面允许快速分析。

数据洁净室的缺点

虽然数据洁净室已经算是相对成熟的隐私计算技术,且目前受到数据科学家和安全专业人员的欢迎,但它依然有很多缺点和挑战。常见的挑战包括:

数据输出结果不太准确

数据洁净室在其报告中使用汇总数据,这不如基于 ID 的数据准确。在数据洁净室中应用匿名化以保护隐私的方法最终会降低存储和分析数据的粒度,导致见解不太准确。例如,匿名数据不再支持有针对性的优惠,因此运算结果无法与个人相关联。在某些情况下,隐私保护技术也会扰乱数据点之间的关系。失去的关系阻碍了人工智能或数据科学活动。在将数据上传到数据洁净室之前,必须将其统一为一种格式以供使用。
在协作过程中,匹配率至关重要,即一个数据集中可以与另一个数据集中的个体成功匹配的百分比。低于标准的匹配率(低至 39%)降低了广告空间中数据洁净室的价值。还值得注意的是,目前,数据洁净室中使用的数据规模相对较小,有时公司必须通过建模来弥补数据规模小的不足。

数据之间无法互相操作

许多数据洁净室是围墙花园,仅适用于特定平台(例如,Google或Facebook)。这意味着广告商被迫手动合并来自不同数据洁净室的结果。此外,数据洁净室足够新,尚未采用通用标准来实现。这意味着平台和广告商可能会尝试汇集以多种格式存在的数据,而聚合这些不同格式的准备工作可能非常耗时。

各方对共享数据犹豫不决

为了产生见解,广告商必须交出他们宝贵的第一方数据。在最坏的情况下,数据泄露可能会导致巨额罚款,更不用说声誉和客户损失了。
共享客户数据的意愿各不相同:一家公司可能愿意将所有客户数据添加到数据洁净室中,而另一家公司可能只添加一半。各方越不愿意共享他们的数据,数据洁净室在为客户提供的功能方面就越差。

隐私风险仍然存在

一些数据清理室是手动管理的,使它们容易受到人为错误的影响,例如向不应该拥有它的人授予访问权限、错误地制定查询以及在不安全的环境中交换数据。更一般地说,即使在数据洁净室中采用的各种隐私保护技术,仍然存在数据泄露或泄漏的风险。

未来企业会如何选择?

对于数据驱动型企业来说,数据洁净室具有一定的优势,可以遵守隐私法规和限制,能够在不与其他方透露第一方数据的情况下协作处理数据,以及一系列数据分析可能性。然而,它们也有缺点,包括数据输出不太准确,要求各方以他们可能不愿意的方式共享数据和持续的隐私风险。
根据 Gartner 的说法,“到 2026 年,80% 追求完美隐私保护的组织将放弃它,因为它不遵守数据隐私法规,依赖过时的数据收集方法并抹杀客户信任”。考虑到这一观点,具有前瞻性的数据驱动型企业将探索能够继续满足其需求以及不断变化的隐私法规和期望的选项。这可能是一个整体的隐私保护数据协作平台,允许在整个组织和数据源中根据需要灵活选择和组合多种隐私计算技术。
作者:Phoebe Spanier
原文:https://dualitytech.com/blog/data-clean-rooms-advantages-and-disadvantages/
END

热门文章:




隐私计算头条周刊(09.18-09.24)


理解零知识证明的三个典型示例


校招丨2023-2024应届生隐私计算技术岗位(北京)


重磅!《2023全球隐私计算报告》开启征集!


加入我们丨OpenMPC社区招募实习生

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存