查看原文
其他

朱悦|数据隐私保护的数量化、原生化和内生化

朱悦 数字经济与社会 2024-01-09

朱悦 对外经济贸易大学数字经济与法律创新中心研究员

当前的数据隐私保护只是刚刚开始。后续的数据隐私保护体现出三种趋势。差分隐私和信息熵是数据隐私保护数量化的可行方案。数据隐私保护的原生化意味着其融入媒介环境和测试基准。随着相关信息的处理者更加主动地审视其处理的隐私风险、数据隐私保护逐步迈向内生化,特征平台将会成为突出的实例。
数量化
先前的文章讨论过差分隐私如何逐步用于数据隐私保护的数量化、自动化和管线化。信息熵则是另外一种正在用于数据隐私保护的数量化的方案。差分隐私在应用上稍占先机,但依然存在若干技术难题。信息熵的优势在于简便易行,同时也会导致相当严格的隐私保护。以下分别简介二者。
差分隐私正在用于人口普查和在线广告等重要场景。差分隐私的关键参数(部分)地反映了隐私保护的筛选和关联风险。差分隐私的数学特性使得隐私可以方便地计量、核算,从而可以方便地权衡、交易。不过其实践依然面临三方面难题。一是参数阈值的选择,1、2或10等都有先例,有待统一。二是合成与个人账户核算方面仍有若干开放问题。三是需要加强基于假设检验的严格审计。
信息熵同样可以方便地数量化数据隐私。只要能够估计数据的概率分布,即可计算信息熵。这意味着计算和实施更加简单。由此,信息熵亦已成为在线广告隐私保护数量化的重要方案。然而也有两点障碍。一是信息熵不具备使得隐私容易核算、权衡的数学特性。二是将信息熵映射到数据隐私法律,知其衡量的是理论上范围最为宽松的可识别性。这意味着就个人信息概念选取最严厉的解释。
原生化
   先前的文章讨论过在线网页和应用场景中主体同意的原生化。这一设想的适用范围显然不限于同意。一般而言,数据隐私保护的各类制度要求都有可能原生至技术层面。这不仅意味着告知、同意、权利行使等要求原生至网页和应用当中,也意味着数据隐私对应的具体制度和抽象价值原生至测试的基准当中。
原生化的制度要求,意味着隐私要求的实施与用户体验的媒介环境保持高度一致。仍以同意在社交媒体、短视频和游戏中的内生化为例,这意味着同意获取和撤回的设计或可分别呈现为信托人好友、短视频滑拨和隐私NPC。基于类似思路,告知、行权等制度要求的设计同样可以呈现为好友沟通、视频拨动和NPC对话,等等。一言蔽之,数据隐私在内容和形式上和媒介环境“浑然一体”。
原生化的测试基准,意味着隐私要求与功能和模块的测试基准同样“浑然一体”。这一点大体落在“基于设计的隐私”框架之内,但其整合程度更高。不妨以模型训练为例,原生化的基准,意味着数据隐私不再是模型训练大功告成以后的回顾评审,而是确实成为基准评价的维度之一,模型“涨点”同时意味着隐私保护的“涨点”。如果再进一步,数据隐私甚至可以原生至其损失函数当中。
内生化
先前的文章还通过讨论“制造隐私计算”的可能性,展望了未来数据隐私保护的内生化方向。简而言之,从数据隐私风险的角度审视技术性较强的处理活动,可以不断制造新的隐私计算。推而广之,从数据隐私风险的角度审视各类处理活动,不仅可能不断制造新的隐私保护措施,还可以化解棘手的保护难题。
首先简述对于制造隐私计算的推广。从隐私角度审视所有处理活动,可以视为隐私工程的逆向概念——隐私工程是将隐私落地到工程细节,于是逆向观之,同样可以审视既有工程细节对隐私的影响。无论是基础性质的数据库,还是相对瞩目的算法模型,其间增删查改都会改变数据的性质,也就蕴含着对各类隐私风险的影响。系统审视既有工程将显著增益对隐私的理解。这样的工作正在发生。
其次讨论特征平台这一将会十分突出的实例。特征平台是现实需要催生的工程成果,主要目的是增强对于从数据提取的特征的治理、调度和流通。从隐私角度审视特征平台,即可通过两类措施实质化解当前算法治理的核心难题。首先是设法将特征提取“制造”为足以匿名化的隐私计算,解决流通利用的后顾之忧;其次是对特征平台的呈现稍作调整,算法的备案和解释即已得到大体的解决。
结语
   数量化、原生化和内生化是数据隐私保护的趋势。差分隐私和信息熵彼此竞争,胜者或将成为未来数量化治理、权衡、交易隐私的标准单位。原生化的隐私发扬了基于设计的隐私,隐私由此成为用户体验和开发流程的“浑然”部分。内生化的隐私意味着更加系统地审视当前的工程实践——隐私不再是与开发和业务零和对抗,而是携手找寻增量。特征平台将使得制度的许多愿景成为现实。
主要参考文献

本文的参考文献大多可在先前写作的《数据隐私保护权衡的数量化、服务化和管线化》《主体同意的内生化》和《制造隐私计算》等三篇短文中找到。有关数据隐私保护的数量化,尚可参见国外大型互联网平台对在线广告中的隐私保护的若干提案。有关数据隐私保护的原生化,特别是其中有关原生化测试基准的部分,尚可参见国外大型互联网平台和开源平台在基准的批判反思、伦理价值嵌入基准和动态调适基准等方面的工作,以及相应的实现。有关数据隐私保护的内生化,尚可参见国外大型互联网平台在其特征平台产品中提供的治理与合规功能。


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存