查看原文
其他

AEPD和EDPS | “哈希函数简介——用于个人数据假名化技术”中译文(DPO社群出品)

DPO社群 网安寻路人 2020-02-26

编者按:


201911月欧洲数据保护专员公署(EDPS)联合西班牙数据保护局(AEPD)发布了一份名为《哈希函数简介——用于个人数据假名化技术》(Introduction to The Hash Function as A Personal Data Pseudonymisation Technique)的文件,对哈希技术在个人数据假名化中的运用进行了介绍。DPO社群组织力量完成了对这一文件的全文翻译工作,今天推出供大家学习参考。


译者序言:关于哈希作为假名化手段的适用


2019年11月欧洲数据保护专员公署(EDPS)联合西班牙数据保护局(AEPD)发布了一份名为《哈希函数简介——用于个人数据假名化技术》(Introduction to The Hash Function as A Personal Data Pseudonymisation Technique)的文件,对哈希技术在个人数据假名化中的运用进行了介绍。这一文件重点说明了哈希技术的基本原理和属性,同时分析和阐释了这一技术在个人数据假名化中的应用可能带来的风险,从而帮助判断该等技术是否合适可用。


理解这一文件需要先澄清两个基本的概念:“假名化”(Pseudonymisation)和“哈希”(Hash)。


  •  “假名化”


欧盟在《通用数据保护条例》(“GDPR”)第4条中对“假名化”给出了官方释义:


假名化是一种使得个人数据在不参照其他数据的情况下无法指向特定数据主体的个人数据处理方式。该处理方式将个人数据与其他数据分别存储,并且会采取相应的技术和组织措施而使得个人数据无法指向一个已识别到的或可被识别的自然人。


因此“假名化”是一种数据处理的方式,目的在于确保经过该等方式处理的个人数据无法“单独”被用于识别出一个自然人。但经过“假名化”处理的个人数据在与其他个人数据结合的情况下仍可能识别出特定数据主体,因此仍属于个人信息的范畴,这点构成了与“匿名化”个人数据之间的定性区别。


  • “哈希”


哈希技术是一种在个人数据处理活动中经常用到的技术手段,通过散列算法将任意长度的数据转换成某一固定长度的数据,转换后输出的数据就是哈希值。本文件在第二部分中对于哈希技术也做出了具体的界定:


摘要(digest)或哈希函数是一个转换固定长度字符序列中的任意随机数据集的过程,无论输入数据的大小如何。所输出的称为哈希值或码、摘要、图像或哈希。通常,“哈希”术语既用于指代哈希功能也指代哈希值,其中哈希值是指针对特定消息运行哈希功能所输出的值。


而考察这一文件发布的必要性和制度背景,则需要将GDPR的立法初衷、“假名化”对于实现该等立法初衷的作用、“哈希”技术对于实现“假名化”的实践价值这三者纵向联系起来考虑。GDPR在序言和正文中多处提及“假名化”,并明确了这一措施能够降低数据主体的风险、帮助数据控制者和处理者满足其数据保护义务。虽然假名化体现了隐私保护设计的技术侧保护措施要求,但GDPR条文本身是技术中立的,没有对采用何种技术视为“假名化”处理手段进行倾向性评述、建议亦或是做出适用层面的强制性要求,更没有对“哈希”技术作为“假名化”具体手段之一如何运用进行解释和限定。而哈希则是目前普遍采用的、可实现“假名化”效果的技术手段,因此,如何全面理解、恰当使用哈希这一手段对于实现GDPR设立的若干原则、实现个人信息保护的实际效果,就变得很有现实意义了,相应的,这一文件的出台也就有了具体实用的落地指引功能。


当然,相比之下,我国的《个人信息安全规范》则把“哈希函数”、“假名化”明确列为“去标识化”的技术手段,则是更为直接地展示了哈希技术之于个人信息保护的作用。

 

此次EDPS和AEPD这一关于哈希的介绍文件内容很丰富,简单梳理要点如下:


  • 哈希值的理想属性


  1. ž文本、图像、视频等所有可数字化的内容均可转换输出为哈希值;

  2. ž任何给定数值输入都可产生对应的固定大小的数值输出;

  3. ž相同数据输出相同哈希值,反之,一旦输入数据出现任何细微变化,则输出的哈希值也将完全不同;

  4. ž通过哈希值难以重新识别原始输入的数据或信息。


  • 哈希值作为唯一标识符的有效性


同一哈希值输出的数据或信息是多元的,并非唯一。这种情况下将哈希值作为输入数据或信息的唯一标识符,其有效性是存疑的。


  • 哈希值的重新识别问题


哈希值对于数据处理而言,目的在于使得经过该等处理后的数据不可被重新识别。在将哈希值应用于产生直接标识符时,则必须防止该直接标识符被重新识别进而得出原始数据或信息。


  • 将信息与哈希值关联


数据文件本身的某些信息具有“标识符”功能,这些信息与数据持有者(data holder)具有唯一对应的关联关系。这种情况下,当这些信息与哈希值相关联时,则哈希值内容就可能被识别出。此等能与哈希值关联的信息越多,哈希值内容被识别出的风险就越高。


数据文件还可能包含其他信息,通常与其他数据捆绑、交叉解读进而用于识别某数据个体。这类数据本身可能仅发挥“非数据处理目的”的次要功能,亦或是为“数据处理目的”而互相联接,进而与哈希值相关联。这类信息称为“伪识别符”、“准标识符”或“间接标识符”,与哈希值联接后可能会导致识别出数据持有者。


  • 干扰哈希值重新识别的策略


一种策略是针对数据使用加密算法,密钥由数据控制者或与其他参与处理操作者秘密存储,从而在完成哈希值转换之前对该等数据进行适当加密;或者,在得出哈希值之后即对其进行加密,此过程中会在原始信息(数据)之上产生一条新信息(数据),可通过对该新信息使用密钥进而获取原信息。


另一种策略是在评估哈希值之前针对全部信息增加一个固定值或“盐”。这里的“盐”是指任何增加在原始信息之上的随机值,其随机性必须独立于该信息或其他任何信息。


第三种策略是“一次性盐模式”。假设相关“盐”被删除,尽在遵守某些保证的前提下,原始信息以及使用“一次性盐”的标识符可被认为达到“匿名化”效果了。“一次性盐”为每一条消息生成一个单独的随机元素,该随机元素必须完全独立于任何信息及为任何其他信息生成的其他“盐”值。


第四种策略是“差分隐私模型”。在信息中心加入一个“噪音值”,不同于在信息中加入一个作为首位的“盐”,“噪音值”被加入到信息本身当中。该噪音值可通过集中不同方式来应用,如图形、声音或其他可扩展的信息。噪音值应遵循某些条件:首先,需要分析它的随机性以及它与信息内容发生关联的可能性;其次,不同信息之间引入的“噪音值”应避免关联;再次,它必须被技术现状验证无法被适用于反向识别模式。


  • 作为个人数据假名化或匿名化系统的哈希分析


为评估哈希技术在个人数据保护方面的适当性,除考虑一部分已描述到的因素外,还应当考虑另一部分取决于实施情况的因素,包括:哈希的计算过程、处理的信息空间、哈希值与处理环境中的其他信息关联、密钥及其他随机元素,以及对上述因素的持续管理与审核。


  • 意见的总结


在使用哈希技术进行个人数据假名化或匿名化时,文件特别提示了一些需要注意的事项:


  1. 风险评估。在使用哈希技术进行个人数据假名化或匿名化时,必须评估数据处理中具体使用的哈希技术是否具有再识别的风险。

  2. ž同时还需考虑一些基本要素:建立哈希值时,由高水平的信息熵;使用“一次性盐”或随机值;使用适当的随机信息生成器实施加密技术;安全访问哈希过程;零关联“标识符”、“伪标识符”和其他信息;对哈希系统管理程序定期考核;

  3. ž风险评估需要评定以下事项:具备确保可删除所有允许再识别信息的组织措施;合理保证系统具备超出个人数据预期使用寿命期限的稳健性。

  4. ž为确保履行GDPR所确立各项原则,需要进行严格的事先定性分析,以客观地确定哈希的适用性。


以上归纳与摘要仅供参考。文件还同时提供了多个图解说明,更为形象地说明了哈希的技术原理;附录中则列出了GDPR等规范文件中的相关条款,供读者便利参考。


无疑,作为最为常见的数据假名化和去标识化手段之一,哈希的使用不仅是个人信息保护的有效技术措施,也是数据控制者和处理者履行法定义务的自我证明,值得信息安全和法律专业人士从不同的视角来共同关注和学习。



下载《哈希函数简介——用于个人数据假名化技术》中译文,请点击文末左下角的“阅读原文”。【提取码:esra




数据保护官(DPO)社群主要成员是个人信息保护和数据安全一线工作者。他们主要来自于国内头部的互联网公司、安全公司、律所、会计师事务所、高校、研究机构等。在从事本职工作的同时,DPO社群成员还放眼全球思考数据安全和隐私保护的最新动态、进展、趋势。2018年5月,DPO社群举行了第一次线下沙龙。沙龙每月一期,集中讨论不同的议题。目前DPO社群已近300人。关于DPO社群和沙龙更多的情况如下:


DPO社群成果

  1. 印度《2018个人数据保护法(草案)》全文翻译(中英对照版)(DPO沙龙出品)

  2. 巴西《通用数据保护法》全文中文翻译(DPO沙龙出品)

  3. 美国联邦隐私立法重要文件编译第一辑(DPO沙龙出品)

  4. 《非个人数据在欧盟境内自由流动框架条例》全文中文翻译(DPO沙龙出品)

  5. 第29条工作组《对第2016/679号条例(GDPR)下同意的解释指南》中文翻译(DPO沙龙出品)

  6. 第29条工作组“关于减轻对处理活动进行记录义务的立场文件”(DPO沙龙出品)

  7. 第29条工作组《第2/2017号关于工作中数据处理的意见》(DPO沙龙出品)

  8. “美国华盛顿哥伦比亚特区诉Facebook“起诉书全文翻译(DPO沙龙出品)

  9. 第29条工作组《关于自动化个人决策目的和识别分析目的准则》(DPO沙龙出品)

  10. 法国数据保护局发布针对与商业伙伴或数据代理共享数据的指南

  11. 第29条工作组《数据可携权指南》全文翻译(DPO沙龙出品)

  12. 德国联邦反垄断局对Facebook数据收集和融合行为提出严格限制(DPO沙龙出品)

  13. 德国联邦反垄断局审查Facebook数据收集融合行为的背景情况(DPO沙龙出品)

  14. EDPB“关于《临床试验条例》与GDPR间相互关系”意见的全文翻译(DPO沙龙出品)

  15. 第29条工作组关于GDPR《透明度准则的指引》全文翻译(DPO沙龙出品)

  16. “108号公约”全文翻译(DPO沙龙出品)

  17. 美国司法部“云法案”白皮书全文翻译(DPO社群出品)

  18. EDPB关于GDPR中合同必要性指引的中文翻译(DPO沙龙出品)

  19. 新加坡《防止网络虚假信息和网络操纵法案》中文翻译(DPO沙龙出品)

  20. 英国ICO《广告技术和实时竞价的更新报告》中译文(DPO社群出品)

  21. “FTC与Facebook达成和解令的新闻通告”全文翻译(DPO社群出品)

  22. CJEU认定网站和嵌入的第三方代码成为共同数据控制者(DPO沙龙出品)

  23. FTC与Facebook“2019和解令”全文翻译(DPO社群出品)

  24. 英国ICO《数据共享行为守则》中译文(DPO社群出品)

  25. “hiQ Labs诉LinkedIn案上诉判决”中译文(DPO社群出品)

  26. 法国数据保护监管机构(CNIL)有关cookies和其他追踪方式的指引(全文翻译)

  27. 美加州消费者隐私法案(CCPA) 修正案汇总中译文(DPO沙龙出品)

  28. FTC“首次针对追踪类App提起诉讼”的官方声明中文翻译(DPO社群出品)

  29. ICDPPC关于隐私和消费者保护、竞争维护交叉问题决议的中文翻译(DPO社群出品)

  30. 德国关于确定企业GDPR相关罚款数额官方指南的中文翻译(DPO社群出品)

  31. 亚洲十四个国家和地区数据跨境制度报告中译本(DPO社群出品)

  32. 印度《个人数据保护法》(2019年草案)全文翻译(DPO社群出品)

  33. 法国数据保护局(CNIL)关于人脸识别报告的中译文(DPO社群出品)


线下沙龙实录见:

  1. 数据保护官(DPO)沙龙第一期纪实

  2. 第二期数据保护官沙龙纪实:个人信息安全影响评估指南 

  3. 第三期数据保护官沙龙纪实:数据出境安全评估

  4. 第四期数据保护官沙龙纪实:网络爬虫的法律规制

  5. 第四期数据保护官沙龙纪实之二:当爬虫遇上法律会有什么风险

  6. 第五期数据保护官沙龙纪实:美国联邦隐私立法重要文件讨论

  7. 数据保护官(DPO)沙龙走进燕园系列活动第一期

  8. 第六期数据保护官沙龙纪实:2018年隐私条款评审工作

  9. 第八期数据保护官沙龙纪实:重点行业数据、隐私及网络安全

  10. 第九期数据保护官沙龙纪实:《个人信息安全规范》修订研讨

  11. 第十期数据保护官沙龙纪实:数据融合可给企业赋能,但不能不问西东

  12. 第十一期数据保护官沙龙纪实:企业如何看住自家的数据资产?这里有份权威的安全指南

  13. 第十二期数据保护官纪实:金融数据保护,须平衡个人隐私与公共利益

  14. 第十三期DPO沙龙纪实:厘清《数据安全管理办法》中的重点条款

  15. 第十四期DPO沙龙纪实:梳理《个人信息出境安全评估办法(征求意见稿)》的评估流程

  16. 第十五期DPO沙龙纪实:SDK非洪水猛兽,但如果“作恶”乱收集信息,谁来管?

  17. 第十六期DPO沙龙纪实:查询App收集个人信息类型、禁止收集IMEI号是未来监管趋势

  18. 与欧美一流数据保护专家面对面(DPO沙龙特别活动)

  19. 第十七期DPO沙龙纪实:数据统一确权恐难实现 部门立法或是有效途径

  20. 第十八期DPO沙龙纪实:生物识别信息的安全保护


评估GDPR效果和影响:

  1. 评价GDPR一周年:一些正负面观点

  2. 评估GDPR效果和影响的参考资料(一):来自Capgemini的报告

  3. 评估GDPR效果和影响的参考资料(二):来自CIPL的报告

  4. 评估GDPR效果和影响的参考资料(三):来自IAPP的报告

  5. 评估GDPR效果和影响的参考资料(四):来自“黑客”的视角

  6. 评估GDPR效果和影响的参考资料(五):来自欧盟成员国的视角


线上沙龙见:

  1. DPO社群对数据堂事件的精彩点评

  2. DPO社群线上讨论第二期:“出售 & 提供” 个人信息之法律与实务对话

  3. 用户授权第三方获取自己在平台的数据,可以吗?不可以吗?(DPO沙龙线上讨论第三期)


DPO社群成员观点

  1. 个人信息委托处理是否需要个人授权?(DPO社群成员观点)

  2. 企业如何告知与保护用户的个人信息主体权利(DPO社群成员观点)

  3. GDPR“首张”执行通知盯上AlQ公司的前期后后(DPO社群成员观点)

  4. 隐私条款撰写调研报告(DPO社群成员观点)

  5. 我看到的数据安全(DPO社群成员观点)

  6. 数据爬取的法律风险综述(DPO社群成员观点)

  7. 银行业金融数据出境的监管框架与脉络(DPO社群成员观点)

  8. 解析公安机关《互联网个人信息安全保护指引(征求意见稿)》(DPO社群成员观点)

  9. 详解GDPR向Google亮剑缘由(DPO社群成员观点)

  10. 从生产安全体系视角看数据安全(DPO社群成员观点)

  11. 从Android Q看安卓系统的授权机制的三次重大演进(DPO社群成员观点)

  12. APP安全认证公告和实施规则解读:治理思路的创新与多样化(DPO社群成员观点)

  13. 从数据融合角度分析CNIL处罚谷歌案(DPO社群成员观点)

  14. 历史和国际比较视角DPO法律制度探源(DPO社群成员观点)

  15. 谷歌数据融合合规之路:从欧盟监管机构调查与处罚来看——上篇(DPO社群成员观点)

  16. 数据保护官岗位角色技术能力分析(DPO社群成员观点)

  17. 中国企业境外投资中儿童个人信息保护(DPO社群成员观点)

  18. 企业上市过程面临的数据合规问题和相关风险:境内篇(DPO社群成员观点)

  19. 企业上市过程面临的数据合规问题和相关风险:境外篇(DPO社群成员观点)

  20. 数据保护岗位需求与能力发展(DPO社群成员观点)

  21. DPO互助平台对企业数据治理实务的指导(DPO社群成员观点)

  22. 对网络安全负责人岗位的思考(DPO社群成员观点)

  23. 结合良好实践,细说APP自评估指南之一(DPO社群成员观点)

  24. 《个人信息安全规范》的效力与功能

  25. 结合良好实践,细说APP自评估指南之二(DPO社群成员观点)

  26. 《网络安全法》中数据出境安全评估真的那么“另类”吗

  27. 实施已满三月,区块链新规“回头看”(DPO社群成员观点)

  28. 从“布拉格提案”看美国政府的策略

  29. 《欧盟GDPR合规指引》前言:从一个损毁的雕像说起

  30. 对《网络安全审查办法(征求意见稿)》的几点观察

  31. 使命与界限:近期个人信息和数据安全新规的一些思考(DPO社群成员观点)

  32. 解析《个人信息出境安全评估办法(征求意见稿)》实体保护规则背后的主要思路

  33. “惟危惟微,允执厥中”:对《数据安全管理办法》中“定向推送”部分的思考

  34. 《儿童个人信息网络保护规定(征求意见稿)》评析:与美国COPPA对比的视角

  35. 网安法中的“范围”如何理解和落地:从头条案说起

  36. 《数据安全管理办法》的监管诉求及文本改进建议:DPO社群的现场讨论

  37. 数据安全的内部和外部视角初探

  38. 《个人信息出境安全评估办法》的流程改进建议:DPO社群的现场讨论

  39. GDPR与相关数据保护法律处罚案例调研(DPO社群成员观点)

  40. 个人信息侵权纠纷类型化试解(DPO社群成员观点)

  41. 英法两国对 AdTech和广告类SDK的监管案例分析

  42. 金控监管办法草案发布 有望扫清信息共享障碍(DPO社群成员观点)

  43. GDPR对用户画像的合规要求分析(DPO社群成员观点)

  44. IAPP新加坡会议上关于27701的Panel和PPT

  45. FTC vs Facebook:50亿美元和解令的来龙去脉(DPO社群成员观点)

  46. 人脸识别技术的法律规制研究初探(DPO社群成员观点)

  47. 澳《消费者数据权利法案》对数据共享与数据可携权的探索(DPO社群成员观点)

  48. FTC vs. YouTube:解读违规处理儿童个人信息之最大罚单(DPO社群成员观点)

  49. 个人数据在美欧外国投资审查中的角色初探(一)

  50. HiQ vs. LinkedIn案的启示与未决之题(DPO社群成员观点)

  51. 国家标准《个人信息安全规范(征求意见稿)》修订解读(DPO社群成员观点)

  52. 解析欧盟法院对与Cookies相关的告知和同意的最新判决(DPO社群成员观点)

  53. 推动域外应用商店下架“HKmap.live全港抗争即时地图”App的思路

  54. “客场作战”,法律先行:以“HKmap.live”为例

  55. 墨迹天气IPO被否 App治理工作组收集个人信息通报成依据之一

  56. 解读世界首例警方使用人脸识别技术合法性判决(DPO社群成员观点)

  57. 从墨迹IPO被否看拟境内上市企业的数据合规工作(DPO社群成员观点)

  58. 对美国外国投资审查新规的观察和评价(DPO社群成员观点)

  59. 《个人信息安全规范》在安标委重庆会议周上的汇报

  60. 人脸识别技术运用的六大场景及法律规制框架的适配(DPO社群成员观点)

  61. 他山之石:美国20年间33个儿童信息保护违法案例分析(DPO社群成员观点)

  62. 人脸识别技术的规制框架(PPT+讲稿)

  63. 全球视野中的金融数据安全

  64. 公司IPO/重组/投融资时,监管部门审查要点汇总及问题分析(DPO社群成员观点)

  65. 个人金融信息收集和共享的基本原理:基于中美欧规则的展开(文字稿+PPT)

  66. 透析印度《个人数据保护法2019年草案》

  67. 北京市关于自动驾驶车辆道路测试的立法综述及动态(DPO社群成员观点)

  68. 违反俄罗斯数据本地化的行政罚款新规(DPO社群成员观点)

  69. 零售门店使用人脸识别技术的主要法律问题(DPO社群成员观点)


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存