查看原文
其他

第二章更新|提升数据安全能力,保障人工智能健康发展《人工智能治理与可持续发展实践白皮书》


阿里巴巴集团联合中国信通院编写了《人工智能治理与可持续发展实践白皮书》,全面总结了阿里巴巴在人工智能治理与可持续发展领域的实践,重点针对当前人工智能应用中的热点问题,从数据、技术、管理及多元协同等方面,系统性介绍了我们的实践思路和方法,同时辅以若干专题进行阐释,期待为社会各界提供有益参考。

白皮书全文4.5万余字,将在9月正式发布,现分章节陆续分享。
往期章节回顾请点击👇:
第零章:《热议中的人工智能》

第一章:人工智能治理的愿景框架


💙 以下为第二章内容:


数据已成为国家重要的战略资源、新型的生产要素,数据的开发流通是人工智能高速发展的命脉,也是数字经济高质量发展的新动能。如何在数据隐私保护与开发流通之间保持平衡,最大发挥数据要素的潜在价值,是推动要素市场化配置及人工智能健康发展的重大挑战。


一方面,人工智能是建立在数据之上的赋能技术,只有全面提升数据安全能力,才能为人工智能可持续发展保驾护航。另一方面,人工智能技术为发挥数据优势提供新动能,例如,隐私增强技术等新技术实现了“数据可用不可见”、“数据不动算法动”等数据不出域的效果,促进了数据安全和数据流通的协同发展。



2.1

构建全生命周期的数据安全能力


正如前文所述,数据和人工智能彼此如鱼水般紧密结合,在各个环节都相互影响,企业在人工智能领域具备覆盖全生命周期的数据安全能力是应对数据风险的基础。随着《中华人民共和国数据安全法》(以下简称“《数据安全法》”)正式颁布,以及数据安全标准体系的持续完善,对数据安全治理提出了更高的要求。企业应全面落实《数据安全法》等法律法规要求,借鉴国家、行业标准作为实践指引,建立以数据为核心、围绕数据生命周期进行的数据安全的完备的能力体系。


只有在各个数据环节中充分考虑安全风险,才能更好地应对由于数据流动性、多样性、可复制性等新要素特点带来的挑战。在数据采集时对数据源进行权属鉴别和记录,防止数据仿冒和恶意数据侵入;在数据分析中建立针对特定数据的脱敏机制,避免原始数据被技术手段复原;在数据处理过程要建立数据正当使用的责任及评估机制,保证收集、使用数据的合法、正当、必要性,避免数据被滥用、非授权使用;在数据资产管理中建立组织的数据质量管理体系,保障数据采集中数据的准确性、一致性和完整性,应对人工智能算法需要有质量数据的需求。


阿里巴巴制定包括《阿里巴巴集团数据安全规范(总纲)》和配套23个执行制度或规范;搭建专门的集团数据安全组织; 在技术工具方面,阿里巴巴自研了数据分类分级、敏感数据识别、数据脱敏、数据安全审计、数据流转监控、堡垒机、4A(统一安全管理平台解决方案)等数据安全工具。


此外,借鉴多年的数据安全实践,阿里巴巴联合产学研各界力量,合力沉淀出GB/T 37988-2019《信息安全技术 数据安全成熟度模型》国家标准,该标准从组织建设、制度流程、技术工具和人员能力等各维度,涵盖数据采集安全、数据传输安全、数据存储安全、数据处理安全、数据交换安全、数据销毁安全、通用安全七大环节共30个PA(过程域)进行详细阐述,可作为组织开展数据安全能力建设的依据。


目前,该国家标准已得到广泛采用,在全国20多个行业、数百家企事业单位获得了深入实践和应用,有效提升了全行业的数据安全水位。



2.2

安全规范的数据流通 加速释放数据价值


2022 年 4 月 10 日,《中共中央国务院关于加快建设全国统一大市场的意见》明确规定加快培养数据要素市场。数据作为新兴生产要素,能够促进数字经济的持续发展,加速数据流通利于激发数据要素价值。构建数据要素市场需要统筹数据安全与发展,这需要在保护用户隐私、确保数据安全的前提下,促进数据流通,实现数据的高质量利用对此,可以从以下三个方面进行探索。


1.实现数据安全与数据利用的平衡发展


数据是连接用户、企业、社会的纽带和桥梁,数据跨主体流通能够帮助企业了解用户需求,通过“数据从用户来、服务回用户去”的方式,让企业为用户提供更好的数字化服务。数据流通中的安全问题不是绝对的,企业对数据承担的责任也不是无限的。


《数据安全法》设立了数据分级分类保护机制,域外国家的立法也确立了企业对数据保护尽职免责制度,完善相关规则可以帮助企业确立在不同场景和条件下对不同类型数据的保护范围和具体要求,在加强数据保护的同时也对自身承担的数据责任形成有效预期,让企业在做好数据安全保障的基础上更放心的将数据投入要素市场,发挥更大作用。


2.确立个人信息在受信任环境下的合理使用机制


个人信息承载了用户的人格权益,获取和利用个人信息需要尊重用户的选择、获得用户的同意,并不得利用个人信息损害用户隐私和其他合法权益。企业为了更好的提供产品和服务,在生产过程中也会对用户个人信息进行加密处理和进一步利用,在保证数据安全、保障个人信息权利、尊重用户隐私的前提下,应当允许企业在可信、可控条件下合理地使用个人信息,通过数据分析和数据智能更好地服务用户,提高用户的数字化生活体验。

用。


3.认可数据安全技术应用

推动标准建设并推广产业最佳实践。经匿名化处理的个人信息不再具有个人属性,可以充分流转、利用,因此匿名化标准及其技术实现手段对于促进数据流通利用、发挥数据价值尤其重要。为了发挥匿名化作为个人信息保护调节器的作用,企业需要根据目前隐私增强技术发展的实际情况,充分考虑使用匿名化技术的成本和收益,协同各界共同探索匿名化标准的具体内涵和实现手段。同时,在满足法律法规的要求下,企业可以推广通过技术保护实现匿名化的良好实践,为数据要素市场扩展更多的数据来源。 


2.3

隐私增强计算促进数据安全

和数据流通协同发展


“隐私增强计算”属于上述数据流通中的新兴安全技术,能够在保障个人信息权利及个人隐私的基础上,实现数据的流动及价值挖掘。

“隐私增强计算”是安全多方计算、同态加密、差分隐私、联邦学习、可信执行环境等一组安全技术的统称,共同点是希望实现不直接接触原始数据,同时完成对数据的计算处理。隐私增强计算用于人工智能训练,可以达到保护训练数据隐私的目的。以安全多方计算(MPC)方案为例,各个机构可以各自在本地部署一个MPC计算节点,节点之间以事先商定的MPC 协议互联。在基于MPC的人工智能建模过程中,各方所见的始终只有对方训练数据的秘密分量,无法了解到对方训练的原始数据信息,从而避免了隐私泄露。


隐私增强计算的一个典型人工智能场景是医疗模型训练:科研机构需要从多个医疗机构处汇聚大量医疗信息进行人工智能建模,才能顺利开展致病性分析等工作,但是基因等医疗信息又与个人隐私密切相关,不适合直接跨机构传播。一种可能的解法是同态加密:机构对基因信息进行同态加密之后传递给科研机构,然后科研机构不需要解密即可在基因信息之上进行致病性建模等分析。


在国际上,iDASH竞赛是专门探索解决云环境下海量基因组分析期间的数据隐私和安全性问题的赛事,目前也是国际上在隐私计算方面最高规格的竞赛,足以体现隐私增强技术在基因组数据安全分析场景的重要性,2019 年阿里巴巴在该竞赛中取得了一等奖。


🌟下期预告

专题:《落实法律法规完善用户隐私保护》

第三章:《构建面向可持续发展的人工智能技术体系》



我们将持续更新,敬请期待😚~


更多人工智能治理新技术、新风向、新观点,请关注【阿里巴巴人工智能治理与可持续发展研究中心AAIG】公众号👇


往期精彩推荐点击标题查看文章

● AAIG成立一周年!砥砺前行,谱写新时代的科技之歌~请查收这份最新的自我介绍



● AAIG官网升级改版!首次公开八大实验室~赛博朋克酷炫造型大揭秘


● AI治理必修第11刊|人工智能对军事防御与安全的影响?深度合成和深度伪造如何治理?什么是因果深度学习?


 听委员说|AAIG薛晖出席杭州市"两会",提出加快建立人工智能产业的多元协同治理机制


 如何构建企业数据管理体系?AI产品出海有哪些数据风险?浅谈AI数据合规与风险防范实践(下)


● “算法偏见”是概念炒作吗?「这个AI不太冷」第3期带你揭秘现实AI!

👇AAIG课代表,获取最新动态就找她

 关注公众号发现更多干货


有启发点在看喔👇
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存