数据安全治理有了新样本
作为新型生产要素,数据是支撑发展新质生产力的基础性战略资源。4月26日,专家在2024中关村论坛“数据安全治理与发展论坛”上分享了人工智能时代数据安全治理的新理念,北京市政府相关部门、研究机构等,则发布了有关中文互联网语料库、自动驾驶等一系列数据安全治理与发展成果。当前,数字经济成为国民经济的重要支柱,以人工智能为代表的新技术应用成为发展新质生产力的重要引擎,畅通数据大循环成为赋能高质量发展的新动能。
用新技术新理念保安全
2024年网络强国战略目标10周年,也是我国全功能接入国际互联网30周年,谁能把握大数据、人工智能等新经济发展机遇,谁就把握了时代脉搏。
论坛上,中国工程院院士沈昌祥重点分享了自己对数据安全治理方面的观点。他引用了维基百科的定义,“大数据是无法用现有的软件工具进行处理的海量复杂的数据集合,因此说它是‘废料’,是‘矿山’,我们必须要进行全过程的开采,形成新型的产业链、新型的供应链。我们应该建立主动免疫的安全保障体系”。
英国皇家工程院院士郭毅可从制度规则的角度做了发言,“近年来,全球范围内的国家纷纷出台了涉及人工智能的立法和政策。大多数国家在制定相关法规时都采取了谨慎的态度,避免过度限制人工智能的发展,以免阻碍创新和进步,这彰显了国际社会对数据安全治理的重视”。
在他看来,为了防止未经授权的访问和数据泄露,组织必须采取严格的安全措施。“通过数据匿名化技术,用户同意和隐私设计原则,以及实施数据分类、访问控制和加密方法,保护知识产权和防治未经授权的披露,加密和匿名化技术的应用也是数据安全治理的重要方面。通过采用加密技术可以保护数据在禁止的传输过程中的安全。”郭毅可补充,“还可以使用差分隐私或者数据屏蔽等匿名化技术来删除个人身份信息,以确保数据的精密性,同时保留其对于人工智能模型训练的有用性。”
除了制定明确的政策和框架,有效的数据分类和归类、访问控制和权限管理也是确保数据安全的关键因素。“基于决策的访问控制、多因素身份验证和定期审查访问权限,对于确保数据安全至关重要,监控和审计对于确保数据安全至关重要,实施监控和定期审计人工智能模型的活动和数据法规,有助于检测异常、未经授权的访问尝试等异常模式”,郭毅可提出建议。
7项成果提供借鉴
当天,北京市网信办、中国网络安全审查认证和市场监管大数据中心、北京智源人工智能研究院、北京市经信局、北京市高级别自动驾驶示范区办公室、中科院信息工程研究所、海淀区政府,围绕健全治理与发展体系、创新管理与服务机制、强化技术与产业支撑等方面发布7项重要实践成果,为数字经济背景下的数据治理提供有益借鉴。
北京市经信局、北京市网信办组织相关单位建立的北京人工智能数据训练基地监管沙盒机制,是依托北京数据基础制度先行区、北京人工智能数据训练基地提供的可信空间和强大智算资源形成的多项人工智能训练数据应用创新机制,向大模型企业模型训练提供“强大算力+海量数据+监管合规”的完整训练要素。
根据北京市高级别自动驾驶示范区办公室发布的《北京市高级别自动驾驶示范区数据安全治理白皮书》,“北京市高级别自动驾驶示范区有838辆入网汽车,包含Robotaxi自动驾驶的小巴、无人配送和智能网联的公交,同时还有367个智能网联的路口,覆盖经开区60平方公里、经开高速10公里的范围”,北京市高级别自动驾驶示范区工作办公室常务副主任许宏伟介绍,“六大类数据包括路况全息感知、自动驾驶车辆路网数据、信号灯优化数据、交通各种指标出行服务、行人闯入机动车道事件的数据。”
在数据利用方面,许宏伟举例,“我们跟清华大学等发布了全球首个车路协同自动驾驶的数据集,已经发布两期,在利用数据的时候把隐私去掉,同时把它公开免费,同时还基于这个做了一些算法挑战赛”,在数据治理方面,“北京市高级别自动驾驶示范区提出全生命周期的安全,就是从采集、传输、存储、使用、共享,最后怎样销毁,从车端、路端、云端,车车传输、车云传输、路云传输,这些方面都要进行分级分类”。
往期 · 推荐