李凤华:泛在共享环境下数据安全与隐私计算的发展趋势及应用
The following article is from OpenHarmony TSC Author 李凤华
随着现代计算机技术的飞速发展,信息安全的重要性日益凸显。中国有14亿人口,是互联网应用和消费大国,数据量近年具有暴涨趋势。国家出台的多项政策和战略中均强调了数据安全能力建设的重要性。目前,在操作系统领域存在哪些数据安全挑战,又有哪些应对策略呢?近日,在开放原子开源基金会OpenHarmony技术峰会的安全及机密计算分论坛上,中国科学院信息工程研究所二级研究员、副总师,中国科学院“百人计划”学者李凤华作了以《泛在共享环境下数据安全与隐私计算的发展趋势及应用》为主题的精彩分享。
早期数据是少量、分散地流通与使用,但随着数据广泛集中,出现了大量的泄露、侵权等问题。因此,国家一方面促进数据流通,另一方面通过健全相关法律对数据进行保护。最早于2017年出台的《网络安全法》对网络运营者保护网络信息安全提出了明确要求;党的十九届四中全会提出将数据作为独立的新型生产要素;《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出了“数据二十条”。国家的一系列关于数据安全能力建设的举措,既保护了头部、大规模企业的合法运营,也在一定程度上抑制了小规模企业对数据的非正常使用。
从数据本身的角度来看,数据是指围绕产品设计、生产、销售、售后服务,以及服务业等经营活动中产生的全流程数据。其中,具备“六性”( 可用性、机密性、隐私性、可控性、交易性、仲裁性)的数据才能成为生产要素。数据可信指确定数据的所有权、使用权、管理权和交易权等,并确保存储和传输的机密性、防篡改、不可否认性,以及计算可控性、可信可控审计。
2.1CoAC访问控制
2.2数据控制
大数据时代背景下,终端APP频繁超范围采集个人信息;后台信息服务系统中的隐私数据越权使用、大数据杀熟、个人画像结果滥用、个人信息过度留存等问题与日俱增。目前针对单一系统提出隐私保护技术不能解决泛在受控共享,隐私信息跨系统共享难以确保多系统的隐私保护方案具有同等效果、一损俱损,需要从计算角度研究全生命周期的隐私计算框架、延伸控制。当前隐私保护方案多种多样,且随着时间的推移和隐私数据的类型不断变化,需要考虑多算法融合,最终在“时间-隐私信息-隐私保护需求”三维空间中提出一种统一的描述方法,使隐私保护方案从零散的点形成连续演化的面。
隐私保护三维模型
隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。隐私计算具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,支持多系统融合的隐私信息保护。隐私计算涵盖了信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。隐私描述隐私信息可以由六元组集合(𝐼,𝛩,𝐴, 𝛤, 𝛺, 𝛹)进行描述:
隐私信息向量 𝐼:信息𝑀中语义上含有信息量、不可分割、彼此互不相交的原子信息 约束条件集合 𝛩:隐私信息分量对应的约束条件向量,用于描述在不同场景下实体访问所需的访问权限 隐私属性向量 𝐴:隐私属性分量,用于量化隐私信息分量及分量组合的保护程度 广义定位信息集合 𝛤:隐私信息分量在信息中的位置信息及属性信息,可对隐私信息分量快速定位 审计控制信息集合 𝛺:隐私信息传播过程中的审计控制向量,用于记录隐私信息分量在流转过程中的主客体信息和被执行的操作记录 传播控制操作集合 𝛹:描述隐私信息分量及其组合可被执行的操作
可逆性:隐私保护算法执行前后,隐私信息的被还原能力 延伸控制性:跨系统交换过程中接收方隐私信息保护效果与发送方保护要求的匹配程度 偏差性:隐私保护算法执行前后,隐私信息分量ik和隐私保护后发布出去/攻击者或第三方可观测到的隐私信息分量ik′之间的偏差 复杂性:执行隐私保护算法所需要的代价,即隐私保护复杂性代价 信息损失性:信息被扰乱、混淆等不可逆的隐私保护算法作用后,对信息拥有者来说缺失了一定的可用性。
准则一:预处理,确定数据分布特征、取值范围、数据隐私保护敏感度、隐私操作次数的期望值、隐私操作结果的社会经验值等 准则二:算法框架,确定隐私保护算法的数学基础;给出算法步骤及步骤间的组合关系;隐私属性向量与隐私信息向量之间的关系 准则三:算法参数设计,确定隐私保护算法中相关参数的具体取值 准则四:算法组合,在算法内部实现不同步骤的组合,或在相似算法间实现排列组合 准则五:算法复杂度与效能分析,算法的时空复杂度;隐私保护效果的期望值;隐私保护算法的实现代价
3.2隐私计算内涵
隐私计算的学术内涵
我们要正确理解不同技术所能解决的问题,并针对不同环节选择合适的技术方案,这样才能正确利用不同技术解决泛在共享环境中不同环节的数据安全与隐私保护问题。
我们还期待业界能够以历史责任感的高度正确诠释不同技术的内涵及其作用。让我们携手共同促进生态链健康发展,为数字经济发展提供有力支撑。
嘉宾简介
热门文章:
招标 | 近期隐私计算项目招标中标41(中原工学院、沧州智3.慧城市、恒丰银行、数字广东、云南大学、湖南大数据)