国内首个国家微生物科学数据隐私平台发布
4月23日,由中国科学院微生物研究所、中国科学院计算机网络信息中心等单位联合主办的“生物领域数据安全管理与跨领域互联互通实践研讨会”在北京成功举行。会上,国内首个国家微生物科学数据隐私平台正式发布。
国家微生物科学数据隐私平台利用国产可信硬件的隐私计算方案,保障经加密后的基因序列在加密态的内存中进行序列分析。使用前沿的密码学、隐私计算、区块链等数据安全技术,保障各方对数据的可用不可见。平台使用区块链技术完成全流程监控,提供科学数据链颁发的全网唯一的区块链证书以确保数据权益。
该平台是目前我国科学数据领域,首个利用区块链和隐私计算技术,实现对具有数据风险保护要求的科学数据实现“可用不可见”的应用实践,为解决数据安全、数据确权等长期困扰数据流通利用的难题提供了解决方案,具有重要的示范意义。
平台的正式发布是科学数据互联互通的开始,但是平台的发布并不是一蹴而就,在这之前,隐私计算早已在“生物大数据安全”方面有过很多实践探索。
这里列举两个产业应用的实践案例,来看看隐私计算是如何在具体场景中为“生物大数据”保驾护航!
案例1 借力隐私计算开展多中心基因组学分析
早在去年,就有“某三甲医院借力隐私计算开展多中心基因组学分析,取得突破研究成果”的典型案例。
全基因组关联分析指在全基因组水平上,以单核甘酸多态性(Single Nucleotide Polytide, SNP)作为分子遗传标记,进行对照或关联性分析,对于疾病预防、诊疗和新药研发意义重大。由于该三甲医院的样本量不足以支撑一项全基因组关联分析研究,因此需要联合多家医院及院校共享AS患者基因信息进行研究,以开展更好的疾病防治工作。但在跨机构AS基因数据协作和共享过程中存在数据隐私安全隐患、数据合规以及计算难度大等问题。
为规避隐私泄露风险,实现基因数据分享和联合分析,推动本次AS全基因组关联分析项目顺利开展,该三甲医院决定采购隐私计算解决方案。
明确AS全基因组关联分析多中心合作需求 为实现AS全基因组关联分析,该三甲医院及合作机构需要隐私计算解决方案,能支持灵活组合、处理大量数据并保证数据安全合规。
部署隐私计算一体机平台 隐私保护计算一体机能够接入医院数据、完成本地计算、对计算结果加密、将加密后的信息通信至全局模型进行迭代,简化了搭建应用隐私计算平台的难度。
各数据使用方设计并构建全基因组分析管道 通过融合多种算法,可灵活地集成和配置不同的全基因组关联分析管道,方便识别疾病特征之间的关联。
实现隐私计算安全 依托隐私保护计算框架,该三甲医院与多个跨省合作机构实现数据链接和共享协作,并保障基因数据共享全链路隐私安全。在多中心协作过程中,采用安全联邦学习技术和可信执行环境技术,保护数据隐私,防御内部攻击,避免计算过程被篡改。
案例2 基于隐私计算的生物特征识别应用
案例项目结合了隐私计算安全多方计算技术和人脸识别技术,实现了在不传输生物特征原始数据的情况下,完成人脸的认证比对,从而在不改变用户交互流程的前提下,保护用户隐私信息。
在保护人脸图像隐私方面,采用图像识别技术对手机POS采集到的商户责任人或收银员图像进行特征提取,在用户授权的前提下,将提取到的图像特征与交通银行和中国银联两个独立主体存储的图像特征进行比对,以实现对商户责任人和收银员身份的一致性核验。
在进行隐私计算运算方面,采用多方安全计算技术对采集提取的特征信息进行随机切片、传输并存储至交通银行和中国银联两个独立主体,避免由于独立主体单独存储用户的图像特征原图而带来的数据泄露风险。身份验证时,采集提取的图像特征进行随机切片,并与交通银行和中国银联存储的密文切片进行比对,以实现商户责任人和收银员身份的准确识别,同时不泄露各切片的原始信息,从而有效保护了商户责任人和收银员的隐私信息安全。
首个国家微生物科学数据隐私平台发布后,科学数据的互联互通成为了可能,生物大数据领域的研究也有了新的方向和可能性,这会大大加快生物医疗方面的技术进步,为我们的健康添砖加瓦。
同时,隐私计算技术的不断发展和完善,也将会在生物安全大数据领域发挥越来越重要的作用。我们也会持续关注,随时跟进隐私计算技术的最新进展!
热门文章: