查看原文
其他

开源工作组 | 成员项目进展(2022.09-2022.11)


隐私计算联盟开源工作组首批成员项目于9月底加入,工作组定期发布成员项目的阶段性的进展或动态,包括项目当前状态,软件功能升级和社区运营动态等,帮助大家了解各项目的最新进展。


隐语SecretFlow


隐私计算开源框架“隐语(SecretFlow)”,全面集成众多隐私计算技术,以安全、开放为核心设计理念,可从技术层面解决数据流通中的数据安全和隐私保护问题。通过良好的分层设计及开箱即用的隐私保护数据分析及机器学习等功能,降低隐私计算开发者和使用者的技术门槛,助力隐私计算更广泛地应用到AI、数据分析等场景中。

github地址:

https://github.com/secretflow/secretflow/

项目状态

Star 1056, fork 147, watch 37

进展概述

在11月隐语上线了V0.7.11新版本,更新包括在基础设备层、多方安全计算算法、联邦学习算法等方向,增加了算法或进行了优化。

新版升级

多方安全计算:

支持典型金融场景全链路算法,包括各种业务中需要的单方特征功能和评估算法:如评分卡、模型评估、全表统计、特征稳定性(PSI),模型稳定性(PVA)算法等。

ECDH-PSI新增支持SM2、Secp256k1、FourQ等多种椭圆曲线选择。


联邦学习:

1. 垂直场景下,拆分学习支持多方(n>=2)NN联合训练;对于基于Tenserflow的拆分学习模型计算执行图逻辑进行了优化,性能提升数倍;

2. 水平场景下,水平联邦 XGB算法支持离线预测、模型微调(finetune),支持基于pytorch的神经网络分类和回归算法;

3. 水平和垂直算法支持差分隐私增强。


基础设备层:

HEU开放硬件加速接口和算法向量化调用接口,优化对接加速硬件的性能。



文档管理

1. 社区文档调研及针对性优化

隐语开源发布后,即面向社区开发者上线项目建设调研问卷,针对开发者提出的优化文档结构、增加代码示例等需求,在隐语V0.7版本中进行优先建设:提供中文化文档、优化文档结构以支持开发者更顺畅的体验,并丰富了算法和架构设计说明,在后续的V0.7.11中又进一步针对金融全链路算法完善 ,面向开发者发布了配套的交互式教程。

https://secretflow.readthedocs.io


2. 发布隐语PSI benchmark 白皮书

为了方便了解隐语的Benchmark,开源社区在11月发布了隐私集合安全求交得10分钟上手手册,包含了亮点介绍、SecretFlow集群的易用搭建、Benchmark脚本、两方和三方的Benchmark,以便开发者与开源用户调研时方便拿到可度量的性能数据和可复现的路径。


社区活动

1. 会议活动

2022年11月5日,隐语开源社区与隐私计算联盟、DataFun社区开展联动,在北京举办了首次线下Meetup,与开发者进行现场交流,来自中国信通院云计算与大数据研究所、蚂蚁保险理赔科技、阿里安全双子座实验室、隐语开源技术指导委员会的嘉宾与现场40+位、线上2000+位开发者围绕「对隐私计算技术路线的思考与融合构建」进行了探讨。隐语开源社区也将开发者活动中的内容,通过文字、视频集中沉淀,通过线上公开渠道持续与开发者共享知识资源。


2. 人才培养

2022年11月29日开始至12月底,隐语将开展「隐私计算线上慕课」,联合清华大学、上海交通大学、浙江大学、弗吉尼亚大学高校学者与蚂蚁集团、阿里CRO双子座实验室、阿里巴巴达摩院产业代表联袂出品21门课程。


该系列课程旨在通过技术科普与实践应用相结合的方式,面向全社会提供一套集中的、开放的、系统化的隐私计算学习资源,并面向全社会公开共享课程资源。通过产学研经验结合,不仅关注新兴学科知识的科普性易学性,还强调技术的实用性,基于隐语框架专门开发了「动手实践」课程,以帮助利用隐私计算技术解决实际数据隐私问题,为社会培养一批数据应用性人才。



Apache Teaclave


Apache Teaclave是由百度发起的一个基于硬件安全能力的通用安全计算平台。秉持为隐私数据计算赋能,让安全计算更简单的理念。Teaclave 基于硬件安全能力(Intel SGX),确保了敏感数据在可信域外和离岸场景下安全可控的流通和处理,无需担心隐私数据泄露和滥用。Teaclave 还包含 Teaclave SGX SDK 和 Teaclave TrustZone SDK 子项目,为安全、高效开发可信应用提供 Rust 开发环境。

Github地址:

https://github.com/apache/incubator-teaclave

项目状态

Star 638, fork 141, watch 50

新版升级

近期完成了底层数据库升级与CI重构

1)升级了存储服务的底层数据库leveldb-rs,合入开源leveldb-rs最新的修改,并添加对SGX的支持;

2)重构CI,升级codeql, runner image和actions/checkout版本,通过使用多个job来运行测试,提高测试运行的并发度,与重构之前相比,运行时间缩短一半。


生态建设

20221018日,Apache PPMC接受Java Enclave到Apache Teaclave (incubating)孵化的提案


Teacleve Java TEE SDK是一个Java保密计算编程框架。它遵循IntelSGXSDK定义的主机和飞地(Enclave)分区编程模型。Teacleve Java TEE SDK提供了一种将Java项目划分为主机和飞地模块的优雅方式,其中飞地模块是用户定义的服务接口的提供者,与Java SPI模型类似。Teacleve Java TEE SDK可以帮助您高效地开发和构建Java机密计算项目。




Mpc4j


mpc4j(Multi-Party Computation for Java)是主要用Java实现的安全多方计算(MPC)协议库。mpc4j的目的是提供一个接口统一的MPC学术库,帮助研究人员研究并开发MPC协议。mpc4j支持aarch64的CPU(如MacBook M1)、支持商用密码学算法

Github地址:

https://github.com/alibaba-edu/mpc4j

项目状态

Star 75, Fork 15, Watch 10

进展概述

2022年11月14日发布1.0.5版本。三星公司对mpc4j实现的PSU方案开展性能测试并报告了性能指标,相关内容已更新在README中。

新版升级

1)应用Java的Rings和C/C++的NTL实现论文《SpOT-Light: Lightweight Private Set Intersection from Sparse OT Extension》(CRYPTO 2019)的批处理多项式插值算法;

(2)参考Java的curve25519-elisabeth算法库实现Java的Ed25519和Ristretto椭圆曲线;

(3)参考Ed25519的Go算法库实现Curve25519的Elligator编解码算法;

(4)应用SEAL实现XPIR(PETS 2016),使XPIR可在aarch64架构下执行;

(5)应用SEAL实现基于FHE的高性能乘法三元组生成算法(CANS 2019)。



生态建设

论文《Linear Private Set Union from Multi-Query Reverse Private Membership Test》的mpc4j实现获得USENIX Security 2023代码可访问(Available)、功能可实现(Functional)、结果可复现(Reproduced)徽章。



- END -



往期推荐01

发布|2022隐私计算十大观察

02

中国信通院牵头的联邦学习评估方法国际标准在ITU立项成功

03

视野 | 基于秘密分享和随机排列的安全高效机器学习

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存