产品升级|数据采建管用通,一站式搞定,实现“数”尽其用!
一、关于Dataphin
Dataphin是瓴羊旗下的智能数据建设与治理平台,是阿里巴巴多年内部实践及方法论的产品化输出,可帮助企业一站式构建生产经济、质量可靠、安全稳定、消费便捷的企业级数据资产。
1、组件化联邦学习框架(FL)
联合深度学习,差分隐私安全加固:两方各自计算,再通过交换中间结果来完成联合训练,无需共享原始数据。同时基于差分隐私技术对中间参数信息进行了加噪处理,进一步保障了安全性。
高效DAG引擎,通用组件框架:为降低联邦学习使用门槛,支持以拖拉拽组件的方式,搭建联邦学习工作流,提升交互体验。
2、安全多方联合分析(MPCSQL)
分布式SQL引擎,高效执行:将用户输入的SQL拆解成可多方执行的分布式计划,根据每个SQL算子的输入信息、算子处理逻辑、算子的输出信息染色打标,基于染色信息进行子树切割和执行翻译,生成多方执行计划,完成多方分布式SQL计算。
明密文算子分开编译,密文算子安全加固:SQL解析后生成的执行计划包括明文执行的SQL算子和密文执行的安全算子,密文算子在密态下执行,对原始数据进行加密处理,不泄漏数据隐私。
3、全同态隐匿信息查询(PIR)
基于全同态加密实现Keyword-PIR:目前实现的是基于全同态加密的Keyword-PIR方案,支持多key列和多value列查询,可以实现客户端安全(客户端查询内容无法被服务端获知)& 服务端安全(客户端仅能知道客户端查询命中的内容,除此之外的其他服务端数据客户端无法获知)。
PIR预计算及分桶切片,优化PIR性能:引入PIR预计算环节,提前对服务端的数据进行预计算,当客户端对同一份服务端数据进行多次不同的查询时,可以快速利用预计算的结果。同时在工程实现上使用了分桶切片技术,将大数据量进行分桶处理,以单桶-单桶的计算逻辑为基准,进行多pod、多分桶的调度和控制,进一步提升了稳定性和性能。
Dataphin(DataTrust)隐私计算已经在金融行业、电力行业、互联网、政务等多个行业有应用落地。
1、汽车-线索评级,引导关注高价值客户线索并快速呼出
客户痛点:获客方式主要为预约试驾/到店参观,对车企而言很难通过一次的“到店/试驾行为”评估客户是否为高意向客户。
解决方案:通过Dataphin(DataTrust)隐私计算的隐匿信息查询和联邦学习功能,完成客户和第三方数据标签的精准查询和建模。
2、阿里某业务线&外媒,精准广告营销,ROI提升300%+
客户痛点:在阿里某业务和外部媒体之间,期望通过精准营销的方式,节约营销成本,提升营销ROI。
解决方案:通过Dataphin(DataTrust)隐私计算的ID安全匹配功能,在双方数据不出域的情况下,完成阿里某业务&媒体人群圈选,只针对特定人群进行广告投放。
3、Dataphin(DataTrust)隐私计算助力百视TV释放数据要素红利
客户痛点:随着业务体量、用户数量的增长,百视TV台对智能推荐功能提出了更高的要求,尤其是对于新用户增长,难取得较好的效果。
解决方案:采用Dataphin(DataTrust)隐私保护计算的隐匿信息查询能力,在保护百视TV数据隐私的前提下,查询获取数据供应商提供的Embedding特征标签,用于后续视频推荐建模。
关于我们
往期回顾