查看原文
其他

字节跳动联邦学习平台Fedlearner:4个月落地开源,投放增效200%+

字节跳动技术范儿 字节跳动技术范儿 2022-05-23


1+1 如何大于 2 ?这个问题在不同场景中有不同的回答,在机器学习领域,答案是“联邦学习”。

2016 年,谷歌提出一种被称为「联邦学习」的机器学习框架——在保证数据安全的前提下,通过多方数据共同训练建模,将数据价值最大化。作为机器学习新范式,联邦学习为保证数据安全、打破数据隔离、深入挖掘数据价值提供了新的解决方案,在 B 端服务和优化广告投放、内容推荐等领域发挥着越来越大的效用。

字节跳动自 2019 年底启动了联邦学习平台 Fedlearner 的自研项目,Data、广告系统、商业产品、广告技术、专利、法务等多个团队通力合作,在今年初开源。平台支持多类联邦学习模式,整个系统包括控制台、训练器、数据处理、数据存储等模块,各模块对称部署在参与联邦的双方的集群上,透过代理互相通信,实现训练。

目前,Fedlearner 已经在电商、金融、教育等行业多个落地场景实际应用,并取得显著正向效果。

经过和项目团队的交流,今天,技术范儿要为大家呈现Fedlearner联邦学习平台的创建过程、优势亮点和未来挑战。



01

联邦学习落地广告领域

我们有独特优势


去年10月,字节跳动联邦学习平台 Fedlearner 项目启动。基于公司在推荐和广告领域拥有的机器学习建模技术积淀,团队决定以广告为切入点,探索联邦学习在广告场景中的落地。

“和市面上现有的一些联邦学习平台比起来,我们更清楚广告主的痛点在哪里,可以去做针对性地优化。”团队同学介绍说,在广告领域应用联邦学习,字节跳动优势明显。

我们的优势在于,是从做业务驱动出发的,会和广告主紧密配合,比如针对现有的投放有什么问题需要优化,基本上可以提出一对一的解决方案。

基于服务客户的平台定位,Fedlearner 的技术开发、客户合作和产品落地几乎从一开始就是同步推进的,在真正进入开发前,通过接入客户来做针对性的需求适配。

项目中负责客户接入的同学介绍了 Fedlearner 的第一个合作案例。“第一个客户是电商企业,我们首先根据需求定制了一个框架,对齐需要优化什么目标、用到什么数据、我们的平台要有什么功能才能支持去做等等,都是比较业务驱动的。”

当时我们提出了基于神经网络纵向联邦的方案,在今年2月基本完成开发,以 Fedlearner 的商标开源,并申请了软件著作权和专利,构成了之后通用联邦学习方案的基础。

到今年5月份,Fedlearner 已经帮助合作方取得了 10% 以上的投放效率增长,跑量消耗提升 15%+,电商平台 ROI 提升 20%+,Fedlearner 有了第一个 showcase


电商广告场景

推进第一个客户的定制化适配的同时,Fedlearner 也在不断进化。“我们有很多功能是根据第一位电商客户的需求特点定制化的,但是后续确定了 Fedlearner 向通用化、平台化、建设行业解决方案方向发展的思路,一些更能被大范围推广的功能点被设计出来,搭建了更通用的一个框架。”

今年的3、4月份,Fedlearner 迭代完成一个面向更多客户的通用模型。

很自然地,更多行业和客户开始接入,在电商领域小试牛刀后,团队开始探索 Fedlearner 在互金和教育行业的落地。

第一个互金客户的 case 中,基于行业特点和客户需求,我们采用了基于 PSI 数据求交和 SecureBoost 加密联邦树模型建模的方案。模型在 6 月上线后,客户反馈成本降低 15%,授信通过率提升 10%。
树模型训练

当然,过程中也遇到了系统部署复杂、拉起任务沟通成本高等等问题。为了解决这些痛点,团队设计了基于公有云一键部署、可视化 WebUI 操作、工单预授权任务的解决方案,开始开发。

Fedlearner 顺势迭代,在 8 月上线了 V1.0 版,后续的教育行业客户全部采用平台化的方式接入,部署和运维成本显著降低。在与教育行业头部客户的合作中,帮助教育客户广告跑量提升 124.73%,正价课续报人数提升 211.54%,续报率提升 32.69%,正价课续费用户获客成本降低 11.73%。,Fedlearner 的效果得到了验证。



02

技术转化收入

为客户争取商业价值收益


目前,Fedlearner 已经在电商、金融、教育等行业多个落地场景实际应用,与行业头部客户合作推动技术沉淀及收益的验证,为客户带来实打实的商业收益。

我们的合作伙伴来自各个行业,大家各自都有不同的产品特点和价值诉求,最核心的就是通过 Fedlearner 的技术让我们的模型预估得更好。为此我们做了很多模型侧的调整,比如调整模型的结构、参数,引入更多的相关特征去优化模型等等。”负责行业变现的项目同学分享了团队的思考。

Fedlearner 联邦机器学习框架

在底层技术开发和后续的迭代过程中,为客户提供更有效的技术模型,是 Fedlearner 团队的重心。

“联邦学习本身的优势很突出,它有无可比拟的天然安全性优势,它允许在原始数据不离开各自机房的前提下,双方/多方共建机器学习模型。除了安全,联邦学习的另一个关键词是合作,合作越广泛,达到的效果越好。”但优势之外,困难同时存在。


Fedlearner 在推荐/广告/UserGrowth 等场景下有突出优势,也取得了初步的成果,但这些场景存在严峻的大规模数据和训练效率的挑战

另外,在 Fedlearner 的架构中双方原始数据不可见,甚至双方可以隐藏各自的神经网络结构,但这也在安全得到极大保障的情况下加大了“可解释、可debug”的难度


面对这些技术挑战,项目团队的技术同学给出了他们的解决方案:
  • 创新机器学习算法和框架,解决模型训练过程中可能发生的泄露用户行为的统计信息等问题;

  • 攻关技术难题:快速部署(物理服务器/私有云/各种公有云等)、易于接入、一站式的通信和训练、一键式的服务能力等,不断降低参与联邦建模的技术门槛;

  • 针对公网环境做了容错优化和通信加密,并通过分布式系统提升数据处理和训练的效率

  • 自研算法并发布专利,提升联邦场景下联邦神经网络学习中的建模能力...


神经网络模型训练

技术上攻克难关,业务团队也需要在产品落地中做到极致。“当然,Fedlearner 毕竟是新的东西,推广的过程,一开始需要说服客户尝试应用,这也是必须面对的一个挑战。”项目同学坦言,在初期的合作案例中,技术、数据、方案往往需要调整很多轮。

在接入教育行业的时候,团队拜访了 6 个客户,最开始只有其中 1 个愿意接入 Fedlearner,其他都在观望。

我们能做的就是和广告主更深入地分析,甚至拉着他们的技术团队来谈。可能客户的非技术团队并不了解联邦学习,但是技术团队一起沟通就可以理解我们的技术以及数据效果。

从效果出发,拿出 showcase,更多客户就愿意尝试。现在6个客户里已经有 4 家接入 Fedlearner,数据效果反馈都不错。




03

持续优化

应对未来挑战


“市面上做联邦学习的不在少数,我们依托字节跳动广告业务的优势,在广告层面落地,在几个不同行业广告主的合作案例中产出的提效数据,已经验证了 Fedlearner 能够为客户创造商业价值。” 项目同学认为,Fedlearner 经过了生产环境的实际检验

Fedlearner 操作平台

对于实践效果,最直观的反馈是来自合作客户的好评——

- 产品完整度高

从部署到上传数据,再到模型训练&调优、在线 serving,以及实验和项目 review,Fedlearner 提供了完整友好的流程体验

- 产品效果佳

目前在与各行业(电商平台、教育、金融等)客户的合作中,Fedlearner 均取得显著正向的效果,客户对于接入产品有信心


此前,字节跳动联邦学习团队将 Fedlearner 和其他联邦学习平台的树模型在单机上进行了性能对比。通过比对 MINST 数据集上的训练指标可以看出,双方的主要差距出现在模型训练速度上,经过 5 轮迭代平均训练,Fedlearner 的训练速度有约 17.2% 的优势。


说起 Fedlearner 面对的挑战,团队中负责客户合作的同学认为,最大的挑战是“如何为客户争取可感知的最大商业价值收益”。

Fedlearner 提供了良好的安全保障,以及完整的联邦学习生态,但从“技术基础”到“最终的商业价值增量”之间,还有不小的距离。 字节跳动在机器学习领域的深厚积累,为我们的合作成功提供了坚实的保障。考虑到 Fedlearner 的合作伙伴来自各行各业行业,我们需要和客户一起站在“效果最大化”的第一线,从合作伙伴的角度设计和思考,敏捷迭代快速推进

“在目前的起点之上,希望进一步打开多个维度,帮助字节跳动的机器学习技术传递到更大范围。”团队设想了 Fedlearner 未来的发展,除了为广告客户打造不同的行业解决方案,促进数据安全的深度转换建模、提高投放效率,也能通过 To B 合作为广泛的外部客户加强 AI 建模能力

10月底,Fedlearner 发布了 V1.5 版本,在V1.0的基础上优化了交互流程,减少了客户需要填写的配置,另外还增加了可视化图表,增量求交/训练等功能。在推进客户升级V1.5平台的同时,Fedlearner V2.0 开发也已经正式启动。

↓加入我们,探索更多前沿技术!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存