引言
在当前行业形势下,降本增效已经是公认的命题,粗放扩张的时代已经过去,接下来是在从业务到技术都需要精细化管理的时代。但在这个命题下,往往未被提及的一点是用户价值。如果为了降本增效,而牺牲了用户价值,激烈竞争下,企业是否还能留住用户?
专家介绍:
赖洪科OPPO互联网应用研发平台及推搜算法部总经理,有超过14年的互联网广告研发经验,主导OPPO广告播放系统、搜索引擎等多项研发建设,也同时负责厂商应用体系数据搭建等工作。目前负责OPPO软件商店、游戏中心等研发工作,同时负责推搜部门整体技术探索及应用。他们面对的是跨度极大的场景,却仍然实现了深度的用户价值。在应用分发场景中,OPPO需要解决的核心问题是,如何提升软件商店的App下载量和用户付费转化率。最直接的方法,就是通过推荐系统提高App的曝光量。但难点在于,对于推荐系统而言,应用分发和其它典型场景比如电商购物的差异性太大了。差异性主要在于跨度,包括金融、物流、出行、电商、游戏、社交等类目,应用分发的场景跨度是行业级别的,也就是说,跨度要至少大一个层级。这种差异,正如软件商店通常作为手机操作系统第一个软件,而后才会有专用于购物、打车的其它软件。既然是“第一个软件”,那么作为手机操作系统的一个交互枢纽,应该在数据上有优势才对不是吗?然而,由于App下载场景偏工具性,不像电商购物那样用户经常会有闲逛的习惯从而能沉淀很全面的数据,所以交互是很稀疏的。并且,从价值转化的角度,其链路也很长,“用户在电商场景一般有明确的付费意图,同时电商场景的转化链路比较短,比如经过浏览、加购物车、下单、付款等阶段就可以完成转化。但是在应用分发场景下,链路会非常冗长。从广告主的角度,除了基本的曝光、点击、下载,还需要考虑更深层的激活、付费、留存等链路。”OPPO互联网应用研发平台总经理赖洪科表示。除了软件商店之外,游戏中心的应用分发也有自己的独特性,“游戏里面通常会有大R用户,大R用户付费量极高,其行为会直接影响或污染很多数据,比如对10个用户做推荐,有1个人产生了付费,其可能带来的价值比1000个人都高。这些行为直接影响很多实验数据和建模数据,从而影响对普通用户的价值挖掘。”总体而言,游戏的LTV预估对于整个游戏行业,包括OPPO以及游戏厂商仍然是很大的挑战。除此之外,应用分发还面临请求维度、场景维度等难题。所以,OPPO即便拥有海量数据,但在这样的数据中掘金并不简单。▼
02.
全场景统一建模:填补稀疏空间
场景跨度大的海量数据带来的首要问题是数据稀疏,而推荐系统乃至传统数据运营固有的飞轮效应,反过来也反映出对稀疏场景特别不友好。
这在OPPO的应用分发场景中体现的尤其明显。“不限于软件商店的话,应用分发包括了接近20个场景,每个场景之间的数据是割裂的。有一些场景的流量特别小,导致特征很稀疏,怎么估都估不准。”
“在一个场景上面做到最优始终是有局限的,我们希望多场景增强助力所有场景提供都提供最优质的服务。”为此,OPPO在推荐系统中落地了全场景统一建模技术。
以软件商店和游戏中心为例,相比之下,软件商店的用户量大、画像较宽泛,而游戏中心的用户画像更精确。因此,很自然的一个疑问是,两者能不能互相补充。“我们在开发游戏中心推荐功能的时候,做了一个模型,上线之后效果无论如何都达不到预期。最后发现,原因就在于用户的行为非常少。这个时候软件商店的数据就是一个极大的补充,因为我们可能有 85% 以上的下载都会在软件商店发生,所以它有最丰富的下载数据,并包括了下载类目、实践、兴趣等维度。”
基于软件商店的数据增强,可以带来成倍的效果提升,“我们看到这个结果的时候,就更加坚定要做这个事情。”这就是OPPO所打造的实现全局特征共享、全局样本融合的数据底座。
将软件商店、游戏中心等所有场景打通之后,全局特征共享的 KV 存储从2T 扩展成了30T,特征规模也从1亿扩展成100多亿。通过多场景的数据互融互通,使到各种场景的泛化能力变得更强。大底座设计的思想可以说是工程建设的高级玩法,这通常是某项基本能力成熟并标准化、普适化从而独立的结果,类似数据湖架构、云原生架构,以及当下流行的大模型+小模型的LLM工程架构的诞生。但数据底座终究是一种通过共享提升效率避免重复建设的设计,并不能保证对用户的精准适配,为此,还需要将数据底座结合针对垂直领域的个性化网络,才能更好地进行推荐。”例如在游戏中心,可以很容易发现刻画用户玩游戏的兴趣偏好,但是玩哪个游戏不是重点,用户为哪个游戏付费,才是非常个性化的特征,从而可用于增加整体流量的价值。“正如大模型+小模型是“共性+个性”的组合,OPPO的推荐架构也不例外。将全局网络之上融合个性化局部网络,得以在共享的基础上表征任务间的相关性和差异性。
这种设计下,除了应用分发推荐的效果提升,效能提升也是显著的。比如算法迭代上免去了大量数据打通工作,部分场景原本需要超过10个人的团队支撑,现在仅需要2-3个人。总体而言,随着推荐算法模型越来越透明,在业界落地中,算法与工程的协同设计才是落地的核心工作,“怎么把模型结合场景或者业务,将价值最大化,关键在于数据能不能支持到位,工程能力能不能跟得上。”
OPPO在推荐系统上的效能提升工作,并没有以牺牲用户价值为代价,反而对后者进行了更深层次的挖掘。
比如前述提及的oCPX能力,这是一种智能控价的能力。广告的收费方式通常是观看即付费,投入产出比极低,对于广告主很不友好。推荐系统带来的定向投放能力对于广告投放的精准度提升是革命性的,但初期仍然局限在观看即付费的模式。oCPX正是为了弥补这一缺陷诞生的。oCPX可以让广告主选择明确的优化目标,比如观看、下载、注册、付费等,系统可以通过算法预估每次投放的转化率,结合期望成本,自动出价,从而保障成本效果稳定。oCPX的技术可谓相当卷,在OPPO看来却是不可或缺的能力,这种敏感度源于OPPO很早就有应对转化饱和的经验。在移动互联网发展早期,OPPO发现软件商店的用户转化即将见顶,“软件商店是工具型的,意味着它容易稳定,稳定之后用户就没有别的诉求了。这时再想继续将流量提升就会遭遇瓶颈,瓶颈在于效率,也就是人的效率远远不足,光靠常规产品开发是不可能进一步突破的。”因此,在2015年,OPPO在软件商店中引进了推荐算法。从2015年开始,OPPO推荐算法分别经历了浅层机器学习模型、oCPX能力、神经网络,以及如今的全场景统一建模等发展阶段。oCPX能力对广告主友好,可以控制投放成本,但对算法平台的要求很高。比如对于应用分发4个模块(首页、热搜、相关推荐、下载更新页)的5个转化指标,即os激活、回传激活、回传注册、游戏注册、游戏付费,就可以组合成4*5=20种CVR预估模型。这会导致模型数量过多、难以维护,深度转化(比如游戏付费)的CVR样本稀疏,模型之间难以共享特征等难题。但这些恰好用前述提到的全场景统一建模方案就可以解决。具体而言,OPPO采用了MMOE的建模方式,让浅层目标和深层目标共享embedding,从而极大减少模型数量,同时保证甚至提高了转化率。其中,目标越深,也就越需要偏置更强的个性化网络进行建模。oCPX能力的建设一方面节省了广告主的投放成本,另一方面也减少了手机用户的打扰。针对手机用户,OPPO还在算力层面进一步提升用户服务。在国内,算力系统的首要难题就是,如何在算力基础设施不变的情况下,提供更优质的服务。削峰填谷是最常见的做法,但OPPO的业务场景一般不适用这种做法,其各类业务周期性一致,难以通过弹性扩缩容进行业务间资源错峰腾挪;并且,流量价值差异大,用高成本复杂模型承接低价值流量,则ROI可能不高。“在弹性扩缩容里,可能会在部分业务之间削峰填谷,这是一种方案;另外一种是在高峰的时候不停的进行资源伸缩,但这对系统的要求是要跟基础设施都非常紧密结合才能达到这一点。但往往我们的业务特点是波峰特别明显,所以在波峰的时候通常不能依靠其它业务的资源弹性来补充算力,这才是最现实的问题。”除此之外,还需要面对高峰场景下随时可能出现的流量过载,稍不留神系统就崩溃了,这是最基本的问题。
为此,OPPO首先设置限流阈值,通过随机丢弃过载流量的方式,并且适应硬件的具体情况,实现动态的限流阈值,保证系统稳定性。下一步,为了保证服务质量,OPPO在算力系统中采用了用户运营的典型打法,即用户分层。对于一些低价值流量进行适当限流,从而保证高价值流量的维护。通过这种方式,在同等资源下,流量支撑上涨了15%,以及营收增长15%,“这是一个非常有诱惑力的数字。”这些优化造就了智能算力V1.0。然后,OPPO进一步对流量进行“打假”,“我们对流量实现了个性化价值预估,目的就是找准真正的 VIP 用户,并对低价值流量提供降级服务。”此即智能算力V2.0,在这个阶段,并没有对低价值流量进行限流。该系统在相同的资源下,流量支撑提升20%,同时营收进一步增长。到智能算力V3.0时代,又该怎么走?一个很简单而普适的洞察是,20%的流量承载了80%的流量价值,因此,最直接的做法就是进一步提升VIP用户的服务质量,在这个阶段,高质量用户将获得增配算力。从V1.0到V3.0,从用户视角是一个无感优化到质量提升的过程,OPPO在最大程度上兼顾了降本与增值。
模型建设上搭建公共层,用户转化上追求极致精细化,用户服务上遵循价值与资源适配的原则,OPPO在工程上达成了优越的权衡能力,并将业务思维融入到了工程设计的方方面面,实现了降本与增值两不误的局面。
当然,原本这两者并不是冲突的,但如何克服复杂性并一步一步地从技术到工程到业务去落地,则是难得的功力。- End -
访谈人:赖洪科 OPPO互联网应用研发平台及推搜算法部总经理