淘宝Push智能文案生成
本文主要介绍了2021年笔者在智能文案生成项目所做的工作。
业务背景
Push是淘宝重要促活手段之一,运营同学通过投放各类营销、产品Push以达到唤端、促活目的。Push素材通常由人群、商品或者活动、文案构成,与用户有直接沟通的便是Push文案,优质的素材文案吸引用户点击起到正向促活作用,而劣质内容不仅可能影响用户体验,更甚者可能引发用户关闭通道。淘宝Push团队构建了统一投递平台方便各个业务方创建任务投放Push,为业务引流。通常业务同学在创建投放任务前进行Push文案创作,任务上线稳定投放后基本处于维护状态极少进行文案更新。Push业务整体文案多样性低,现有素材库内容同质且单一,基本基于电商视角出发,缺少创新和个性化突破;文案人工创作成本高,当前基本由平台与业务手动创建,依据个人文案创作能力进行输出,缺少丰富文案参考与创意输入;Push平台缺乏对文案的统一沉淀和推荐。历史优秀文案无法及时反馈到文案创建环节,缺乏算法智能化的文案创意。
基于以上问题,业务同学联合淘宝Push算法提出了智能文案生成项目,期望通过文案智能化生产和文案推荐,赋能文案创作、管理、实验、优化各个环节,提升文案丰富程度和更新频率,辅助提升 Push 点击率。
问题定义&思考
素材是Push的基本单元。当一条新素材产生时,用户被新奇的文案吸引点击,素材点击率也随之提升。而随着素材上线时间推移,用户对素材文案疲劳,文案长期得不到更新则素材效果越来越差。而业务方在填写 Push 文案时,也不知道当前场景下什么样的文案是更优的、其预计或历史点击效果如何,不敢贸然更新。如此恶性循环,对整个Push发展非常不利。
现阶段,NLP技术已经有了长足发展, 尤其是Bert、Unilm等等大规模预训练模型的出现,使得从技术层面自动生成高质量内容成为可能。另外,Push平台本身也积累了大量文案数据,可以用于训练文案生成模型,也可以提供给用户作为参考。基于此,我们设计出Push智能文案生成模块,帮助解决以上问题。
智能文案生成V1.0-智能生成模块
▐ 整体架构
一期智能文案生成模块由算法通过TPP服务在线上提供统一交互接口,用户选择合适业务场景的文案生成方式(话术模板生成or关键字生成)并输入关键词,TPP服务根据用户选择调用相应的二方服务生成内容并返回结果。其中,话术模板生成由模板精准匹配、生成文案质量高。关键字生成通过海量数据训练模型、生成内容丰富度高。
内容生成模块: 用户输入关键词如: 活动、场景、利益点等等, 就可以生成大量文案。辅助运营进行文案创作,提升文案多样性,同时也降低了创作成本。
文案检索模块: 将Push平台历史积累的文案处理后开放给用户。用户通过关键词检索,找到符合业务场景的素材文案,根据历史文案的点击,也能预估当前素材的点击率, 做到心中有底。
▐ 智能文案生成算法
话术模板生成模块(模板生成)
关键字生成模块(模型生成)
实验结果评估
我们在调研了多个业界内容生成工具评估指标后,结合淘宝Push智能生成业务总结了以下几个方面的评估指标:
表达相关性。主要看生成内容是否与切题,是否与用户输入标签相关。该指标可借鉴机器翻译常用评估指标BLEU进行评估。BLEU计算生产文本与关键词中共同n-gram数量计算两者相似度。
表达通顺性。生成内容是否通顺,是否与人工生成内容质量齐平。该指标主要通过人工评估文案质量,构建相应质量打分模型进行评估。
表达创新性,评估生成内容与训练样本的重合度。其中,与表达丰富度对应的主题相关 n-gram多样性实验结果如下。(M*代表不同模型,bs表示beam search的beam大小),数字越大表示内容丰富度越高。
▐ 优化迭代
文案生成重复问题
解码“迷失”
我们在解码过程中发现当一个商品输入关键词过多时,通常生产效果非常不好。如输入内容:“普通望远镜 户外 袖珍 单筒 迷你 高清”,生成的结果是“迷你袖珍单筒,高清防水,防水防紫外线,防水防雾”。造成此类问题的主要原因是输入关键属性过多,模型注意力无法集中在某些重要属性,出现解码“迷失”,生成内容异常。针对此类问题,我们的主要解决方法是:在离线构造样本时,通过将输入内容规范化为特定几个属性输入,使得模型训练时能够聚焦于其中的重要属性。线上部署时,利用NLP工具将用户输入关键词进行拆解。提升输入丰富度同时减少解码“迷失”。
通过该方式,有效提升生成结果多样性以及采纳率,采纳率由85%,提升至90%+。
长尾商品训练不足
众所周知,由于“头部效应”影响往往少数几个类目能够获取大量关注与流量,而运营同学更偏向于为大众化的品类创作文案。统计发现10%的头部类目如连衣裙、T恤等有充足文案数据, 占据训练样本的80%以上。而大量长尾商品存在训练数据少或基本无可用素材。导致模型无法学习该到该商品特定内容,模型生成的文案质量差。
我们通过结合商品父类目、规范类目属性提升模型泛化能力。如加入 商品关联一级类目、商品叶子类目属性等等。进一步提升长尾商品文案生成质量。
▐ 总结
在智能文案一期工作中,我们完成了智能文案生成项目从0至1的搭建工作,包括算法方案设计、离线模型搭建、二方服务部署、Tpp服务开发、算法优化迭代等等,整体项目顺利上线。从业务角度出发主要解决如下几个问题:
解决了Push文案生成多样性不足问题。通过模板生成和模型生成方式,提供大量优质生成文案。线上平均单个素材文案条数提升17%。辅助运营同学进行文案创作,降低人工创作成本。与用户一对一调研中反馈显示2/3用户采纳智能文案生成模块生成内容并应用于线上。
构建统一的文案管理和沉淀平台。智能文案生成模块使得历史的优秀文案及时反馈到在线文案创建环节,同时提供算法智能化的文案创意。
提升Push点击。文案生成线上AB实验结果显示,算法组相对提升10.16%。
智能文案生成V2.0-淘宝Push文案层
智能文案一期主要围绕辅助用户创作这一目标进行,在整体模块设计中主要关注营销类Push文案的生成,包括模板话术生成、关键字生成。这两个模块在项目上线后都取得了不错的成果,然而在深入推广过程中也遇到了很多困难。Push素材更新本身频率较低,虽然有智能文案生成模块这一创作利器,仍然无法全面调动用户更新积极性。另一方面,用户在使用智能文案生成模块辅助内容创作时,多数时候会对文案进行修改且不会主动反馈,这使得我们的埋点追踪变得愈加困难,没有正向反馈的生成模型优化迭代非常有限。同时,我们也发现在淘宝Push中存在大量商品个性化推荐素材,其发送量约占总体发送的60%以上。由于此类个性化素材商品池庞大,通常运营同学会配置简单模板作为Push文案。为了适应所有商品,这类模板通常是欢迎语+商品标题的形式,整体投放量大但吸引力不足、点击率低。如果能为这类商品推荐素材提供个性化内容生成能力,将会对提升Push点击率有极大帮助。且自有文案投放可以精确埋点,感知用户反馈,灵活优化模型。
这些原因促使我们对智能文案生成做进一步的升级优化,由此设计出智能文案生成2.0版本-淘宝Push文案层。我们在淘宝Push算法推荐链路的召回、粗排、精排、重排最后加入文案层做多文案优选。文案层整体链路如下:
智能文案生成V2.0-淘宝Push文案层链路
淘宝Push文案层优化链路主要由数据源收集、数据处理、物料库更新、内容生成、内容排序、线上服务部署等几个模块构成,其中数据处理、内容生成等模块复用一期沉淀的能力,并将多渠道数据分别处理方式抽象为统一处理组件。下面重点介绍我们在物料库建设以及内容排序模型优化探索的一些工作。
▐ 物料库构建
数据决定模型上限,优质丰富的文案内容是训练高质量生成模型的基石。为此,我们收集了多个渠道、不同风格的个性化商品文案。加入文案物料库中以供后续内容生成模块使用,对于适合作为Push投放文案的数据加入文案池中,作为候选文案在线上与生成文案一起排序打分。
文案渠道来源主要有人工创作和模型生成。人工创作文案质量高但数据量有限,模型生成渠道主要是在淘宝不同场景下由算法生成风格各异的文案,此类文案数据丰富但是质量不高。所有渠道文案经过数据处理模块清洗后更新文案物料库 。由于资源限制,自有生成模型日产出数据量有限,且文案风格较为固定。物料库建设极大扩展了商品个性化文案数据量。丰富多样的文案素材为后续文案排序优选和生成模型迭代奠定基础。
▐ 内容排序模型
【旗舰店】森海塞尔MOMENTUM真无线二代主动降噪蓝牙耳机官网
sony索尼wf1000xm4真无线蓝牙主动降噪耳机入耳式降噪豆1000xm3
B&O Beoplay EQ真无线蓝牙主动消噪耳机入耳式运动耳塞bo降噪豆eq
Bose博士消噪耳塞真无线蓝牙降噪耳机麦主动降噪运动耳机大鲨鱼鳍
.....
商品基础特征,主要是商品一级类目、二级类目、叶子类目、商品标题内容切分等等。
文案特征,主要由文案内容切分、文案来源、关键属性信息等等组成,
用户特征,由一般社会学统计特征、用户端内行为特征、长短期类目偏好特征、浏览行为序列组成。这里用户浏览序列特征与一般构造商品浏览序列不同,序列内部主要突出商品文案以及属性信息。模型主体结构如下:
▐ 小结
总结
参考文献
Devlin J, Chang M W, Lee K, et al. Bert: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018. Dong L, Yang N, Wang W, et al. Unified language model pre-training for natural language understanding and generation[J]. Advances in Neural Information Processing Systems, 2019, 32. Radford A, Narasimhan K, Salimans T, et al. Improving language understanding by generative pre-training[J]. 2018. https://en.wikipedia.org/wiki/SimHash
团队介绍
我们是来自淘宝智能部的用户增长算法团队,团队定位于为淘宝平台用户运营业务提供算法服务,我们的工作内容包括RTA/RTB站外广告投放、新客潜客站内承接、PUSH推送优化、权益智能分发等。我们是一支正在快速成长中的学习型团队,在计算广告/推荐引擎/运筹优化/自然语言处理等算法领域深耕多年,创造业务价值的同时也关注个人技术成长,欢迎感兴趣的小伙伴加入。简历投递至kena.gkn@alibaba-inc.com