外卖商品的标准化建设与应用
总第452篇
2021年 第022篇
1. 背景及目标
2. 业界调研
3. 问题分析及挑战
3.1 个性化问题
3.2 录入不规范
3.3 粒度无行业标准
3.4 认知局限性
4. 方案
4.1 名称聚合
4.2 匹配映射
4.3 文本匹配
5. 在外卖业务中的应用
6. 总结与展望
6.1 词表及同义词优化
6.2 层级结构合理化
6.3 核心标准名建设
7 参考文献
8. 作者简介
1. 背景及目标
商品作为外卖交易过程中的核心要素,决定了供需匹配的精准度,直接影响交易行为是否可以达成。外卖平台美食、甜点、饮品类在线商品有亿级之多,其中很多是属性信息一致的相同商品。建立对商品的标准化描述、聚合相同商品,是很多业务场景的诉求。
① 供销分析场景:想分析一下望京的商家都售卖哪些菜品,有多少商家卖“西红柿炒鸡蛋”?
遇到的问题:由于菜品是非标品,并且商家对菜品命名的个性化程度也较高,因此在外卖平台,同一个菜品名出现不同的命名方式;例如“西红柿炒鸡蛋”有西红柿炒蛋、小番茄炒蛋、西红柿鸡蛋、京城三绝~番茄炒蛋【正价小份菜】等,没有办法简单通过关键字进行聚合。
② 主题推荐场景:想出一个菜品粒度的主题,快速筛选“小龙虾”、“烤鱼”、“鸡公煲”、“黄焖鸡”等热门菜品?
遇到的问题:商品分类的颗粒度不够精细,无法快速找到适合颗粒度的菜品。
③ 商家上单场景:像“鱼香肉丝”这样普遍的菜品,每个商家上单都需要录入食材、口味、做法、菜系、荤素等标签,录入成本较高,能不能像淘宝一样,选择“iPhone 12”,它的属性就能够自动关联。
遇到的问题:没有将菜品的属性标准化,菜品和属性之间没有关联关系。
基于上述业务应用的痛点,启动外卖商品的标准化建设。目标是建立商品的标准化名称,实现对相同商品的聚合,从而为业务提供合理粒度的概念划分,赋能运营端供销分析、用户端个性化召回排序、商家端标签生产。
2. 业界调研
对于业界的参考,主要参考淘宝标准化SPU建设。SPU在淘宝体系中决定了商品是什么,是商品信息聚合的最小单位,由关键属性+绑定属性来构成。
关键属性:用来约束和定义一个商品的,比如iPhone X,决定他的就是“苹果”这个品牌和“X”这个系列。 绑定属性:是关键属性的补充和细化,比如当iPhone X已经明确了这个产品后,其他的属性也确定,比如网络模型,屏幕尺寸等,进一步补充这些属性内容,逐步明确了一个产品。
可见淘宝对于SPU的建设,实际上是对属性的建设,例如格力空调S1240,通过“格力”品牌、“空调”类目、“S1240”型号来标准化、唯一化。
但对于餐饮行业,对于核心属性食材“牛肉”、做法“炒”、口味“辣”,都无法确定是什么菜,更谈不上唯一化;但如果通过“小炒黄牛肉”来标准化,行业/用户对其有普遍的认知,较固定的食材口味做法,适合用来进行标准化。因此淘宝是标准化属性,而餐饮是标准化菜品名称,所以我们称之为标准菜品名。
3. 问题分析及挑战
淘宝的标准化主要针对标品,而餐饮标准化都是针对非标品,难度较大,面临着个性化问题、录入不规范、粒度无行业标准、认知局限性等挑战。
3.1 个性化问题
餐饮商家可以较低成本的自定义生产,个性化程度较高,同一个菜品在不同商家的命名可能不同,需要大量的同义词聚合,而同义词的召回是最大的难点(如何将潜在的同义词挖掘出来进行标注)。例如,京城三绝-番茄炒蛋【正价小份菜】、西红柿炒蛋(小份)、小番茄炒蛋、西红柿炒土鸡蛋(小份),都表示“西红柿炒蛋”这个商品。
3.2 录入不规范
商家在录入商品名称时,存在缺失关键信息的问题,例如“缤纷水果”是水果拼盘、饮品还是披萨,“韭菜鸡蛋”是包子还是饺子。除商品名称外,需要借助商家分类,商品左侧栏tag等相关信息,对名称进行推理和补全。
3.3 粒度无行业标准
在进行标准化处理时,没有统一的标准,粒度难以把控:过粗容易产生非菜品错误(例如:“香辣鸡腿”->“鸡腿”),过细则标准名内聚性偏弱(例如:“传统黄焖鸡【大碗】”本身粒度过细,需要提炼到“黄焖鸡”)。
3.4 认知局限性
中华美食文化博大精深,对于一些不为大众所熟知的小众或者地方特色菜品,需要具有一定的专业背景知识,例如“炒鸡”也是一个标准的名称,还并非商家没有填写完整。
4. 方案
商品标准化的整体方案如图所示:首先,基于美食、甜点饮品类商家全量在线的亿级商品,通过名称清洗、置信度判别、人工检验,获得近菜名主干;通过同义词挖掘,对主干名进一步聚合压缩,映射到标准名主词上;对于单个商品,进行名称纠错、清洗,通过模型匹配,建立商品-标准名的映射;为了满足不同业务场景的聚合粒度要求,通过上下级关系挖掘、深度遍历,进一步构建标准名层级树。分别对名称聚合、匹配映射、层级构建三个模块,涉及的算法模型进行介绍。
4.1 名称聚合
清洗后的主干名仍然存在很多同义说法,比如土豆烧牛肉、牛肉烧土豆、洋芋烧牛肉、小土豆烧牛肉,表示相同的商品。目标通过挖掘这种潜在的同义关系,进一步提升名称的内聚性。在迭代过程中,先后采用了规则匹配和语义匹配的方法,挖掘潜在同义词;聚合后,根据流行度判别其中的主词,并将原始主干词映射至标准名主词上。分别对两种同义词挖掘方法介绍如下。
4.1.1 规则匹配
一期首先采用了规则匹配的方法,利用NER模型对主干名进行成份识别,结合知识图谱构建的属性同义词表,判别两个主干名是否是同义关系。
如图所示,其中“牛肉烧土豆”通过名称解析得到牛肉-食材,烧-做法,土豆-食材;“洋芋烧牛肉”通过名称解析得到洋芋-食材,烧-做法,牛肉-食材。对比两个主干名的成份词,其中土豆和洋芋是一对同义词,其余成份相同,进而获得二者之间是同义关系。
通过这种方式,挖掘了十万级同义词。根据标准名覆盖的商品供给数计算流行度值,将更流行度高的作为主词;人工校验后补充到标准名体系,提升了名称的聚合度。
4.1.2 语意匹配
由于规则匹配挖掘到的同义词有限,比如“担担面”和“担担汤面”,根据NER模型,担担面和汤面都会被识别成类目。如此,两个主干名是无法建立同义关系的。
我们二期调研了一些匹配模型,借鉴搜索算法组的经验,采用BERT+DSSM的语义匹配模型进行同义关系的扩覆盖。如图所示,首先基于一期积累的同义词,通过组内生成正例、跨组交叉生成负例的方式,构造百万级样本,训练了一版基础模型;为了进一步优化模型性能,通过主动学习和数据增强两种方式,对样本数据进行了迭代。
主动学习的方式是先利用基础模型,圈定一批待标注的相似样本,交与外包标注,将标注正确的样本补充至已有同义词中,标注错误的样本作为负例加入训练集,用于模型的优化迭代。通过主动学习的方式,补充了万级样本,模型准确率取得了明显提升。
进一步分析结果,我们发现了一批很有特点的Bad Case,比如红烧狮子头和红烧狮子头盖饭、香椿拌豆腐和拌豆腐等,它们都属于字面相似度很高,但核心成份不同的匹配错误。基于这个特点,先根据字面距离圈定了一批字面相似度高的样本,再利用名称解析模型对它们进行成份识别,找出其中的负例。通过这种方式,在不增加标注成本的情况下,自动补充了十万级样本,进一步提升了模型准确率。
利用语义匹配模型,新增了十万级同义词,进一步提升了标准名的内聚性。
4.2 匹配映射
在挖掘到的标准名词表和同义词基础上,为亿级在线商品建立“商品-标准名”映射(如“招牌蛋炒小番茄(大份)”映射到“西红柿炒鸡蛋”),以实现对相同商品的标准化描述与聚合。采用“文本+图像”相结合的匹配模型,覆盖了绝大部分的美食、甜点饮品类商家的在线商品。
4.2.1 文本匹配
文本匹配流程如图4所示,整体上包括召回、排序两个阶段。首先,对商品名称中的规格、分量等描述信息进行清洗,将清洗后的商品名和标准名进行2-Gram切片,通过关联相同切片的方式召回待匹配的标准名;基于召回的标准名,通过计算Jaccard距离,保留其中Top 20的标准名;在此基础上,利用BERT向量化模型,生成商品名和标准名的向量表示,通过计算Jaccard字面距离以及Cosine向量相似度,获取其中综合得分最高的标准名。
其中,BERT向量化模型是基于上文提到的同义语义匹配模型,通过级联一维类型编码的方式,对标准名和商品名加以区分,改造成非对称的标准名匹配模型。之所以进行这一改造,是因为与同义匹配不同,标准名匹配是非对称的,如应该将“香锅盔”匹配上相对抽象的标准名“锅盔”,而不是匹配上一个更加具体的标准名“五香锅盔”。改造后,匹配准确率提升显著。
4.2.2 图像匹配
由于菜品名称长度有限及商家命名不规范,会导致仅从菜品名称中获取的信息有限,而无法建立到标准名的匹配。通过引入商品图片信息,提升对文本信息不全商品的匹配准确和覆盖。
图像匹配采用的是多分类模型,根据标准名层级聚合(详见3层级构建)后的顶级、二级,选择待匹配的标准名标签,并根据文本匹配结果构造样本集。由于采用大规模非人工标注样本,不可避免地要解决样本噪声问题。在本场景下,噪声主要有两个主要来源:一是文本信息不全,导致样本标签错误;二是由于顶级、二级聚合程度高,导致分类粒度过粗,需要细分多个标签。针对这些问题,采用样本和模型迭代优化的方式,根据基础样本集训练初版模型,利用模型挖掘噪声数据,人工校验后进行模型微调。如此迭代,实现低标注成本的模型优化。
图像分类模型选取了对MBConv模块的参数进行精细化调整的Basebone网络Efficientnet,通过调整网络的分辨率、深度、宽度,确定最优组合。噪声挖掘方法首先通过Metric-Learn的方法,学习获得每个类别的聚类中心,及类内样本与聚类中心距离的均值、方差、中位数,对其进行排序挖掘出类内离散度较大的类别;再借助分类模型在验证集上的预测、O2U-Net和Forgetting Event 挖掘样本噪声。通过上述方法优化模型,提升对噪声样本的鲁棒性。
4.3 层级构建
推荐场景下,为了保证用户的个性化和多样性体验,需要对商品进行合理粒度的聚合。对于商品列表排序场景,现有的类目过粗会导致多样性不足,标准名过细又会导致结果重复。目标是建立一个层级化商品体系,为业务提供合理的聚合粒度。通过关系挖掘、层级遍历,构造万级顶点的层级树,支持了商品列表、美食排行榜、交互式推荐等业务的上线和优化。构建方法包括规则匹配和模型判别,分别对这两类方法进行介绍。
4.3.1 规则匹配
规则匹配方法是基于已有的NER模型和属性词表,通过结构化匹配的方法,挖掘到十万级上下级关系,进一步遍历生成万级顶点的标准名层级树。这种方法比较简单且基于已有工作,开发周期短,在项目初期快速支持上线,并取得了明显的业务收益。
4.3.2 模型判别
规则匹配方法由于NER模型错误和属性词关系缺少,导致挖掘到的关系有限,需要通过判别模型进一步提升泛化性。基于BERT的关系分类模型如图8所示,对待分类一对标准名用[SEP]进行拼接,并在开头增加[CLS]标识符;将拼接结果编码后,传入BERT模型,取出[CLS]位的Embedding;再接一个全联接层和Softmax层,输出关系分类结果。标准名关系包括:同义、上级、下级、无关系,一共四个类别。
样本数据包括简单例和难例两部分,其中:简单例基于已有同义词、上下级,以及同义词组间交叉生成无关系,一共构造百万级样本;在此基础上,进一步利用已有的向量化模型,召回相似度较高的标准名对,交与外包标注其类别。第二类样本更加贴近实际分类场景,且属于混淆度较高的分类难例。
利用第一类样本预训练初版模型,并在此基础上,利用第二类样本对模型进行微调,进一步提升了分类模型准确率。经人工校验,进一步补充了万级词关系。
5. 在外卖业务中的应用
标准名作为品类和商品的中间层,为业务提供了更加丰富、合理的聚合粒度,支持了流量转化的策略优化,以及系列产品形态的开发上线。商品列表通过接入标准名层级,实现对商品合理粒度的聚合,解决了线上商品重复的问题;标准名作为基础数据,支持了美食排行榜的开发和上线,帮助提升用户的决策效率;针对用户当前访问的商品,利用标准名召回相关商品,实现交互式推荐。标准名作为重要的基础数据,支持了产品形态多元化、推荐策略优化,对于提升用户粘性、流量转化,搭建商家用户友好的平台生态,具有重要的价值和意义。
6. 总结与展望
目前已完成基本的体系建设,并成功应用于不同的场景、取得业务收益。已经建成的标准名层级体系,覆盖了外卖绝大多数的在线商品。标准名作为基础和特征数据,应用到用户端的商品列表、美食排行榜等业务场景,支持策略优化、带来流量收益;同时,也通过服务接口的形式,跨部门支持SaaS点餐推荐的模型优化,以提升用户体验和业务收益。
标准名作为重要的商品特征数据,应用的业务场景广泛。在未来的工作中,需要持续迭代优化,保证标准名自身的准确性和质量;同时加深业务理解,根据业务需要优化层级体系,为业务提供更加合理的聚合粒度,提升转化收益;此外,重点建设一批用户感知强、供给覆盖高的标准名,降低业务方的接入成本和提高收益。
6.1 词表及同义词优化
标准名词表体量大、同义关系复杂,词表建设不是一蹴而就的,需要长期的迭代和优化。针对标准名词表中存在的非菜品、不规范等错误,以及同义词聚合不足、过度的问题,采用算法圈定+人工标注的方式,通过模型挖掘潜在同义词、圈定问题词组;人工校验后,进行批量补充和修改,持续优化词表、同义词。
6.2 层级结构合理化
目前,标准名层级是通过规则和模型的方式直接生成的,人工参与度较低,与业务场景的结合不够深入。后续会结合业务需要,明确剪枝、聚合粒度准则,合理化层级结构,优化层级的合理性。从而更加灵活、高效地支持不同的业务应用,提升落地效果。
6.3 核心标准名建设
标准名有20万之多,为业务应用造成一定的选择成本、带来不便。结合业务需要,圈定其中用户感知强、供给覆盖高、优质的标准名,作为核心标准名进行重点建设。核心标准名轻量且精炼,更加贴近业务需要,可以帮助业务方降低接入成本、提高收益。
7. 参考文献
[1] Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv:1810.04805, 2018.[2] Lample G, Ballesteros M, Subramanian S, et al. Neural architectures for named entity recognition[J]. arXiv preprint arXiv:1603.01360, 2016.[3] Chen Q, Zhu X, Ling Z, et al. Enhanced lstm for natural language inference[J]. arXiv preprint arXiv:1609.06038, 2016.[4] Huang P S, He X, Gao J, et al. Learning deep structured semantic models for web search using clickthrough data[C]//Proceedings of the 22nd ACM international conference on Information & Knowledge Management. 2013: 2333-2338.[5] Tan M , Le Q V . EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks[J]. 2019.8. 作者简介
刘柳、懋地、崇锦、晓星等,均来自美团外卖技术团队。
阅读更多
------------- END ----------