收录于话题
#数据产品的实践
23个内容
“与数据同行”开通了三类微信群,综合群、专业群(数据仓库、数据分析、产品经理、数据治理及机器学习五大专业)加微信号frank61822702 为好友后入群。新开招聘交流群,请关注‘’与数据同行‘’公众号,后台回复“招聘”后获得入群方法。正文开始
标签库以标签形式统一客户群数据的封装规范和操作风格,从而实现客户洞察知识的沉淀及共享,并通过产品化的形式实现目标客户群的快速生成和发布,提升营销渠道的客户群投放效率,标签库建设的目的就是为了营销,而不是为了分析。企业的标签库跟广告产业的DMP是类似的,企业内部对自己的用户进行精准投放依赖的是标签库,广告产业DSP依赖的则是DMP。
标签库的核心当然是标签体系,但每个企业打造的标签体系其实都不太一样,既有共性,也有个性。共性主要体现在用户的一些基础属性,比如年龄、性别、职业、住址等等,个性是由于每个企业的产品特点、基础数据、目标受众都不太一样,比如运营商的标签会侧重通信消费、通信行为,而电商的标签则会侧重线上消费的各种特征,以下是某运营商8年前的一个标签分类示意。
但即使是同一个企业,也会由于业务的变化和数据能力的提升而大幅改变标签体系,比如运营商自从引入DPI、位置信令数据以后,其标签体系会向线上、线下的生活情况转变。
在设计标签体系的时候,要避免追求形式和逻辑上的完美,一定要从企业的营销实际出发,到一线进行充分的调研后确定要建设的内容,以下是以前的一个标签调研表格示例,方便理解。
标签按照生成方式有三种类型:基础属性、业务经验、分析模型和个性标签。基础属性标签:基础属性标签是指从业务平台等数据源直接获取数据,一般通过信息整理或基础属性判定规则即可生成标签,比如品牌、集团属性、地域属性等。业务经验标签:主要是利用业务人员经验积累的业务规则进行筛选、分析生成标签名单,数据口径的业务逻辑较清晰明确,可解释性强,比如中高端用户。分析模型标签:主要是利用已有基础数据进行一定的筛选、分析、关联和数据挖掘,生成客户标签结果信息,比如易离网用户。个性化标签:标签一般要具有共性的价值,但实践中很多标签属于探索性质,个性化很强,应允许在标签体系之外增加个性标签发布类目。基础标签可以基于数据仓库的基础模型、融合模型直接生成,分析模型标签则依赖于挖掘模型的结果,一般来讲,基础属性标签最多,业务经验标签其次,分析模型标签最少,这是因为一个企业内大多数营销所需的目标客户需要直接、清晰而可解释。标签体系是标签库的内涵,而标签库的功能决定了这些标签能否方便使用,酒香也怕巷子深。标签库的核心功能包括标签创建、标签查询、客户群生成、客户群推送、标签元数据、调度管理这几项,其他的诸如标签编辑、标签停用、标签下线、标签评论、标签审批、标签推荐、安全管理等等,可以放到次优先级。很多看起来挺好的功能在运营初期一点价值都没有,你需要聚焦核心功能。标签创建一般要支持三种模式:简单模式,高级模式,导入模式。简单模式:面向业务人员,可以基于现成的模型宽表选择属性字段生成标签,如下图所示,但受限于开放的宽表的能力和业务人员的驱动力,在我们的实践中,这种简单模式并没有获得成功。
高级模式:面向独立编写SQL能力的使用人员,如下图所示,但要让标签库同时具备数据开发环境的能力,是比较理想化的。
实践中更多的还是通过数据开发平台生成后台表,同步到标签库后台,标签库再配置发布,虽然比较繁琐,但跟企业的数据开发体系是融合的。我们后来直接让标签库前台对接数据开发平台的元数据,可以基于数据开发平台的表一键发布成标签,如下图所示,现在数据开发平台也可以一键发布到标签库,这样就很方便了,标签库一定要约束其功能的范围。
客户群生成一般可以包括客户群计算、客户群分析、客户群拓展三个模块。客户群计算:基于标签的组装生成客户群是标签库最核心的功能,主要包括选择标签及属性、配置标签逻辑关系、配置客户群属性三部分,如下图所示:
客户群分析:客户群在投放前往往还需要进行多维度分析(比如位置、收入、区域、性别、年龄、总量等等),方便对客户群做出进一步调整,如下图所示:
客户群拓展:选择某个客户群作为种子用户,找到这部分用户的维度特征(当然还可以有其他办法),然后基于这些维度特征找到其他相似用户,从而扩大投放用户群,这个功能其实不太实用,实践中拓展用户群往往是通过放宽标签设置条件去做。没有出口的标签库是没有价值的,标签库需要对外开放,能够将客户群按照一定的接口规范, 通过标准化的交互接口,提供给外部系统进行使用,包括同步、异步及订阅等多种方式,一般推送的对象就是营销管理平台或者说是DSP。
推送客户群有一个关键就是有来有回,你出去的数据,必须能跟踪到渠道投放情况,做不到这一点,就无法形成闭环,后面的运营就很难开展。很多企业标签库和投放端是两个团队,数据有去无回,标签的优化就很难做了,长远来讲损害企业利益。标签元数据是整个元数据管理体系的一部分,主要包括对标签数据来源、数据处理过程、数据建模过程、标签口径、标签效果等的说明,透明化的第一目的就是让这个标签值得信任,业务人员敢用,其次是方便核查问题,但标签的元数据很难做好,比如效果的自动获得对于投放的闭环要求非常高。
下图通过一个案例显示了标签库的数据流向,方便你理解其中的逻辑关系。
(1)(2)(3)(4):外围系统提供数据通过ETL工具同步到主仓库和专题库(5)(6)(7):主仓库、专题库、创新应用平台生成的基础模型、融合模型、挖掘模型结果同步到标签库(8):标签后台库负责标签的生成、标签宽表存储、客户群计算及清单存储,向非结构化库输出个人标签清单(9):基于文件系统非结构化存储个人用户的标签信息(MogoDBS), 满足对外快速查询需求(10):标签前台库存储标签、客户群、资源权限等系统配置信息
标签库有大量的关联批量计算任务,对于在线分析的时限要求高,因此MPP架构往往是后端数据库的选择之一,在某些所见即所得的场景(比如在线统计),可以混合使用ES等查询引擎来提升体验。
标签库建完了只是万里长征的第一步,有了平台后最关键的是运营体系的打造。我们当前的重点工作全部在标签库的运营上,你需要时刻对标签库进行体检,发现问题,解决问题,这些有赖于机制和流程的建立,下面是运营月报的示例。
《与数据同行》为您提供最好的文章!
猜你想看更多的文章👇
产品的天机和成败:我的实践史与俞军的方法论
工作六年,我总结了一份数据产品建设指南
BI(商业智能)的未来?
超越BI,数据产品的前途在哪里?
数据产品经理,并不是数据 + 产品经理
五年数字大屏之路,“述说”着我们大数据变现怎样的故事?(附演示视频)
为什么你的标签库没人用?
降维打击:流量造假者,我知道你昨天干了什么?
十年的标签库建设经历,我得到了什么启示?
为什么微信公众号的用户分析功能这么弱?
浙江移动神灯大数据重磅推出城市规划产品:城市实验室!
从交通行业说起,运营商大数据如何有策略的切入一个垂直行业?
运营商大数据在智慧交通方面能有什么作为?
为什么就做不好数据产品的体验?
百万标签发布了,这是怎样一种体验?
我们是如何来设计互联网大会上“城市24小时”这块数字大屏的?
直击传统商业五大痛点,如何打造一个爆款的商圈洞察产品?
照亮自己,点亮他人,详解浙江移动“神灯”大数据!
连续发布十款大数据产品:浙江移动赋能金融行业
运营商大数据产品变现面临的挑战和机遇
中国移动信用分悄然登场了!
一座城、一块屏、用大数据讲述城市的故事
为什么数据从业者要学点产品思维?
要看更多,请点击左下角阅读原文即可阅读整理好的所有文章!