查看原文
其他

辛选集团数据建设历程以及数据在直播电商的应用

谭林 DataFunSummit
2024-09-10

导读 随着直播行业的迅速崛起,公司业务快速发展,数据在直播工作中的使用量和重要性日益增加。数据体系建设的完善性和数据的应用随着公司业务发展带来的要求也越来越高,如:数据分析的深度和广度,发现问题和分析原因是否透彻,提出的建议被采纳的程度,以及对数据及时性、准确性、完整性要求等等。在这一背景下,对于直播电商数据人才的培养、数据技术的完善、数据产品体系升级、数据分析深度、相关联数据的获取、数据治理都面临挑战。

今天的介绍会围绕下面几点展开:

1. 辛选集团简介

2. 辛选数据建设落地

3. 辛选数据建设应用

分享嘉宾|谭林 辛选集团 数据副总监

编辑整理|刘洋

内容校对|李瑶

出品社区|DataFun


01

辛选集团简介

1. 辛选集团简介

辛选是一家以供应链为核心的数字新零售企业,辛选集团孵化各个行业的头部带货达人,自建了集团自己的品牌和工厂,进一步增强了在新零售市场的竞争力。

2. 辛选集团发展历程

辛选集团于 2017 年在广州成立。2018 年,公司进入直播电商领域,到 2019 年,辛选集团的全年销售额已达 150 亿元,并且每年都保持较大比例的增长。到去年,销售额已经超过 150 亿元的三倍以上。

02

辛选数据建设落地

接下来介绍辛选集团数据建设情况。

1. 数据价值与定位

数据体系的建设中,怎么让沉淀的数据在商业活动中流动起来,而不是冷冰冰地沉睡?数据谁来用,怎么用,什么样的数据能为企业产生什么样的价值?我们认为有以下三个方面:

(1)降本增效(省钱,提效)
  • 首先要数据要方便,线上化,减少表格操作;
  • 智能检测业务环节中产生的数据,自动推送给相关部门,能高效快速地观察业务潜在的问题。
(2)数据服务于中高层管理

为中高层提供掌握业务经营决策依据等等。
  • 看现状:诊断业绩问题,全链路诊断。
  • 看经营状况:是赚是亏,回款付款是否正常。
  • 找机会:市场竞争格局,潜在的方向在哪里,什么品谁卖更加合适。
(3)支持商业决策

分析用户,分析各大品类赛道,找出潜在的机会,以及给账号做其他增值服务。

2. 困难与挑战

在数据建设的过程中,不同阶段会面临不同的问题,为了更好地为集团提供数据服务,需要深度理解业务运作,以各职能之间的协调为基础,搭建起来才能更加符合场景。
  • 数据平台建设过程中,从零到一的搭建
    梳理好业务场景,做好技术选型,搭建技术平台,虽然当前大数据技术相对比较成熟,但是还是需要结合成本++技术+交付时效综合考虑,选择当前最合适的,而不是大而全面,杀鸡不用宰牛刀;
    根据当前的业务体系,梳理数据源:先接入和加工可以通过技术获取的数据;技术不能获取的人工去获取;很重要但是获取不到的数据,需要找各种外部资源来协助完成。
  • 建立数据信任关系至关重要,与事业部和主播等业务前端紧密合作,通过人的服务驱动数据信任。
    有了数据不代表就可以用,满足需求的同时一定要快和准,对数据质量和数据广度要求很高;
    通过数据分析能发现业务中的问题和风险,及时反馈给各大事业部,需要人与人之间不断的去沟通和迭代;
    通过数据分析出外部新的机会,提供新的方向,品牌,不断的沟通和迭代;
    根据用户的需求和历史数据来判断货盘提出建议;
  • 数据价值传递是核心,需要紧跟业务发展步伐,了解战略发展方向,明确团队在其中的角色。中高层团队与业务板块紧密联动,部分团队成员专注于主播服务,灵活的分工机制有助于传递数据价值。
  • 数据价值的量化是最困难的部分,需要不断打磨,通过量化结果在 GMV 中明确数据的贡献,确保价值得到有效体现

3. 建设数据体系的思路

数据体系的建设框架思路综合了 TOGAF 和 DAMA 理论作为依据,并将华为数据管理之道作为落地的参考,根据企业当前的情况去匹配,不可全套照搬。辛选集团的数据构建并优化了企业数据管理体系,在支持业务发展的同时,确保了数据治理(数据标准、数据质量、数据安全)能前置化,最终在落地之后推广数据应用会有意想不到的效果。

4. 建设数据体系框架:企业架构框架-TOGAF 作为落地方法论

TOGAF 框架具有显著优势,对于团队掌握核心业务流程以及数据关系、梳理核心指标、产品设计匹配度、搭建数据架构都有很重要的参考意义,能够让团队核心人员对业务和数据现状都有深刻的理解。在工作中可以通过以业务为导向的架构拆解,我们能够更好地实现以下目标:
  • 快速了解业务流程:团队成员在参与过程中能够深入理解业务需求和流程,为后续工作的精确执行打下基础。
  • 快速了解数据现状:通过全面的业务架构分析,团队能够迅速掌握当前的数据状况和数据流程。
  • 拉通业务流、数据流和资金流:在集团层面,数据不仅服务于各个事业部,还最终落到财务方面。业务流、数据流和资金流可以实现全方位打通,尽量去保证输入和输出。
综上所述,TOGAF 框架的应用,使得我们在构建企业架构时,业务流、数据流和资金流都得到了清晰地展示和管理,实现了业务整体的高效运作。

在构建企业数据管理架构体系中,辛选集团采用了 V 字架构模型。V 字架构使得我们能够系统化地整理业务逻辑,并有效将其映射到数据和应用架构中。通过明确输入输出、标准化数据治理,确保了团队的灵活响应和高效运作。以下是具体的做法:
  • 业务架构优先:优先梳理业务架构,确保充分理解和定义业务需求及流程。
  • 映射到数据应用架构:将业务架构映射到应用架构上,虽然并非所有业务都会在系统中实现,但我们仍将所有业务逻辑列出,确保全面覆盖。
  • 明确输入和输出:在业务过程中产生的输入和输出都需要明确,最终的输出结果对我们数据团队而言,就是数据。
  • 数据标准化和治理:在整理完所有业务产生的结果后,我们使用数据字典将其包起来,进行全面的数据指标治理,参考标准进行规范化管理。
通过这种方法,团队成员在服务新的业务生态时,可以快速了解并跟进业务。都会用业务视角去看到数据,我们都能迅速与业务协同达成共识。

5. 建设数据体系框架:业务架构整理和拆解

在直播板块业务中,我们详细梳理了整个流程,确保了从品的引入到客户手中的每一个环节所产生的所有数据。对直播板块业务流程的系统梳理和细分,以下是流程的具体步骤:
  • 品牌和品引入:选择和引入符合直播平台的优质品牌,确保产品质量和市场竞争力。
  • 供应链管理:管理和优化供应链长度,确保物资流通的顺畅和高效。

  • 采购与招商:进行产品采购和招商活动,吸引优秀供应商和品牌入驻,以丰富直播内容。

  • 核价:拆解产品结构,得到合理的报价,以及网上比价;

  • 选品:符合用户需求同时规避风险。

  • 产品上线:选定的产品通过直播渠道进行推广和销售,实现线上销售的闭环。

  • 客户交付:确保产品顺利送达客户手中,所有环节紧密联动,以提供优质的客户服务。

从品牌引入到产品交付,整个过程与其他部门紧密联动,目的是将最好的产品和服务提供给客户,提升客户满意度。在梳理完业务流程后,我们将整个流程分为三大块:

  • 商家入驻:涉及品牌引入和招商的流程,确保商家顺利入驻。

  • 选品过程:包含核价与选品的环节,确保选出符合标准的产品。

  • 销售与用户体验:从产品上线到客户交付,包含销售和用户使用体验的全过程。

我们对每个环节都进行详细拆解,划分一级、二级、三级流程,明确每个流程的输入输出,这些输入输出的实质均为数据,我们将数据从逻辑抽象到物理实现去拆解,一一和业务流程对应。

为了更好地管理和优化这些数据,我们早期做了一个数据地图,也称为数据版图。这个数据地图可以理解为一个数据矩阵,具体如下:

  • 一级流程梳理:确定在整个商业活动中有哪些对象参与,最高层的数据抽象,也是最真实的业务语言。

  • 数据对象和业务流程对应:对所有参与的对象进行确认,无论相关数据是否已经存在,系统是否已经搭建,都进行标记并予以验证。

  • 逐步拆解流程:按步骤拆解流程,一直细化到所有细节都清楚明确。

通过这种系统性的流程拆解和数据确认,确保每一个环节的输入输出数据都清晰明确,为建模和管理数据架构奠定了基础

例如,在我们的直播板块中,交易数据的处理是关键环节。以下是对交易数据处理的详细解析:

  • 业务模块划分:我们的业务体系分为多个模块,包括直播交易、短视频交易、店铺自营交易、分销交易。

  • 逐步拆解业务:将业务逐步拆解,直到每个细节都明确。通过这种方式,可以精确地展示出每个业务模块的度量值。

  • 数据建模:这种详细的拆解方式使得数仓团队在建模时变得清晰。通过明确的度量值和数据指标,基础的 DWD 层数据整合模型建模过程变得更加顺畅,标准和治理维护也会很清晰。

  • 数据分析:通过这种方法,分析团队也能够轻松找到所需数据,明确各项指标的位置。这些指标分为原子指标和组合指标,确保数据分析的精确性。

  • 场景对照分析:分析团队可以根据不同场景进行对照分析,从而深入了解每个业务模块的表现情况。为分析找核心问题指标奠定了基础

6. 建设数据体系框架:业务架构的业务拆解

在处理完业务流程拆解后,我们启动了数据搜寻工作。以下是详细过程:

  • 寻找数据来源:不论数据是否存在,或存放何处,先标记和调研。例如:IT 系统中的数据(公司发展迅速,IT 系统不一定完善的情况下,有可能存在线下),以及行业数据如:抖音、淘宝、天猫等平台上的数据。

  • 数据搜集:无论数据存放在哪,先将其逻辑汇总,再逐个去获取。

  • 数据获取与使用:确认数据位置后,评估能否获取这些数据。接着,为产品提供报表或前端数据分析服务,利用前期搜集到的数据对象,确保数据标准化。

  • 数据标准化:尽管存在多个事业部和子公司,数据来源繁多,数据多样化,文件存储格式不同,字段标识不同,表达和定义不同,数据值域不同,产生最后的指标也不同,数据统计进入数据中台,数据都要参考核心业务逻辑的统一清洗。在搭建数据中台的同时,采用边开发边治理的方式,解决过程中遇到的问题。

  • 数据治理:数据治理的核心是保证数据质量,所以数据异常或逻辑不一致时,及时主动沟通业务方,要求其按标准模板处理数据,必要时采取强势措施,确保数据符合要求。数据架构的治理中落到实处技术层面操作最多的还是字段和值。

通过以上步骤,我们有效地管理了数据,确保数据标准化和一致性,为企业产品和服务提供了稳定的基础。

7. N15N:N 数据源,1 个大数据平台,5 套体系,N 个服务

中台的结构如上图所示。

  • 技术体系和业务体系:除了技术和业务这两个核心支柱,我们的中台结构还包括多个基座。

  • 四个基座:数据基座、模型体系、分析体系、数据管理体系。

  • 应用形式:主要通过报表和移动端应用来呈现数据,并且不同角色可以根据需求查看相应的数据。

  • 全链路看板与分析服务:数据管理体系基本实现了直播板块的全链路看板和分析服务,能充分满足直播业务的数据需求。

通过这套完整的中台结构,我们实现了数据的高效管理和全面分析,为直播业务的决策和优化提供了有力支持。

8. 技术架构

在技术方面,我们采用了业内常见的解决方案满足大数据技术层面实现冷数据/热数据存储,爬虫,实时计算,实时查询,离线计算,算法池,监控预警,安全访问,数据补救、数据识别补全人工智能小工具等等,具体配置如下:

  • 云服务:使用了阿里云,提供稳定的云服务基础设施。

  • 计算资源:CPU 配置为 2000 核;内存配置为 7000GB。

  • 存储资源:图片和视频的存储容量已达到 150 TB。

通过上述资源配置,为系统的高性能与高可用性提供了保障,使其可以很好地满足业务需求。

9.  数据分析体系

应用板块中的数据分析体系分为两大块:

  • 战略和商业分析:由于其特殊性,独立成一块,主要支撑公司的战略决策和商业发展。

  • 经营分析:经营分析分为四个子板块:财务板块、业务板块、市场板块、KPI 板块。

内部数据还远不足以支撑整个商业体系的分析及跟进,因此,外部数据的获取和整合显得尤为重要,需要横向和纵向观测全面的数据。能够为公司提供更全面的商业分析支持。

经营分析-业务分析 主要分为以下几个部分:

  • 开品:深度了解商品信息,指导线上销售。

  • 选品:推荐适合不同主播销售的商品。

  • 内容和风控:商品质量控制、定价和前端业务支持。

  • 外部数据:分析市场趋势,指导选品策略。

通过外部行情分析了解电商行业趋势,支持大主播全类目需求;使用头部电商和直播电商数据来进行分析。通过标签管理进行精细管理,包括:

  • 每个商品都有详细标签(成分、作用、人群等)。

  • 通过智能化工具生成标签,并与业务部门讨论可行性。

  • 按类目细分商品池(从服饰、美妆扩展到其他类目)。

通过这些数据分析,我们能够更好地支持业务决策,优化商品配置,精准把握市场趋势。

经营分析-财务分析:作为数据团队的核心板块之一,由专人专项负责,并签订保密协议来确保数据的安全性。

在做业财一体化的过程中,当系统建设没有那么完善的时候,可以尝试数据先行的方式进行疏通,识别缺失的,需要人工补救的,结合系统已有的,针对性的改进。根据业务支出和收入等各项财务业务流和数据流的关联关系进行打通和梳理。

财务数据的输出为集团财务管理报告、结算、收入,成本,利润,账单、账期、回款和支出情况以及费用等提供了支撑,基于这些数据才能更好地做经营分析和决策支持。

03

辛选数据建设的应用

除了数据产品以外,数据分析是随着业务变化不断变化和深化的,接下来将分享辛选集团数据的具体应用的一些案例。

1. 自营开品:自营供应链分析行情,开发新的产品的分析报告

曾有一位大主播提到,每天看这些冷冰冰的数据感觉很累,不知道有什么用。那么,如何让这些数据在商业体系中发挥价值呢?我们通过如下方式实现这一目标。

我们已经建立了一个标准化的数据分析流程模板,不论是哪个产品经理需要开品,整个思路大致相同。目前,已为服饰、家电、家清、健康、美妆、彩妆等多个品类提供了详尽的分析报告。

  • 市场大盘分析(看大盘):首先,我们会查看京东、天猫、淘宝、抖音、快手等平台的大盘数据。接着,分析所开品类的赛道,评估赛道的规模和潜力。

  • 增长趋势(看趋势):分析品类的增长趋势。确定品牌和产品的范围,关注当前热销词和流行趋势。

  • 品牌与品类分析(定赛道):例如,一些国有品牌在线下销售很好,但线上表现欠佳,我们会重点分析这些品牌的线上潜力。

  • 舆情分析(看用后感):我们会在抖音、小红书、微博、京东、天猫等平台上搜索关键字,分析舆情。特别是对于食品和美妆产品,舆情分析的要求更高,关注消费者对安全、健康、功效的反馈。

  • 产品定位(定产品):确定核心产品的成分和功效,分析供应链和预估成本。为直播销售制定最佳的定价和销售策略。

  • 差异化策略(定策略):我们会提出差异化策略建议。

  • 团队要求:对于团队的数据分析要求,我们不仅要懂得数据,还要深入理解业务并带点商业逻辑。只有这样,才能与业务部门达成共识,真正发挥数据分析的价值。

  • 文化积累与意识培养:公司发展地特别迅速,在这样的背景下,各种行业的人才都聚集在一起,大家的背景不同,认知不同,共同走在一起协作,因此,我们需要不断沟通数据的意义,为业务添砖加瓦。

2. 通过数据驱动寻找行业新的机会,给主播选品方向

我们的大数据推品模型,包括用户画像、主播画像和商品画像的构建逻辑,以及如何通过数据分析来提升工作效率和准确度。

(1)核心逻辑

  • 用户画像:通过分析用户的购物行为、评论和其他互动,来了解用户的年龄、爱好等属性。例如,看到某用户买了很多母婴产品,可以推测用户大概率是有几个宝宝,分别几岁,是男宝宝还是女宝宝。

  • 主播画像:了解主播的风格和内容,分析他们的受众和卖什么产品最合适。

  • 商品画像:对商品进行标签化处理,标记出它们的特点、适用人群和市场表现。例如,一款安全帽,我们知道它有电动车的用户。

(2)实际应用
  • 为主播做选品推荐时,系统会自动生成推荐清单,告诉主播哪些商品是当前的热卖品、哪些品是适合他们的用户群体的,这样也可以不断的去完善模型,让准确度越来越高。
(3)系统特点

  • 对于大主播系统的准确率在 70%-85% 之间,腰部主播能达到 80% 左右。

  • 系统背后需要进行大量的数据治理和模型训练。

总结来说,我们通过分析用户行为、主播特点和商品特性,利用数据治理和标签系统,帮助主播更精准地选品并推荐给观众。

3. 通过数据驱动在选品过程中排除风险

在选品过程中,我们会进行全面的风险管理和监控,确保商品从供应商到客户的全过程没有严重问题。

(1)风控措施

  • 发货监控:跟踪商品发货过程。例如,如果一个商品在 3 天或 5 天没有发货,需要提前预警。

  • 历史数据分析:卖过,口碑不好;其他平台卖过用户反馈口碑也不好。

(2)业务架构与逻辑

  • 业务体系分解:建议大家了解并应用 TOGAF(某个业务架构框架),将整个业务体系进行细分,从而明确各指标之间的相互关系。识别出最重要的指标,并重点监控。例如,在财务管理中,我们追踪收入和支出,同样道理,风控也需要找出潜在的风险点。

  • 指标关联与重要性:在整个选品及风控流程中,厘清哪个指标决定另一个指标的变化,并确定最重要的指标进行监测与管理。一旦确定了潜在的风险点,我们会与业务负责人一同评估,确定可行性和实施方案。

如上,通过完善的风险管理措施,我们能够在选品过程中及早发现和应对潜在风险,保障商品的准时交付和质量,从而提高客户满意度和信任度。

4. 数据安全的基础建设

数据安全是我们工作的重中之重。除了公司的安全团队所做的工作外,我们也采取了一些措施来确保数据的安全性。具体措施包括:

  • 加密,系统验证,账号多人登录限制,数据导出,外网访问权限等等。

  • 日志跟踪和权限限制:实施日志跟踪,记录所有操作行为。限制访问权限,确保只有授权人员才能访问特定数据。

  • 内部流程和网络改造:优化内部流程,确保所有操作都在公司的安全体系内进行。进行网络改造,提升基础设施的安全性。

  • 系统访问截图水印等等。

  • 核心数据库的账号权限管理以及日志。

  • 数据安全意识的培训等等。

以上就是本次分享的内容。希望通过这次分享,能够帮助大家更好地理解数据在商业中的重要性,并在实际工作中加以应用。谢谢大家。
以上就是本次分享的内容,谢谢大家。


分享嘉宾

INTRODUCTION


谭林

辛选集团

数据副总监

曾在世界五百强企业担任大数据架构师,数据团队负责人等职务,比较擅长为企业提供数据领域的解决方案。

往期推荐


通义灵码智能编码助手技术解密

要跟 Spark PK,新一代计算加速引擎 Meson 的底气来自哪里?

甘启-Soul 基于 AIGC 的实践与探索

RAG 标准和腾讯云 ES 的技术实践

通义星尘个性化大模型相关技术与应用

因果推断在互联网电商用户增长中的应用

多模态大模型与精排模型融合实践

面向 Data+AI 时代的数据湖优化与实践

推荐系统的8种层次!

对话刘铭教授:多模态知识图谱构建初探

活动推荐7 月 5-6 日,DataFunCon2024·北京站将在北京·丽亭华苑酒店举办。会议聚焦以大数据和大模型为代表的新质生产力,甄选出近 100+ 企业级落地案例,可参考、可复制、可持续,助力业务数智化转型。扫描下方二维码或点击「阅读原文」即可查看完整议程,现在报名最高可减 1800 元,更多团购优惠添加票务小助手咨询。

点个在看你最好看

继续滑动看下一个
DataFunSummit
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存