分享一个CDO如何构建和管理数据资产组合的方法【实用】
数据资产是一组准备好的数据或信息,可以容易地用于一组已识别的用例,也是数据管理领域的热门话题。能够识别、构建和管理单个数据资产是一回事,但如何在企业级别实现有效管理呢?应该从哪儿开始?
从这个角度来看,我们接下来讨论如何对数据资产采取组合方法管理。下图展示了管理数据资产的方法,本文的其余部分将详细说明这七个步骤。在整个过程中,解释了方法和方法论,并在过程中融合了示例。
在实际的案例中,我都遵循了这种方法,但为了避免数据来自任何特定的客户,我使用 ChatGPT 4.0 来生成示例。
第 1 步:用例和影响
第一步是确定对组织重要的数据驱动用例。我们不必一次性为整个企业执行此操作,可以从一个域或业务线开始,一般会推荐这样做。
用例是可以实现总体组织策略的具体机制。数据战略和数据治理本身并没有任何价值,它们只有在实现更广泛的战略目标的情况下才会产生价值。因此,用例必须是第一步。
有多种方法可以解决这个问题。我们可以通过采访业务和分析领导在部门内部构建用例清单。对于业务部门,可以从外部来源借鉴相关用例。大多数成功通常是通过混合方法获得的,引入外部用例列表,然后与内部领导一起完善该列表。
如上所述,出于本文的目的,我使用 ChatGPT 4.0来构建清单,如下表所示。例如,在财务与金融领域,用例欺诈检测和预防使用实时分析和机器学习模型结合客户和交易数据来识别模式并识别可疑事件;或者在营销和销售领域,作为营销组合建模的一部分,研究营销工作和销售业绩之间的历史关系,以优化营销预算的分配以及渠道和策略的使用。
财务与会计
用例:
财务预测和建模
实时财务报告
欺诈检测和预防
资本支出优化
现金流量分析
费用跟踪和分析
运营
用例:
生产线优化
设备的预测性维护
资源分配与调度
库存优化
流程自动化和简化
成本降低和效率分析
人力资源(HR)
用例:
人才分析以找到最合适的候选人
员工流失预测
薪酬和福利基准
员工敬业度和情绪分析
培训和发展需求分析
多样性和包容性指标跟踪
营销
用例:
客户细分和目标定位
营销活动绩效衡量和优化
营销组合建模
数字营销归因
品牌提及的情感分析
客户旅程映射和分析
销售量
用例:
销售预测
潜在客户评分和优先级
客户流失预测
交叉销售和追加销售机会识别
销售区域设计与优化
销售业绩分析和基准测试
供应链与物流
用例:
需求预测
供应商绩效评估
配送路线优化
库存周转率分析
供应链中断的风险评估
物流服务的最优定价策略
研究与开发(R&D)
用例:
基于市场数据的产品成功预测
分析客户反馈以改进产品
竞争对手基准测试和分析
专利和知识产权格局分析
临床试验数据分析(针对制药和生物技术公司)
合法合规
用例:
合同分析与优化
使用自动数据源进行监管合规性监控
法律案件结果预测
知识产权侵权监控
数据治理和数据隐私合规性跟踪
客户体验与服务
用例:
客户满意度和净推荐值 (NPS) 分析
呼叫中心优化和语音分析
解决时间分析和优化
反馈收集和分析以告知服务改进
预测支持(根据行为预测客户问题)
产品管理
用例:
产品使用分析
功能采用率
功能发布的 A/B 测试结果分析
产品市场契合度评估
汇总客户反馈以改进产品
业务发展与策略
用例:
市场进入和增长分析
竞争情报
合作伙伴和收购目标分析
客户和市场细分寻找新机遇
战略投资的投资回报率评估
健康、安全和环境 (HSE)
用例:
事件和事故的预测和预防
环境影响跟踪和优化
安全合规性监控和报告
工人健康监测和干预计划
基于数据洞察的灾难响应和恢复规划
电子商务与数字业务
用例:
购物车放弃分析
推荐引擎优化
网络流量来源分析及转化优化
网站设计元素的 A/B 测试
价格弹性和促销影响分析
房地产与设施管理
用例:
空间利用与优化
能源消耗分析和优化
建筑基础设施的预测性维护
租户满意度和保留率分析
房地产收购或出售的市场价格分析
可持续发展和企业社会责任 (CSR)
用例:
碳足迹测量和优化
供应链可持续性监控
社会影响衡量
利益相关者对企业社会责任举措的情绪分析
资源消耗和浪费分析
有用例还不够——我们需要了解它们的重要性。用例可以通过 4 种关键方式驱动价值:
增加收入
减少开支
增强客户体验
降低风险
有些人将“驱动创新”列为第五个价值驱动因素,但在我看来,这只是一个时间问题,因为任何创新本身最终也是通过上述四种机制来驱动价值的。
现在,在下图中,描述了与营销相关的用例以及与之相关对“整体收入的影响”。我们看到营销组合建模对整体收入有“1 到 2% 的影响”,也就是说如果公司平均收入为 10 亿元,这些估计表明营销组合模型可以在此基础上带来 10-2000 万元的收入。
第 2 步:所需数据
在此步骤中,我们调查需要哪些数据来支持已识别的用例。第一步是定义用例的关键数据输入是什么。例如,对于运营下的产品线优化,所需数据包括生产量数据、机器性能日志和原材料可用性。或者,对于人力资源下的员工流动率预测,需要来自员工满意度调查、离职面谈反馈和行业流动率的数据。
一旦获得了部分或完整的用例列表,相应的业务或流程所有者就可以说明需要哪些数据。随着关键数据输入列表的增长,我们就可以开始将数据分组为数据类型或域的程度。在部门内,甚至在较小程度上甚至跨部门,这些数据类型和域实际上相当稳定。几乎总是适用的数据域包括客户、员工和财务,因为大多数组织为某些人群提供服务,有员工这样做,并且需要管理他们的预算。其他一些领域例如供应链数据会更加具体,并且仅在组织管理产品和材料的物理供应链时才适用。
财务与会计
财务预测和建模
费用报告、采购数据、供应商发票
实时财务报告
收入数据、支出数据、应付/应收账款
欺诈检测和预防
资本项目数据、投资回报率数据、折旧表
资本支出优化
交易数据、行为模式、外部欺诈数据库
现金流量分析
交易数据、总账条目、附属财务数据
费用跟踪和分析
历史财务数据、市场趋势、公司指标(例如销售额、产量)
运营
成本降低和效率分析
成本数据、运营指标、废物日志
流程自动化和简化
流程日志、人工干预记录、效率指标
库存优化
库存水平、销售预测、供应商交货计划
资源分配与调度
员工日程、资源可用性、需求预测
设备的预测性维护
设备日志、维护记录、传感器数据
生产线优化
产量数据、机器性能日志、原材料可用性
人力资源(HR)
多样性和包容性指标跟踪
员工人口统计数据、行业基准、招聘和晋升数据
培训和发展需求分析
绩效评估、技能评估、工作要求
员工敬业度和情绪分析
员工调查、反馈会议、社交媒体提及
薪酬和福利基准
员工薪酬数据、福利数据、行业基准
员工流失预测
员工满意度调查、离职面谈反馈、行业流动率
人才分析
简历/简历、面试反馈、绩效数据、行业基准
营销
客户细分和目标定位
接触点数据、购买数据、客户反馈
营销活动绩效衡量和优化
社交媒体数据、在线评论、媒体提及
营销组合建模
网站分析、数字广告支出、转化跟踪
数字营销归因
销售数据、活动数据、外部因素(例如经济指标)
品牌提及的情感分析
营销活动支出、转化率、客户反馈
客户旅程映射和分析
客户人口统计、购买历史、参与度指标
销售量
销售预测
个人销售指标、团队指标、行业基准
潜在客户评分和优先级
销售代表绩效数据、地理销售数据、市场潜力数据
客户流失预测
购买历史记录、客户偏好、产品库存
交叉销售和追加销售机会识别
客户满意度数据、使用指标、支持票数据
销售区域设计与优化
潜在客户参与度数据、人口统计数据、先前购买数据
销售业绩分析和基准测试
历史销售数据、市场趋势、产品发布数据
供应链与物流
需求预测
成本数据、竞争对手定价、客户支付意愿数据
供应商绩效评估
供应商风险概况、地缘政治数据、历史中断事件
配送路线优化
库存水平、销售数据、浪费数据
库存周转率分析
GPS数据、交通数据、送货时间表
供应链中断的风险评估
供应商交付数据、质量控制指标、合同合规数据
物流服务的最优定价策略
历史销售数据、市场趋势、外部事件数据
研究与开发(R&D)
产品成功预测
临床试验结果、患者人口统计、历史试验数据
分析客户反馈以改进产品
专利数据库、法律文件、竞争对手产品数据
竞争对手基准测试和分析
市场研究数据、专利数据库、行业报告
专利和知识产权格局分析
客户评论、用户测试反馈、销售数据
临床试验数据分析
市场研究数据、竞争对手产品性能、客户反馈
合法合规
合同分析与优化
数据使用日志、数据访问记录、监管要求
监管合规监控
知识产权数据库、市场监测数据、产品清单
法律案件结果预测
过去的案件结果、案件细节、法律数据库
知识产权侵权监控
监管备案、审计报告、行业法规
数据治理和数据隐私合规性跟踪
现有合同、行业标准、谈判结果
客户体验与服务
预测支持
客户行为数据、产品使用日志、问题历史记录
反馈收集与分析
客户调查、在线评论、社交媒体提及
解决时间分析和优化
支持票证数据、解决时间、问题分类
呼叫中心优化和语音分析
通话录音、通话元数据、客户反馈
客户满意度和 NPS 分析
客户调查、交易数据、服务单数据
产品管理
产品使用分析
在线评论、反馈调查、社交媒体提及
功能采用率
销售数据、市场研究、客户反馈
A/B测试结果分析
A/B 群组的用户行为、转化指标、反馈
产品市场契合度评估
发布数据、用户行为日志、反馈调查
客户反馈汇总
用户活动日志、功能参与度指标、客户反馈
业务发展与策略
市场进入和增长分析
投资数据、绩效指标、财务预测
竞争情报
客户人口统计数据、购买行为、市场趋势
合作伙伴和收购目标分析
潜在合作伙伴/收购财务状况、战略契合度指标、市场定位
客户和市场细分寻找新机遇
竞争对手的财务状况、产品供应、市场定位
战略投资的投资回报率评估
市场规模数据、竞争格局、监管环境
健康、安全和环境 (HSE)
事件和事故的预测和预防
历史灾害数据、资产位置、风险概况
环境影响跟踪和优化
健康检查记录、事故数据、设备暴露水平
安全合规性监控和报告
安全检查数据、事故报告、合规检查表
工人健康监测和干预计划
排放数据、废物数据、资源使用指标
灾难响应和恢复规划
历史事件数据、设备日志、培训记录
电子商务与数字业务
购物车放弃分析
销售数据、定价数据、促销活动数据
推荐引擎优化
用户行为数据、转化指标、设计变体
网络流量来源分析及转化优化
网站分析、推荐来源、广告活动数据
网站设计元素的 A/B 测试
购买历史记录、用户行为、产品元数据
价格弹性和促销影响分析
购物车数据、用户行为日志、定价数据
房地产与设施管理
房地产收购或出售的市场价格分析
市场销售数据、房产特征、位置数据
租户满意度和保留率分析
租户反馈、续租数据、服务请求数据
建筑基础设施的预测性维护
维护日志、设备寿命、传感器数据
能源消耗分析和优化
能源账单、传感器数据、设备性能日志
空间利用与优化
平面图、占用数据、使用日志
可持续发展和企业社会责任 (CSR)
资源消耗和浪费分析
资源使用日志、生产数据、废物指标
利益相关者对企业社会责任举措的情绪分析
调查、社交媒体提及、新闻稿
社会影响衡量
社区参与数据、社会计划指标、利益相关者反馈
供应链可持续性监控
供应商环境数据、物流数据、生产数据
碳足迹测量和优化
排放数据、能源消耗、废物指标
注意:为每个用例列出的数据输入是典型的,但并不详尽。实际数据需求可能因行业、公司或项目的具体性质而异。
上面的内容显示了可能的结果。其中,有 15个数据域和大约 100 个子域。所有组织的数据都可以映射回此处列出的类型。例如,“客户”下的“客户人口统计”可能包含有关客户的年龄、种族、民族、性别、婚姻状况、收入、教育和就业状况的数据。
一旦开始识别用例的关键数据输入,并将这些关键数据输入映射到数据类型或域,就可以开始构建矩阵,如下图所示。上面,我们有产品线优化的示例用例,它映射到运营数据域,因为它确实需要运营数据。在下图中,用例被映射到更广泛的数据域,以便在此处实现可视化,但在现实生活中,可以并且应该将用例映射到底层、更细粒度的子域。
根据它们需要作为输入的数据类型映射的关键用例的全面理解对于开发数据策略和优先考虑特定数据域已经是非常重要的,但我们需要更进一步,使其更加平衡更具可操作性。
第 3 步:识别数据源
在我们根据步骤 2 中的逻辑数据要求采取步骤识别源系统之前,让我们采用一组用例并评估它们所需的数据。下图显示了营销和销售用例及其依赖的关键数据的关系。这与上图中所示的内容一致,只是粒度级别更高。
例如,我们看到,对于客户细分和定位的第一个用例,需要客户人口统计数据。对于相关公司来说,该数据存储在名为Global CRM 的物理系统中。同样,同一用例所需的购买历史记录数据存储在两个系统中:电子商务交易历史记录和零售销售点系统。如果我们从上面的图中获取所有关键数据输入并识别源系统,我们就会得到下图的表格。如图所示,某些数据源包含多种类型的关键数据。例如,Global CRM Master包含客户人口统计数据,还包含客户偏好、客户反馈和客户细分数据。
第 4 步:用例与来源
我们确定了用例所需的数据(步骤 2),然后将其映射到源系统(步骤 3)。现在可以创建的下一个视图是用例与源系统的映射,对于营销和销售,如下面图所示。
在这里,深绿色表示数据对于用例至关重要,浅绿色表示它是“最好有”或支持性的。例如,对于客户细分和定位,来自Global CRM Master 的数据至关重要,但来自社交媒体分析的数据是“最好有的”。
我们已经对用例有了更多了解。事实上,在上面的步骤 1 中,我们做的第一件事就是确定用例以及这些用例可以带来的增量收入。现在,我们可以讨论依赖于特定数据源的价值创造。因为如果我们知道给定的数据集对于 3 个用例至关重要,这 3 个用例预计分别会带来 200、300和 500 万元的增量收入,那么我们可以说 1000 万元的收入依赖于该数据集。
我们无法单独完成此工作,需要让相应的用例和业务流程中所有者参与进来。识别这些人可能需要一些时间,但一旦找到他们,通常会发现他们很合作,因为他们在确保用例成功方面有利害关系,因此需要澄清哪些数据是必须的以及哪些数据是关键的以及它可以带来的影响。
随着我们的操作,可以开始构建一个描述,如上图右侧所示,其中对对营销和销售用例至关重要的所有数据源的整体收入影响进行了估计。请注意此处的重复计算,并确保对数字进行适当的解释和限定;例如,如果给定的用例具有 100 万元的价值创造潜力,并且依赖于 2 个数据源,那么不能说这两个数据源共同驱动 200 万元。
第 5 步:数据资产评估
在上一步中,我们根据一组数据源映射了用例及其驱动的价值。现在我们知道这些数据源可以驱动价值,这意味着它们对公司具有内在价值,因此可以将它们视为数据资产。
虽然上图已经非常有洞察力,但它还不能让我们将某些数据资产优先于其他数据资产。如果给定的数据资产可以带来很大的价值,但它已经就位并且“适合目的”,则可能不需要采取进一步的行动。
下图显示了四种数据资产评估状态,从“适合用途”到“缺失或存在较大差距”,从而能够对数据资产进行一致的评估。在此,目的适用性应作广义解释。从积极的一面来看,这意味着可以随时以正确的粒度和及时性获得正确的数据;质量高、可靠,源系统永不宕机。另一方面,这意味着要么数据资产根本不存在,要么即使存在,也意味着数据严重不足、不可靠和/或不完整。
我们现在拥有构建所谓的热图所需的工具,其中“热点区域”(即红色或琥珀色部分)表示价值创造的机会,因为这是用例无法依赖其迫切需要的数据的地方,参见下图。
第 6 步:资产优先级
下一步是根据我们现在所了解的有关数据资产的所有信息来确定数据资产的优先级。下图呈现了与上图中相同的热图,但我添加了收入影响和相关用例的数量。然后,我们对数据资产进行了重新排序,根据它们产生的总收入影响按降序排列。
现在,哪些数据资产可以优先进行增强和投资变得更加清晰。例如,很明显,Global CRM Master是一个大问题,因为它没有以最佳方式满足 9 (!) 个用例,影响超过 1300 万元。各种数据资产,例如Instagram Insights、客户支持门户和Google Ads 数据都适合用途,因此似乎不需要修复。然后我们在底部有一些,例如Shopify Analytics和新闻聚合平台,它们可能尚未到位,但每个仅支持 1 个用例,影响有限。
如果您是首席数据官,并且此全景图反映了组织在给定领域的数据资产和用例,那么影响驱动的路线图就会为您打开。显然有机会利用一两个数据资产,并将其用作战略位置,以加强对具有战略意义的数据的治理。这可用于嵌入和实施各种数据治理功能,例如数据所有权和管理、元数据管理和数据质量,因为其中每一项对于确保数据资产得到充分治理都至关重要。
第 7 步:数据资产组合
一个常见的事实是,首席数据官等数据领导者的预期任期很短,平均不到 2.5 年。在很大程度上,这是因为 CDO 难以在中短期内实现有意义的业务影响。
这正是这个观点中描述的方法如此强大的原因,如果您使用步骤 1-6 中呈现的逻辑对数据资产进行优先级排序,那么您几乎肯定会产生影响。当您从用例及其影响开始时,您从一开始就参与业务和职能领域,因此避免陷入“为了数据而做数据”的陷阱,这将在很大程度上避免人们认为数据治理是业务的成本和障碍。
我们所识别的数据资产类似于房地产投资组合中的财产,并且需要积极管理它们,确保它们保持不变,数据用户持续满意,新需求出现时被纳入,并且价值的产生不是假设的,而是随着时间的推移明确跟踪的。
下图显示了我们从这个角度分析的组织的数据资产组合仪表板。它显示了已认证的数据资产的数量、针对这些资产映射的用例数量,以及通过增量收入和风险缓解所创造的价值。
在中心位置,可以看到一个图表,该图表跟踪一段时间内经过认证的数据资产的数量,更重要的是,跟踪启用的用例的数量以及以收入表示的相关影响。这是 CDO 职业生涯长久的关键,能够证明通过有针对性的数据支持和治理活动所创造的价值。
在底部,可以看到数据资产的管道视图。其中一些正在推进结构化激活生命周期,而另一些则已经上线。您会发现我们之前调查的Global CRM Master确实已被优先考虑——它目前处于“开发”阶段。
案例实践
正如本文开头提到的,我与多家公司以及银行、保险、零售、技术和制造领域的企业合作,使用并完善了这种方法。
在制造业的一个案例中,我们遵循了此处概述的 7 个步骤的优化版本。鉴于它是一家复杂的全球性公司,在整个组织中识别用例是不可行的。我们选择一个业务领域作为主要关注点,即商业部门,然后是营销和销售的子领域(与上面步骤 3 中的用例范围不同)。
我们确定了一组约 30 个用例,其中大部分已被定义用于业务目的。我们执行了步骤 2-4 的轻型加速版本,以识别所需的数据和相应的源,并根据源映射用例。我们跳到第 5 步,并与用例所有者和业务部门进行接触,询问他们是否有权访问正确的、适合目的的数据。如果没有,那么缺少什么数据或来源——问题是什么?
很快,我们就确定了一组 8 个用例,这些用例在所需数据方面遇到了困难,并发现 2 个特定数据源对于其中 8 个用例中的 6 个来说是一个问题。我们与中央数据团队和业务团队一起,对这两个数据源的所有者进行了协调,根据一套正式的认证标准对其进行了评估,并起草了一项解决差距的计划。
几个月后,第一个数据资产已得到增强和认证,以满足记录的用例的需求。在撰写本文时,确切的影响尚未衡量,因为影响需要时间才能实现,但初步证据表明,营销效果可能会实现高个位数甚至两位数的增长。无论如何,CDO 最好引入并完善该方法,在董事会中取得一定的胜利,并通过额外的资产、用例和领域启动更广泛的路线图。
小结
构建和管理数据资产组合不一定容易或快速,但值得付出努力。我希望本文的步骤对大家有用,如果您有反馈或自己的故事要分享,请随时在评论中留言交流。
往期推荐