谈谈数据目录工具选择 POC 的 10 个技巧
当前,很多公司正在利用数据目录来更好地组织和管理其数据资产,从而提高效率并增强竞争优势。
然而,在公司能够利用数据目录的优势之前,他们必须首先经历一个概念验证 (POC) 过程。数据目录 POC 可以帮助组织了解数据目录可以提供的价值,并引导他们走上成功之路。
从了解所涉及的利益相关者到制定时间表和预算,本文将提供规划成功的概念验证所需的指导。
1. 识别痛点
在寻找任何类型的工具之前,需要确定并量化面临的挑战。面临的是行为问题还是与工具相关的问题?是数据团队问题还是组织问题?
如果您发现很难确定面临的确切挑战,请先确定导致组织数据计划失败的三大因素。确定这些因素的最佳方法是在整个组织内进行调查和访谈。通常,一线人员确切地知道他们的数据项目失败的原因。规划组织需求将使您能够准确地确定在数据目录中寻找的内容。此步骤在后续评估工具时非常有用。
最常见的挑战包括:
文档:文档是手动的、繁琐的,并且分散在整个数据堆栈中。
信任和理解:员工不信任或不理解数据。BI 团队花费大量时间回答与数据相关的基本问题。
入职培训:入职培训需要花费大量的时间和精力。新员工需要很长时间才能独立处理数据。
2.考虑预算
在选择数据目录的过程中,预算必须尽早考虑。原因很简单。如果没有预算或预算不足,就没有必要浪费时间尝试你无法支付的不同解决方案。在开始数据目录项目之前,请确保你得到了高管的支持。
如果有人要求您为数据目录准备预算,那么您需要做的就是量化痛点。如果您正在寻找数据目录,通常意味着您已经在处理想要消除的内部低效率问题。量化这些低效率问题。它们到底要花多少钱?为您面临的挑战定价将有助于您确定您愿意为消除这些低效率问题付出多少代价。
我们通过量化与入职、数据发现和基础设施成本(在本例中为 10 人团队)相关的重大低效率的年度成本,细分了实施数据目录的投资回报率。
3. 寻找支持者
在开展任何工作之前,请确保您有支持者。支持者或倡导者是领导组织中实施数据目录工作的人。获得支持者是成功的关键。支持者必须拥有权力和必要的资源才能推动数据目录项目向前发展。
发起人将负责接洽供应商、进行演示并请求信息请求 (RFI)。他还将负责指导实施过程。此外,发起人应参与数据目录项目计划的制定和总体项目目标的设定。发起人应是了解组织数据策略和目标的个人。他们应能够确保数据目录实施与数据策略保持一致。
最后,发起人应该能够倡导数据目录的实施并获得组织内主要利益相关者的支持。
拥有支持者可以确保有人将时间、精力和注意力投入到数据目录项目中。如果没有重点,项目就不太可能完成。
4.做好研究
选择正确的工具首先需要尝试正确的工具。目前有很多数据目录,未来几年可能还会创建更多。这并不奇怪;随着越来越多的组织做出数据驱动的决策,对数据目录的需求不断增长。
有很多工具提供很多不同的功能,这意味着您必须做一些研究来决定要尝试哪些工具。
Printify 数据平台产品经理 Filipe Palma 透露,在选择工具之前,他通过 Medium 和 Reddit 搜索以收集其他公司的最佳实践。
重要提示:进行数据目录研究时,了解数据的确切位置非常重要。这将确保您可以选择具有正确连接的目录。您需要确保只尝试具有连接到数据库和 BI 工具的连接器的目录,或者能够快速构建连接器的目录。
5. 确定利益相关者
确定利益相关者,并让他们参与决策过程。您需要考虑谁将成为数据目录的用户。这涉及丰富数据目录和使用文档的人员。
丰富数据目录的利益相关者可以是数据管理员、数据团队或工程团队。数据目录消费者可能是 BI 团队、营销团队或数据团队。目录用户通常取决于您的组织和您要解决的用例。
无论这些用户是谁,都要确保他们参与决策过程。如果没有采用,您的数据目录就毫无价值。您需要获得预期使用该工具的人的批准。
一些数据领导者只邀请核心数据团队参与决策,而不邀请更广泛的消费者。这解释了许多数据目录项目的失败。预期的数据目录用户可能对核心数据团队选择的工具不满意。在这种情况下,公司通常会在流程的后期难以采用。
当考虑应该邀请谁来参加决策会议时,请考虑以下三组人:
数据团队:核心数据团队由数据工程师、数据科学家、数据分析师、分析工程师或任何向数据主管汇报的人员组成。他们既丰富数据目录,又使用数据目录。
SQL 编写人员:SQL 编写人员是核心数据团队,但也属于其他部门的人员。这包括销售运营、营销分析师或财务分析师。这些人向不同的部门报告,但他们也是数据目录的常规消费者。确保他们参与决策过程。
整个公司:公司的其他成员可能会偶尔准时检查数据目录。他们可能想检查损坏的仪表板的状态,或了解不同数据资产之间的关系。选择数据目录时,请带上这个群体的代表到房间里。
6. 确定要解决的能力
现在您有了支持者、预算、工具列表和利益相关者,现在是时候考虑您想要解决的功能了。
您是否正在寻找具有数据治理功能(例如访问控制和策略管理)的数据目录?您是否需要一个能够为您的数据提供出色搜索和上下文的工具?您是否需要一个可以让您探索数据流的数据沿袭工具?您是否需要所有这些功能?
数据发现:组织中所有数据资产的完整图景
知识:有关数据资产的所有背景、信息和专业知识
协作:允许不同利益相关者协作、共享使用、查询和分析的界面。
信任:与数据资产的数据质量和文档覆盖范围相关的信息。
治理:通过管理访问权限确保遵守法律和法规。
安全性:确保数据资产以安全、合规的方式使用。
数据目录通常提供六种核心功能,其中一些功能比其他功能更为出色。
在尝试不同的工具之前,请优先考虑要解决的功能。这将帮助您更准确地评估工具,并在做出选择时保持头脑清醒。
7. 定义成功
创建成功的 POC 需要仔细规划并考虑预期结果。考虑预期结果以及如何衡量POC 的影响。
成功是什么样子的?哪些指标将决定该工具是否通过测试?
考虑 POC 的时间框架以及需要实现哪些里程碑才能达到预期结果。需要收集和分析哪些数据点才能衡量 POC 的成功?
考虑哪些资源可以帮助您跟踪和衡量进度,例如使用情况分析和用户反馈。
最后,考虑POC 的成本以及预期的投资回报。所有这些考虑因素将帮助您创建有效的 POC 并衡量试验的成功。
这一步实际上是在前一步的基础上增加精度。一旦您选择了要解决的功能,就需要为这些功能设置一个指标,以确保您可以衡量成功。
您的目标可能包括:提高生产力、减少入职时间、消除重复数据、节省存储空间或减少查询运行时间。无论成功是什么样子,在比较不同的工具之前都应该非常清楚。
8.创造焦点
进行数据目录 POC 需要专注。很多时候,团队在 POC 期间想要实现太多目标,但最终却一事无成。
在 POC 期间,您无法记录所有内容,也无法满足所有用例。通常没有足够的时间或资源来做这件事。因此,不要贪多嚼不烂。
定义一个目标、一个数据库、一组用户和一组用例。在 POC 期间只关注这些。例如,这可能意味着简单地记录您最受欢迎的数据资产。
在开始数据目录 POC 之前,为项目设定一个具体的时间表也很重要。这个时间表应该切合实际且可实现,但又要足够雄心勃勃,以涵盖您的所有用例。
制定时间表将帮助您保持进度并确保项目及时完成。在时间表结束时,您应该清楚地了解您的用例是否已得到验证。
现代数据目录的完全部署和设置只需不到 30 分钟。因此,我们建议运行为期 2-4 周的 POC。这段时间应该足以让您确定某个特定工具是否能带来您期望的价值。
如果您没有在项目和时间方面为自己设定限制,那么风险就是您无法投入必要的努力来判断特定工具是否值得。
9.快速创造和分享价值
第一步是创建工具内部的价值。您应该从初始文档工作开始,以使软件首先具有价值。我们建议首先确定您最受欢迎的数据资产并对其进行记录。这是一项小小的努力,但将创造巨大的价值。
第二步是向更广泛的利益相关者介绍数据目录,介绍软件并解释其可以提供的价值。即使您只是在进行 POC,提高对该工具和评估工作的认识也很重要。
为了使 POC 成功,您需要在数据目录软件中创建一些价值,以准确衡量人们是否会使用它。我们建议使用以下两个步骤进行 POC:
在工具中创造价值将避免您陷入 POC 失败的境地,但您无法判断失败是因为您尝试的工具不适合,还是因为您没有在工具中创造价值。
10.选择现在和未来的伙伴
您已完成所有前面的步骤,并找到了天作之合。您已准备好实施长期数据目录。但是,还有最后一件事需要考虑:这个目录是否是未来的好伙伴?
完成购买后,您与供应商的关系如何?您会独自一人吗?如果是这样,这对您有用吗?这不是一个可以忽略的问题。
培训:您的团队将如何学习如何使用目录?培训是否包括所有用户?如果不是,是否需要额外费用?确保您已经了解入职培训。
支持:确保您了解不同级别的客户服务(电话、电子邮件、Slack)及其成本。务必让客户了解服务物流,例如客户服务是全天候提供还是仅在特定时间提供。
小结
采用数据目录具有长期利益,因此这是一个重要的决策。规划阶段应与决策的重要性级别相匹配。数据目录 POC 是测试水准并确定数据目录是否适合您的组织的绝佳方法。通过花时间规划、研究和与利益相关者沟通,您可以确保为您的业务选择正确的解决方案。通过了解每种工具的潜在优势和局限性,您可以确保从投资中获得最大收益。市面上有很多数据目录工具,它们专注于不同的垂直领域并解决不同的痛点。了解您的挑战是关键,因为它将帮助您选择最能满足您特定需求的工具。
往期推荐
谈谈如何成功实施数据治理
数据基础:OLTP 与 OLAP 数据建模的异同
全面了解什么是数据管理
确保企业数据质量的 11 个基本步骤
当今数据平台的建设策略及5个关键考虑因素
谈谈数据作为资源管理的重要性
数据基础系列:数据建模中的范式
数据资产管理方案