谈谈数据资产和数据产品的异同
如果说我们的行业擅长一件事,那就是为现有事物创造新术语。最新的是“数据产品”。如今,许多人使用该术语来描述数据资产:数据集、SQL 查询、仪表板、报告、ML 模型或数据组件。但这些类型的资产已经存在了几十年。那么,为什么要改名呢?
“数据产品”这个词听起来比“数据资产”更重要、更有价值。或者,数据产品听起来像是一个复杂的数据团队生产的东西。或者可能是因为数据现在已经成为产生收入的数字产品的固有组成部分。无论如何,我们不应该仅仅因为数据资产流行就将其称为“数据产品”。
什么是数据产品
数据资产和数据产品之间存在微妙但根本的区别。我认为数据产品是一种数据资产,具有可以在商店中买卖的东西的所有特征。现实世界中的大多数产品都可以在数字商店或实体商店中找到。商店是顾客购买产品以及卖家与顾客联系的中心点,消除了买卖之间的摩擦。在到达商店之前,产品只是资产或库存。一旦进入商店,产品就具有促进购物过程的某些特征:它们是标准化的、包装的、“可购物的”、可交付的和可退货的。
数据产品的工作原理是一样的。数据产品在驻留在数据存储中之前只是一种资产。在那里,它获得了新的特征:SKU、独特的元数据(订阅和交付选项)以及服务/使用条款,这些条款阐明了作为正式交易一部分的双向、有约束力的合同。此外,数据生产者可以根据需要对产品收费,或者免费赠送产品或评估退款费用(如果是内部交易)。从本质上讲,数据产品的外观、质量和行为就像在当地杂货店、硬件或零售店购买的任何产品一样,只不过它是数字和数据。
数据存储使数据生产者可以轻松创建、发布和分发数据产品,也使数据消费者可以轻松浏览、评估、比较和获取数据产品。这里的重点是外部的,即客户如何处理数据资产,而不是内部的,即开发人员如何构建数据资产、管理员如何管理数据资产或 IT 员工如何监控数据资产。公司应该像数据产品一样严格地构建数据资产。数据资产是数据产品的先决条件,但数据资产只有进入数据存储的数字货架后才能成为数据产品。本质上,数据产品是由其交易性质及其驻留和使用决定的。
数据产品与数据资产
由于其驻留在数据存储中,数据产品包含数据资产所不包含的事务元数据。要发布数据产品,数据产品经理需要定义订阅和交付选项、服务条款、访问权限以及 SKU 或产品编号。这些元数据可以帮助数据消费者了解数据产品是否能够满足他们的需求。
数据产品还带有双向合同,尤其是在进行买卖时。如果数据生产者不遵守服务条款,数据消费者可以取消数据消费者的订阅;如果数据产品不符合产品包装中定义的期望,数据消费者可以退回数据产品。尽管数据资产可能附带服务级别协议(SLA),但数据产品需要数据合同。
项目与计划。另一个区别是开发人员构建数据资产是为了响应服务请求、项目请求或架构需求。相比之下,数据产品是产品管理流程的结果,该流程涉及前期产品规划,然后是产品开发、打包、治理、客户支持和培训、产品增强和产品退役。这就需要一个持续的计划来生产和管理数据产品的整个生命周期,而不是一个固定时间的项目。这意味着比组织通常分配给数据资产的资源和人员的长期承诺以及持续的迭代和增强。
下表总结了数据资产和数据产品之间的差异:
数据资产 | 数据产品 | |
范围 | 内部的 | 外部的 |
要求 | 相互作用 | 交易 |
发现 | 数据目录 | 数据存储 |
使用权 | 临时或预定义 | 仅预定义 |
元数据 | 描述 | 订阅 |
合同 | 服务水平协议 | 产品保证 |
治理 | 项目管理 | 产品管理 |
数据资产和产品之间的相似之处
有针对性。尽管存在这些差异,数据资产和数据产品还是有很多共同点。首先,数据资产和数据产品都旨在服务于预先记录其需求的目标受众。如果不高度关注客户,数据资产和数据产品都不会发挥作用。
元数据。其次,数据资产具有元数据(架构、卷、所有者、沿袭等),可以帮助客户了解数据产品是否满足他们的需求:大小是否合适?它有正确的组成吗?是否已过期或过时;它是否来自正确的地方?它是由值得信赖的开发人员组装而成,由信誉良好的数据所有者监督,并由领先的高级用户用来构建关键任务解决方案。
治理、监控、保护和测试。此外,两者都必须受到管理、监控和保护,以在目标受众之间建立信任,并且必须持续测试和监控它们,以确保交付成果满足客户的期望。它们都可以成为业务或技术人员用来组装支持业务需求和目标的应用程序或整个解决方案的构建块。
小结
有些人将数据产品定义为具有明确元数据、严格治理、系统测试或持续监控的数据资产。这些都是数据产品的重要特征,但它们同样适用于数据资产。将数据资产转变为数据产品的唯一因素是其在数据存储中的可用性,这要求数据资产包含有关订阅和交付选项的元数据以及数据消费者和生产者之间的双向合同。
往期推荐