关于数据资产的一些思考(上)——读DAMA-DMBOK有感
The following article is from DAMA中国 Author 张振华
2015年7月第一届中国数据资产管理峰会首次提出了“数据资产管理”这一概念,把数据资产管理定义为对数据管理、数据治理及数据资产化的管理过程,与DAMA-DMBOK存在较大差异,严格区分了数据管理与数据资产管理。
自2017年11月中国信息通信研究院牵头发布第1版《数据资产管理实践白皮书》(以下简称为白皮书)以来,至今已发布了4版。白皮书认为能够为企业带来未来经济利益、产生价值的数据资源才是数据资产,同时定义了数据资产管理的八项职能,把数据管理升级为数据资产管理,介绍了数据资产管理的实施要点,数据资产管理实质内容包含了数据管理。
DAMA-DMBOK则认为数据即资产,把数据管理划分为十一项知识领域。
关于数据资产定义
Data is new oil! 把数据比作新石油是一个很恰当的比喻。
之所以称之为石油而不是汽油,是强调石油需要经过勘探、开采、储存和精炼才能使用,数据也一样,必须经过抽取、清洗、转换、集成之后才能使用。
同石油一样,数据的影响及使用面广。石油的发现以及开采技术的进步,使石油得以广泛应用,对社会、经济产生深远影响。同样,许多组织日益依赖数据支持日常运营与决策。由数据加工转变来的产品和服务,正在改变我们的生活,我们也正在被数据改变。
很显然,石油是资产,数据也是资产。
把数据比喻为new oil, 有别于oil,是为了说明数据与石油的不同,比如石油资源有限,不可再生,而数据在使用时不会被消耗,不会枯竭。
关于数据(资产)管理
DAMA认为在为了获得未来价值而进行投资的意义上,数据和信息不仅仅是资产,更是被称为信息经济的“货币”,具有货币属性,可以用来进行投资以增值。随着对数据的日益依赖,对数据资产的价值的认识变得更清晰,企业需要可靠的、高质量的数据来指导运营、战术和战略活动,通过削减成本和控制风险来提高运营效率,做出更有效的决策。
因此,数据管理的主要驱动力是使组织能够从其数据资产中获取价值,就像对财务和实物资产的有效管理使组织能够从这些资产中获取价值一样。无法管理数据类似于无法管理资金,导致浪费和失去机会。
白皮书中数据资产管理的定义基本参考了DAMA-DMBOK第1版定义。但它提出:数据资产管理依托大数据平台实现数据全生命周期的管理,支持以价值创造为导向的数据应用开发。显然这段话很值得商榷。大数据平台是什么?大数据平台管业务系统吗?没有大数据平台就不能管理数据资产了吗?
从广义的数据管理角度看,从DBMS诞生起,管理数据的工作就开始了。DAMA-DMBOK引入了彼得·艾肯(Peter Aiken)的框架,使用DMBOK职能区域来描述数据管理实践的四个发展阶段。
关于数据(资产)管理职能
关于数据管理职能, 白皮书参照DAMA-DMBOK第1版,定义了数据模型、元数据、数据质量、参考数据和主数据、数据安全等传统数据管理职能,同时整合数据架构、数据存储与操作等内容,将数据标准管理纳入管理职能,并针对当下应用场景、平台建设情况,增加了数据价值管理职能,视之为数据管理的升级版。
1.与DAMA-DMBOK相比,白皮书删减了关键职能领域:数据治理与数据架构。
首先要回答一个问题:数据资产盘点后该做什么?数据资产盘点,盘点有哪些数据资产,在形成正式资产目录之前,肯定有一些数据被排除在数据资产目录之外。这些数据为什么不被纳入资产或者说纳入资产的标准是什么?数据资产分布存在哪些问题?这必然要回溯到数据架构等问题。解决问题数据,降低数据成本与减少低质量数据的影响,从而提升数据价值,这应该是数据资产管理的核心工作。
2.增加了数据标准管理职能
白皮书将数据标准管理纳入管理职能,认为数据标准是数据模型的输入,也是数据质量评价的输入,给数据标准管理定了一个目标--实现企业大数据平台数据的完整性、有效性、一致性、规范性,推动数据的共享开放,构建统一的数据资产地图,为数据资产管理活动提供参考依据。
数据资产管理是企业级的,不应局限于某一平台,有些企业可能有多个数据平台,除了数据平台之外,还有很多业务系统,不可能搭建某个平台就能实现数据资产管理目标。
按照传统的数据库设计要求,数据的完整性、有效性、一致性是数据质量管理的目标。数据标准很难描述完整性,无论参照完整性(Integrity),还是业务完整性(Complete),一般语境下的完整性是参照完整性。
在其(白皮书)数据资产管理-实施-步骤中,数据标准是在数据资产盘点之后制定的。那么数据标准又如何指导数据资产盘点,构建统一的数据资产地图呢?
在具体实践中,数据标准的建设参考了成熟的行业数据模型。数据标准应界定可行的范围,参考成熟的行业数据模型,结合组织的具体业务与数据来设计,这是切实可行的低风险、低成本方案。
DAMA-DMBOK没有独立定义数据标准。在DAMA-DMBOK第1版中数据标准是数据治理的交付件,标准相关的描述符合我们关于标准的常识。DAMA-DMBOK第2版列了数据管理中一些可以标准化的内容,包括命名标准、需求规范标准、数据建模标准、数据库设计标准、架构标准等,数据标准属于数据治理知识领域范围。
3、增加了数据价值管理
每个组织的数据单位成本不一样,即使从管理会计角度出发,数据相关的成本也没有形成统一的计算规则与方法。IT项目内部常以功能点来估算成本(注意到白皮书中没有包含设计开发成本、数据生产成本)。但是在国内市场上存在一些不可思议的现象,比如一些项目零金额中标,这种成本更无法去比较。
数据资产评估的方法远未成熟,不可能很快成熟,所以,数据价值的管理主要是把“价值”的理念运用于基于数据架构的数据管理中,管理从创建、采集、存储、集成、分析应用到消亡退出的数据全生命周期。
DAMA-DMBOK全面覆盖了数据生命周期,从传统结构化数据到多结构、非结构化数据,从全面的知识领域到人员、流程,到组织文化变革,到伦理道德,给组织与从业人员提供了全面的数据管理参考。
“一个组织如果没有认识到管理数据和信息如同管理有形资产一样及其重要,那么它在新经济时代将无法生存”。--- Tom Peters汤姆.彼得斯,2001,美国乃至整个西方世界被称为“商界教皇”,顶级商业布道师。
关于什么是资产,尚没有一个被学术界和实务界各方面共同认可的权威定义。在DAMA-DMBOK 第2版中,关于资产的描述是:一种可以拥有或控制,持有或产生价值的经济资源。资产可以转换为货币。关于资产的分类也有很多种,不同语境下有不同的分类。
关于数据资产,业界也没有统一的表述,总结起来有两种不同的观点,一种观点认为数据即资产,如,DAMA-DMBOK中开篇即表明:“许多组织认识到他们的数据是至关重要的资产,可以使他们洞察其客户、产品和服务,帮助他们创新并实现战略目标”,“数据以及从数据产生的信息,是企业的资产,而且是不可或缺的资产”,因为它们具有商业价值,有形或无形,是实实在在的组织资产,可以理解为数据是组织生产过程中必须的经济资源。将数据和信息视为无形资产,类似于软件、文档、专业知识、商业机密和其他知识产权。即DAMA知识体系中,数据与数据资产并无二义。
另一种观点把数据与数据资产区分出来,认为能够为企业带来未来经济利益,为企业产生价值的数据资源才是数据资产,如中国信息通信研究院(数据资产管理实践白皮书4.0)。那么随之而来的问题是,如何准确、可靠地计量未来经济利益?哪些数据不能够带来未来经济利益?如何识别出这些非资产的数据?谁来负责对所谓的数据资产进行“资产属性”管理之前必须做的这些管理工作?毋庸置疑,任何组织或多或少都存在垃圾数据,这些数据不但不会带来价值,还需要投入各种资源进行清理等维护工作,这些是数据管理的一项日常工作。白皮书谈的主要内容还是管理数据。
为什么说数据即资产?Data is new oil! 把数据比作新石油是一个很恰当的比喻。
之所以称之为石油,而不是汽油,是强调石油需要经过通过勘探、开采、储存和精炼才能使用,数据也一样,必须经过抽取、清洗、转换、集成之后才能使用。
一般用品位来衡量原油的含油量,即原油的价值密度,数据也一样存在价值密度。数据资产与石油一样,低品位资源开发难度大、效益差。
还有一个相似点是数据同石油一样,都是基础资源,影响及使用面广。石油的发现,随着开采技术的进步与使用的快速扩展,对社会、经济产生了深远影响。同样,随着计算机大规模数据处理能力的提升,许多组织在日常运营中生产数据,并赖以数据支持日常运营。由数据深加工而成的产品和服务,正在改变我们的生活,我们也正在被改变。
我们可以认为汽油是资产而石油不是资产吗?很显然,石油是资产,数据也是资产。
为什么把数据比喻为new oil?new oil 有别于oil,是为了说明数据与石油的不同。
首先,石油资源有限,不可再生,古老的生物深埋在地下至少要经历漫长数百万年才有可能形成石油,石油被提炼消耗后最终成为二氧化碳等废物。随着地球上石油资源的日益减少,开采成本在增加。数据是无形的,在使用时可以衍生出更多的数据,不会被消耗枯竭。数据很容易产生,手机插入SIM卡即开始产生数据,数据产生的速度在加快。数据处理与储存的设备成本在不断下降,数据管理的成本随着人力成本与数据环境日益复杂而增加。
其次,石油存在普遍适用性,几乎每个组织与个人直接或间接地离不开石油。而数据则有其行业与个体适用性等,某些数据只对特定行业、特定组织有用,某些数据对某类客户价值很高,但可能对另一些客户毫无价值,可能没有一种数据是全民共同需要的。
第三,把石油提炼为汽油,有公认的产品等级标准,满足不同用户不同用途的需要,消费者一般可以不需要再加工即可以直接使用。而数据不一样,数据的内涵太丰富,不可能有统一的标准来定义数据的价值内涵与等级。
第四,石油有市场公允价值,随着市场需求变化等波动。数据的价值是与上下文背景相关的,通常会随着时间的流逝而变化,没有统一的标准,仍没有公允价值,难以简单统一的经济标准来衡量。
第五,实物资产可以触摸或移动,物理上任何时刻只能在一个地方,一份原油只能归属一个组织实体,或只能提炼出一种产品,用于一个用途。而数据是动态的,有时效性,易于复制和传输,可以用于多种目的,可以同时给很多消费者使用,出售给不同的企业组织,不需要实质的实体转移。也因此当数据被盗时不会消失,很难察觉,这意味着风险。
第六,组织的数据本身是唯一的,没有两个组织的数据是一样的,如果丢失或被破坏,则替换或将不可能或非常昂贵,这是与石油不一样的不可再生。
第七,数据资产的使用更专业,使用者需要深刻了解数据与其可能用途,理解组织的需求并把需求转化为输入要素(加入使用者自己的数据),设计算法,调整优化,才可能产生想要的结果。
以上这些数据资产独特属性差异告诉我们要对数据进行资产价值属性的管理需要面对很多不一样的问题。
数据资产的不同定义,代表了不同的资产观点。DAMA的数据资产观同时包含了两种资产观:不仅包含了经济资源观,还包含了未来经济利益观。作为组织生产运营的资源,以及使用所带来的未来经济利益,数据同时体现了这两种资产观。
尽管将数据作为资产进行管理存在不同的理解,在衡量数据价值方面存在诸多挑战,数据具有价值已是共识。组织应该把数据作为资产,主动积极地管理来获得持续价值。
随着大数据化、资产化热潮,许多组织意图让数据尽快变现,国内一些地方相继成立了数据交易中心或交易所。但是,数据是抽象概念,由于数据资产的特殊属性,数据资产与其他资产存在很不一样的价值特征,将货币价值纳入数据具有挑战性,很难建立将财务价值与数据关联的直接方法,使数据的价值难以评估预测。
首先,数据资产没有现值,未来的潜在价值需要通过使用来证实
DAMA认为在为了获得未来价值而进行投资的意义上,数据和信息不仅仅是资产,被称为信息经济的“货币”,具有货币属性,可以用来进行投资以增值。意味着数据资产具有未来的潜在价值,需要投资来实现,这个投资,就是管理与使用,数据资产的价值是管理与使用得到的。
货币资本持有者,最保守的投资是存入银行获得稳定的低风险的低收益(不考虑货币贬值的情况),如果想获得更大的收益,需要承担更高风险。而数据资产,没有天然的现值,没有吸收“数据资产”的“数据银行”,不会自然产生价值或升值。组织采购的软件需要经过使用来验证价值、发挥价值,与此类似,数据只有被挖掘加工使用后才有可能产生价值,并随着使用的覆盖面扩大与频度增加而增值,否则由于需要持续的存储、管理等成本投入而没有任何产出,事实上持续贬值。
其次,数据价值与其自身、组织、使用者等背景相关
对于每一个体数据集,数据自身是有上下文背景的,数据价值与数据之间的上下文参照完整性密切相关。如银行金融交易数据,其上下文背景为交易主体账户或卡,在银行某个网点或渠道,由具体的操作员或自助完成。互联网或手机制造商在网站/APP或手机上埋点截获的客户行为日志数据,如果没有日志的上下文-手机号或卡号等主数据,这类缺少上下文的孤立数据,其价值将大打折扣,甚至可能毫无价值。反之,客户主数据的价值,需要与其资产负债状况、交易行为历史与偏好、社会地位等关联才能体现。
数据与组织个体的具体背景有关。数据有很强的组织个体背景特性,尤其行业背景,对某个组织有价值的数据可能对另一个组织毫无价值。每个组织不可能产生一样的数据,即使相似的数据,如来自不同银行的10000条客户记录,价值也不一样。
使用数据产生的经济利益与使用者有关。数据的使用价值,依赖于数据使用者的管理与使用水平才能发挥出来。同样的数据,不同用户的需求与使用水平不一样,产生的价值不一样,可能创造出无限的成果,也可能毫无价值。
第三,数据资产的价值是暂时的
地下石油不管什么时候挖出来,不管是埋在地下还是经提炼后,作为能源的价值始终存在。数据价值有时效性,比如必须按监管要求及时上报数据,超过时间点可能面临巨额罚款。昨天有价值的东西今天可能没有价值,数据中的商机可能转瞬即逝,一些商业机密数据一旦泄露,价值即归零。
数据价值是动态的。某些类型的数据可能会随着时间的流逝始终保持有价值,某些类型的数据可能会随着时间的推移增值或减值甚至消失。以客户信息为例,随着越来越多的与客户活动有关的历史数据积累,一些客户信息可能随着时间的推移变得越来越有价值,更多的客户信息可能被证实为低价值。
第四,数据资产不一样的投资回报率ROI考量
主要体现在两个方面。一方面石油资源的开发等传统投资有明确清晰的投资回报率考量,如果勘探后发现品位低,开采成本高,没有投资价值只能放弃继续投资。数据管理是一项持续长期的工作,不仅仅要考虑投资回报率,还要考虑风险、合规等因素,有时不允许因为投资回报率低而不去投入资金管理数据。
数据的全生命周期每个阶段都涉及成本与收益,体现不同的价值。从数据创建到数据采集、分析应用,并不是只有在数据的使用与销售环节才产生价值,更重要的是数据的创建与问题的管理。数据生命周期不同阶段投资回报率不同,同样的投资用在规划、需求阶段,比用在维护阶段产生的价值收益大,要解决前期因各种原因导致的问题,后期需要更大的投入,ROI可能随着生命周期各阶段下降,所以,数据管理的投资应尽量前移(如促进数据源业务系统创建高质量数据,降低生产维护成本与提升数据的使用价值),在日常管理中用提升投资回报率 ROI来衡量数据管理的工作,从而带来整体价值的提升。
第五,数据资产不可交换
任何资产要实现其与外部交易的货币价值,必须可比较、可度量,才可交换。数据资产不能直接用于购物或与其它商品交换。与金融资产、实物资产等不同,不同数据集不可替代,不可交换。因为:
1)数据资产没有可以量化的参照系,生产维护成本和收益没有标准化,也不可能标准化。
2)就数据质量测量而言,虽然有测量数据定性和定量值的技术,但尚无用于测量的统一标准。
3)不同类型的数据无法比较价值,同类数据的比较,除了完整性等方面,更在于数据的背后价值,如一般来说村镇银行的一批农民客户名单的价值,远远低于大城市财富客户的名单。
数据资产的价值不具备普遍通用性,对于大多数组织/企业来说,不大可能通过出售数据来取得外部收益,资产的卖方总是小众。购买数据资产与购买股票的都是为了未来价值,股票市场的投资者获利者是少数,投资数据资产的价值,比股票投资更具不确定性,需要专业人士来管理。
联系我们
扫描二维码关注我们
微信:DaasCai
邮箱:ccjiu@163.com
QQ:2286075659
热门文章
我们的使命:普及数据管理知识、发展数据管理工程师行业、改变中国企业数据管理现状、提高企业数据资产管理能力、推动企业走进大数据时代。
我们的愿景:凝聚行业力量、打造数据工程师全链条平台,培养不同层级数据工程师人才、构建数据工程师生态圈。
我们的价值观:分享数据管理知识,持续提升数据管理和运营能力。
了解更多精彩内容
长按,识别二维码,关注我们吧!
数据工程师
微信号:sjgcs
构建数据工程师生态圈