魏江教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:“数据基础观”的建构
7月4日,中国数字经济发展和治理学术年会(2023)在清华大学顺利举办。本次大会以“数据要素治理,数据价值释放,数字经济创新”为主题,邀请了国内外40余位数字经济领域著名专家以及在数字产业实践中取得优异成果的机构代表进行主旨演讲和交流。来自清华大学、北京大学、中国人民大学、中国科学院大学、中国社会科学院大学、南开大学、上海交通大学、复旦大学、中山大学、南京大学等高校和数字经济相关科研机构及企业的代表共400余人出席线下会议,会议通过多个平台进行同步直播,当天信息浏览量超过11万人次。
浙江大学管理学院院长、浙江大学数字社科学科汇聚计划常务秘书长魏江教授以《“数据基础观”的建构》为题进行了主旨演讲。本文根据魏江教授现场发言内容整理。
魏江教授作主旨演讲
首先要感谢江小涓老师的鼓励和组委会的安排,我想大胆提出一个构念“数据基础观”,试图提出“数据基础观”理论框架思路。要提出这个构念,必须要界定清楚 “数据”与“数字”的关系。我一直在琢磨应该用“数据(data)”还是数字“(digital)”,因为两个词是混用的,数据是要素,数字也是要素。国家《“十四五”数字经济发展规划》提出,“数据”是数字经济的核心生产要素,对提高生产效率发挥乘数作用,但如果把“digital”作为技术属性的概念,数字确实也是生产要素,因为数字或者数字技术具有最新的技术属性,它是技术要素集合中最新的子集,技术和数字技术是包含和被包含的关系。考虑再三,我认为把“数据”界定为“数字技术的要素”肯定是不合适的,这里还是用“data”。
数据的出现和应用对企业理论有什么根本性的变迁?比照过去30年来一个非常重要的理论叫“resource-based view (RBV)”,数据就是资源框架内的要素。1959年Penrose提出的“企业是资源束的集合”,便有了“资源观”理论的最基本假设,并在80年代被广泛应用,甚至还衍生出资源依赖理论、资源锁定理论等。与此对应地,在数字经济时代,独特的生产要素应该是“数据data”,于是,今天我提出“数据基础观”这个构念,翻译为“data-based view”,简称DBV。
我认为,提出“数据资源观”(DBV)在数字经济时代是具有重要意义的。正如今天年会主题是“数据要素市场”,所以,迫切需要建立“数据基础观”的企业理论框架,来解释清楚数据作为生产要素的本质和条件。按照企业理论(the theory of a firm),企业(firm)究竟是由什么要素组成的?当新的生产要素出现并被用来解释企业为什么存在时,就需要建立相应的理论范式。2001年Michael Porter发表了一篇非常有影响力的文章,他认为,互联网技术和信息技术是完全不一样的概念,互联网是基础设施,他进而解释了互联网技术和竞争优势的关系。按照Coase的理论,当我们讨论一个企业为什么存在的时候,需要回答清楚四个基本问题:第一,企业为什么存在,如何用数据要素来解释企业组织的存在?第二,企业的边界在哪里?第三,如何以数据要素来回答企业竞争优势的建构?即企业如何利用数据来构筑竞争优势?第四,这些解释逻辑是不是能回答清楚现实世界的变化,也就是说,这个理论能回应管理实践?
一、为什么要从数据说起:DBV的起源
首先,需要明确“数据(data)”和“数字(digital)”、digitization和digitalization是不一样的。数据是要素的概念,而数字则是技术的概念。如果我们将数字化的问题定位在digital,本质上探讨的是技术问题,例如ABCD技术、IoT等。“数字产业化”和“产业数字化”本质上关注的是技术应用,而非底层逻辑。具体而言,数字产业化关注数字技术进行产业化的问题,其逻辑与传统“技术产业化”的逻辑是类似的,而产业数字化主要关注用数字技术改造产业,其逻辑与传统“技术采用”的逻辑相类似。因此,在我看来,只有说清楚数字化转型背后的底层逻辑是什么,才能更好地去回应现实和理论需求。
其次,当我们将数据视作要素或者原材料,其发挥的作用似乎可以与知识基础观中“知识”的作用相对应。尽管“知识”的概念在2010年前后是非常流行的,但由于知识很难去测量、评价,使得知识很难被资本化,知识基础观的研究就很难去解释“知识是否能参与价值分配”“知识是否可量化”等关键问题。与之相对应,由于劳动力、技术等要素是看得见摸得着的,因此它们是可定价、可交易的。按照这一逻辑,尽管数据具备实现“点石成金”的潜力,但将数据作为资源和价值来源的过程才刚刚起步。原因在于,倘若数据无法进行交易,那么它只能作为空气一般的存在,我不同意“数据是石油”这样的比喻。原因在于,石油是可以按照每桶来进行定价和交易的,但目前为止我们很难按照一个M或者一个T的标准来将数据进行定价。因此,只有数据变得可评价和可交易,其才有可能成为企业竞争优势的核心来源。
第三,如果我们用Y=F(L,K,D)这样的基础生产函数来理解数据的作用,那么需要解释生产函数中的D(数据),到底是什么?当企业将数据作为自己核心能力,就意味着数据成为了企业生产函数内的一个关键factor,即它可能和土地、厂房、劳动力、技术等生产要素组成集合以发挥作用。在此基础上,需要进一步解释在这个函数里数据是何种存在?有一种观点认为,“数据是独立的要素”,即数据是与劳动力、资本等传统要素一样独立的存在;还有一种观点认为“数据是渗透在传统要素之中的催化剂”,即数据必须要和资本、技术、劳动力等传统要素交互,才能形成综合效益。这一观点的基本逻辑上,因为有了数据,企业可以更好地做技术开发、改变生产流程、变革组织结构、利用土地等。因此,data到底是独立要素,还是渗透在传统要素中的催化剂,则需要在DBV理论里面能够给予回应。
第四,基于“数据是一个生产要素”的认知之后,需要进一步关注大型的平台企业、生态组织如何将数据转化为自己的核心竞争力?事实上,几乎每个企业都有大量的客户数据、产品数据、交易数据,但只有极少部分的企业将数据转化为自己的核心竞争力,这背后的机制需要进一步打开。其逻辑主要有两方面:
(1)数据无法独立存在,数据要素化的过程是和算力、算法紧密耦合的,缺一不可,任何企业如果没有强大的算力和算法支持,数据就没办法完成要素化和价值化的过程。(2)由于数据所具有的高流动性、低嵌入性、可重新编程性等特点。这些特点导致了即使每个企业都会产生数据,但只有极少数的企业才能够产生数据资本,进而将数据转化为自己的竞争优势。
因此,我们认为DBV两个基本的学理逻辑是“数据要素化”和“数据价值化”。具体而言,前者关注数据从获取、标签/属性化、清洗、结构化、应用的过程,关注企业如何将数据从“空气”转化为“package”,而这一过程要依靠企业技术层面来解决;后者关注数据从结构化、可评估可交易、资本化、价值可分配的过程,原因在于,数据要素化之后并非意味着其会立刻为企业带来价值,而数据价值化就是关注企业如何将结构化的数据转化为资本的过程,而这一过程要依靠管理和经济层面来解决。
在此基础上,DBV才能去解决和回应数据塑造企业竞争优势的问题。如果要变成将这一过程转化为理论,就要回答四个关键问题:
(1)基本内涵:什么是DBV?基础概念是什么?
(2)基本特征:相比于过去的资源要素,数据有什么独特的特征?
(3)学理逻辑:基于数据的特点,企业如何将其转化为竞争优势?
(4)理论假设:数据转化为竞争优势背后的理论假设是什么?所形成理论的鲁棒性是否成立?
二、数据如何塑造组织边界:基于DBV的解释逻辑
在前述问题基础上,我们进一步思考“数智时代下企业的边界在哪里?”的问题。企业是市场的特殊形态,是有边界的市场。打个比方,太平洋上存在一个个独立的岛屿,这些岛屿彼此之间会进行交易,这就是企业和市场的关系。可见,在传统情境下和理论范式中,企业和产业的边界都是清晰的。在数智时代,在数据要素特性(高流动性、低嵌入性、可重新编程性)的作用下,企业边界发生了巨大变化,基于地理、产业等划分的边界逐渐走向模糊和融合。
我们希望用DBV进一步去重新审视企业和市场的关系、组织和个体的关系,进而对于企业边界的问题给予回应。
(1)个体与企业的关系:1)个体与企业的关系正在从紧耦合走向松耦合,即每个人可以独立就业、独立从事生产活动,无需受到组织的束缚。原来在组织内部是“一个萝卜一个坑”,每个岗位都要深度嵌入在组织内部,但现在“平台+微粒”这种新型的产业组织形态的力量已经愈发强大。中国14亿人口中有1,400万的快递小哥,跟快递行业的劳动力就业人员达到了1.35亿,而这些个体并没有被锁定在组织内部,而这背后也暗示了组织和个体之间关系的重塑;2)组织与企业:组织的内部出现了大量的小组织群落、生态内的子单元。例如钉钉里面出现了几千家互补企业,他们共同构成了一个生态的cluster,这暗示了企业内部的组织(intern organization)与企业的关系也发生了重构;3)组织与市场:组织内的子单元可以直接与外部/市场进行交易,而不需要组织内部的市场部去设定标准,组织内部的每个子部门可以在底线的基础上在市场上进行自主定价。通过构建中间交易机制,小组织可以综合集体的力量和个体的力量去市场上进行交易;4)个体与市场:C2C、C2F等模式的出现,如网红群体,使得个体可以直接与市场进行交易。
(2)组织形态的重构。我们立足于数据作为生产要素,进一步对新组织形态发生的改变做出回应,思考“为什么可以用DBV来解释”的问题:1)基础模块的微粒化,个体在今天已经成为系统内相对独立存在的一个模块;2)组织架构平台化,组织结构从层级制变成了市场化和平台化的结构。只要企业拥有平台、拥有算力和算法,它就随即拥有了控制、赋能和引领成千上万“微粒”的能力,通过依靠数据实现对组织内部的控制和协同来赋能个体的创新发展,这进一步塑造了企业边界的无限拓展。3)组织关系网络化,那么如此庞大的微粒个体无法依靠科层制等传统方式进行内部治理,关系治理、信用治理变得越发重要,对于治理主体来讲,设定好底线变得十分重要。4)组织情境生态化,在今天“产业”的概念逐渐走向消亡,产业边界正在逐渐走向融合和模糊。现在的组织将外部交易和内部协同进行自主融合,进一步使得组织的边界被打开。
(3)组织内部逻辑的重构。如果关注DBV最底层的逻辑——数据是要素,那么就会涉及到交易、价值分配、数据竞争等问题。如果有平台、算法、算力,那么“微粒化”的问题就是思考如何用数据去控制基础模块,“网络化”的问题是组织间的关系靠数据来链接。例如,伊芙丽和阿里的例子看出,阿里和企业之间有的是松耦合,有的是紧耦合,有的是半松半紧耦合,大小平台之间会基于数据进行博弈、合作、竞争。我把算力和算法纳入到组织基础设施中,没有强大的算力和算法,是无法支撑起数据要素化和价值化的过程。由此,组织内部就形成了底座基础设施、数据仓库架构、企业/产业数据架构、应用场景终端等所构成的后台、中台和前台的组织生态系统。
(3)组织内部逻辑的重构。如果关注DBV最底层的逻辑——数据是要素,那么就会涉及到交易、价值分配、数据竞争等问题。如果有平台、算法、算力,那么“微粒化”的问题就是思考如何用数据去控制基础模块,“网络化”的问题是组织间的关系靠数据来链接。例如,伊芙丽和阿里的例子看出,阿里和企业之间有的是松耦合,有的是紧耦合,有的是半松半紧耦合,大小平台之间会基于数据进行博弈、合作、竞争。我把算力和算法纳入到组织基础设施中,没有强大的算力和算法,是无法支撑起数据要素化和价值化的过程。由此,组织内部就形成了底座基础设施、数据仓库架构、企业/产业数据架构、应用场景终端等所构成的后台、中台和前台的组织生态系统。
三、数据成为企业竞争优势来源:基于DBV的解释逻辑
对企业而言,目前数据尚难以资产化,且收益无法评估。为此,企业需要从五个问题出发应用数据基础观:什么是数据?数据有什么用?数据属于谁?谁管理数据?如何应用数据?这五个问题解释数字基础观下企业需要什么样的治理体系和运营体系以构建竞争优势。
数据本身并不具有价值,数据的价值和使用者的能力(包括AI、算法、算力)是有关系的,这可能是数据的一个重要本质特征,所以我反对基于数据本身的交易,这里可以对照企业资源观理论的VRIN模型来看数据。数据要素打破了资源的价值性、稀有性、不可模仿和不可替代性四个属性的要求。对于企业而言,一个关键问题是如何平衡数据私有性和公用性的问题。我认为企业不应该被公有数据所绑架,而是要充分关注和利用私有数据,构建起自己的私域数据。另外,目前实践中广泛存在的还是技术管理体系,而非数据管理体系。但事实上,把握好数据的管理和存储问题是十分重要的,目前99.9%的企业还没有这个能力。
当然,数据要转化为竞争优势,需要发挥能力的调节作用,特别是AI能力、学习能力。在AI能力方面,AI本质上就是属于“如何用数据”的问题,AI本质上是算法,不仅仅是人工物。我们最近做的一个研究中,把AI分成了两种算法:Deep learning和Traditional learning,我们发现两类AI对于创新和learning的影响路径是不同的。Deep learning更适合于去产出和促进exploratory innovation;而Traditional learning更适合于促进incremental innovation;数据应用导向的不同会导致数据资源结构化的方向和数据利用的方向和路径会有差异。
四、数字生态系统成为全球竞争主体:DBV解释现实世界
现实中为什么今天会出现苹果、阿里这样具有万亿美元级别的企业?这种企业内部和外部的边界在哪里?为什么今天杭州就依靠阿里一家企业就能够撑起杭州1/10的GDP?在这种平台内部,生产者、劳动者、员工等等是如何存在和就业的?
我们希望用DBV就可以尝试解释这些问题。因为数据资本的存在,促成了巨大商业寡头的出现。“谁拥有数据资本,谁就是商业寡头”。未来全球竞争的导弹就是平台,平台是国家竞争优势之所在。谁拥有这个平台,谁拥有了算力和算法,谁就具有了全球性竞争能力,譬如说抖音、天猫。
到今天,生态企业已经成为全球竞争的主体,今天的竞争是生态间的竞争。原因在于,当前竞争主体正在从个体走向生态。因为数据发挥的作用,今天生态内的竞争、生态间的竞争正在取代产业内、产业间、产业位的竞争。在数字经济时代,因为关系和结构变了、组织形态变了,因此产业内value chain已经转变为了ecosystem。接下来,我们需要继续回答,平台和参与者怎么更加理性的思考协作和合作,需要用生态系统视角下的竞争模型来取代波特五力模型。曾经产业内的问题是前向一体化、后向一体化,我们现在讨论需要关注系统的构建问题,如何ecosystem里面怎么建平台,怎么建基础设施等等。我一直深信,“谁拥有了底座,谁就拥有了话语权”。
推荐阅读
1. 叶强教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:数字经济时代的创新与人才培养
2. 孟庆国教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:一体化推进政务数据体系建设的思考——基于数据权责的视角
3. 毛基业教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:中国数字经济快速崛起的驱动力
4. 蔡跃洲教授在中国数字经济发展和治理学术年会(2023)上的主旨演讲:数据资源、数据要素与数据规模-价值创造视角的统计测算框架构建