其他
董学耕 | 数据基础设施论纲Ⅳ——作为新质生产关系的数据基础设施
摘要:数据基础设施不仅是一整套释放数据要素价值的基础设施,而且在数据价值化中还必须保障和平衡数据相关主体的价值权益,既要体现效率,也要促进公平,因此它实际上体现了数据生产关系,成为反作用于数据新质生产力健康发展的新质生产关系。本文在数据四大属性(主权属性、人身属性、公共属性和价值属性)基础上,论证了数据相关主体(主权国家、社会公众、数据处理者、数据来源者、数据使用者等)各自的数据权益,包括价值权益和安全权益;在深入分析数据技术特性和经济特性特别是其中的数据整体性、规模经济、范围经济和边际效用递增特性基础之上,论证了相关主体数据权益的一致性;进而在政治经济学层面上论证了数据个体所有制和数据共有制的辩证统一。需要发挥数据基础设施作为数据新质生产关系的作用,落实好数据产权关系、生产关系和分配关系,保障数据相关主体各自权益,使其密切协同一致,以充分发挥数据要素特性,真正让数据要素价值化、价值最大化,从而促进新质生产力发展。同时,更好发挥政府在数据要素收益分配中的引导调节作用,通过数据税对数据价值权益进行二次分配,以保障公共利益,抑制巨型平台垄断和寻租,并向数据来源者进行二次价值补偿。最后,数据个体所有制和数据共有制之辩证统一基础上形成的数据新质生产关系,以及承载这个新质生产关系的数据基础设施,能够最好地诠释在新时代中国特色社会主义市场经济条件下建立数据个人所有制,即重建马克思所倡导的个人所有制的伟大实践。关键词:新质生产力;新质生产关系;数据基础设施;数据权益;技术资本主义;数据财政;数据共有制;重建个人所有制前文[1-3]我们已经论述了数据基础设施的基本架构,包括了元数据基础设施、数据公共化基础设施、数据价值化基础设施、数据权益基础设施,以及数据安全基础设施。本文将论述数据基础设施所形成的数据生产关系,作为新质生产关系,以促进以数字经济为主要内容的新质生产力的快速和充分发展,极大释放新质生产力,增强经济发展的新动能。我们知道,生产关系包括三方面的内容:一是生产资料的所有制形式,即劳动资料和劳动对象归谁所有;二是人们在生产过程中形成的地位及相互关系;三是由以上两个关系形成的分配、交换、消费关系。简要说,生产关系的三要素即生产资料归谁所有,人们在生产劳动中的地位和相互关系,消费品的分配方式。也就是(广义的)生产关系包括产权关系、(狭义的)生产关系和分配关系。《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(即“数据二十条”)[4]是我国加快构建数据基础制度的指导性文件,从数据产权、流通交易、收益分配、安全治理四个维度,梳理了数据生产关系。1.数据要素的特性1.1数据定义及四大属性数据是从物理空间到赛博空间的映射。物理世界的元素映射到赛博空间的数据。物理世界的元素x即数据的关联对象或关联物。数据=f(关联对象或关联物)记为:d=f(x)f为映射,反映x的某个侧面、属性或行为;d为数据。但事实上,这个映射还与x的位置p、时间t相关,应记为:d=f(x,p,t)也就是说,数据记录了物理世界的元素(关联对象或关联物)在某时某地的某个侧面、属性或行为,成为信息。质而言之,数据记录了人类的实践活动,成为现实世界的实践信息。因此,数据反映了物理世界的某个侧面,即作为信息的“记录”载体。同时,信息便是数据“记录”的内容。[5]数据和信息的关系是形式和内容的关系。在符号学的意义上,信息处于语义(内容)层,而数据则处于句法(符号)层。或者说,它们分别对应符号的所指和能指。它们既有区分,又不能割裂开来,而需要统一为一体。区分的目的在于分类规制,这也是我们在文献[6]中对数据的所指不同而进行分类的依据,数据需要分为涉私数据和非涉私数据等,同时,也才便于基于内容的分类对不同数据进行不同的形式化处理。正因为我们依据数据和信息的形式和内容进行了细化分类,即已经明确区分了形式和内容,同时又不能割裂形式和内容,在此前提下,我们不再区分数据和信息,除非特别指明,数据(侧重形式)和信息(侧重内容)相统一,可以通用。从现实世界的实践逻辑来规制数据空间的结构逻辑,数据具有主权属性、人身属性、公共属性和价值属性等四大属性,其位阶等级顺序是:主权属性>人身属性>公共属性>价值属性。这从根本上规定了数据要素的特性。[1-3]1.2数据要素的技术特性数据的技术特性是由数据属于数字空间(赛博空间)决定的,也就是由赛博空间的特性决定的。例如,(1)多主体采集,(2)多角度记录,(3)多媒体形式,(4)多模态共存,(5)依赖存储载体,(6)可复制,(7)可转移,(8)易传输,(9)无磨损,(10)使用非排他,(11)使用隐蔽性,(12)数据状态信息不对称,等等。特别注意,第一,可复制,可转移的特性,也就是数据可共享、可开放,这在技术上无障碍,几乎零成本。因此,一方面,数据完全可以便利地实现共享开放;另一方面,数据如果不加保护,价值就等于零。可见“数据不出域”的要求不仅出于数据安全需要,也出于数据价值化需要。第二,数据在使用上的非排他是正向特性,可以广泛使用;数据使用的隐蔽性和信息不对称则是逆向的,可能导致数据滥用,而必须加强这方面的法律法规建设,加强监管,落实数据相关方的知情权等权益。1.3数据要素的权益特性数据要素化旨在让数据进入生产、流通过程在开发利用中产生经济价值。数据要素价值化首先要理清楚数据权益。数据权益涉及到数据相关主体,即数据权益是数据相关主体的权益。根据数据的主权属性、人身属性、公共属性和价值属性等四大属性,数据相关方包括了主权国家、社会公众、数据来源者(即关联对象、数据主体)、数据处理者和数据使用者,其中数据处理者包括生产主体和价值载体。数据相关方的数据权益包括(1)价值权益和(2)安全权益。我们将在第3部分详解。1.4数据要素的经济特性价值属性是数据要素化的依据。数据要素化在于使用,在于进入生产、流通过程,进入经济循环,发掘其价值属性。数据价值化其实就是发掘其蕴含于人身属性和公共属性中的价值属性。数据要素的经济特性主要就是指数据要素的价值特性。数据的价值特性是由蕴含在数据中的人类劳动决定的,具体到交换价值,是由数据构成的数据产品在具体应用场景中的使用决定的。因此,数据要素的经济特性围绕数据产品化这个核心。使用价值决定数据产品的市场价值,通过市场博弈而形成价格机制。数据要素的经济特性或价值特性主要包括:(1)数据产品服务功能的相对独立性;(2)数据产品的场景相关性;(3)数据产品的瞬间集成特性;[7](4)数据产品的价值稳定性;[7](5)数据产品对安全可信数据空间等数据基础设施的依赖性;[8,2,3](6)数据产品要求数据集合具备整体性;(7)数据产品的所有权和数据资产特性;[9-11](8)数据产品来源数据的实时性;(9)数据产品来源数据的用益物权和数据资源特性;[9,10](10)数据可脱敏,包括去标识化、匿名化;[12](11)数据可治理,形成数据中间产品并产生新价值;[12](12)数据时效性,数据贬值快;(13)数据规模经济特性,数据边际效用递增,数据交互倍增;(14)数据范围经济特性,数据范围越大,多样性越强,价值越大;(15)数据平台化;(16)数据生态化,等等。特别注意,第一,关于(1)数据产品服务功能的相对独立性和(2)数据产品的场景相关性,这是数据产品的定义决定的。数据产品需要相对独立地对外提供服务,有两大核心特征:一是面向应用场景;二是需要有数据嵌入才能提供服务。[3]这也就同时要求(8)数据产品来源数据的实时性。第二,关于(6)数据产品要求数据集合具备整体性、(12)数据时效性、(13)数据规模经济和(14)数据范围经济,这是和其他生产要素非常不同的经济特性。我们在文献[3]中举了导航APP的例子。人们在使用导航APP的同时,又作为导航APP的数据采集端,在并不泄露个体数据的情况下,众多使用者的实时位置、速度数据作为导航APP研判道路是否拥堵的依据,并为其他使用者规划出行路径提供帮助。这就是数据产品在个人利用同时产生的公共利用,并在公共利用中产生新的使用价值。从中可以看到,一是数据时效性非常重要,一方面需要历史数据对导航进行大致规划,但更需要实时数据对导航进行实时精准规划,并随时调整,而对于实时精准规划,之前的历史数据就价值不大了,上一个时刻的数据在下一个时刻的规划中价值在快速衰减,直至趋近于零。二是数据整体性非常重要,没有整体性,就没有服务具体场景的数据产品。尽管离开个别数据特别是自身数据无法进行精准导航,但是如果没有历史数据、无数他者数据的背景,也同样无法为个体进行精准导航。个别数据是在整体数据的背景上发挥作用。三是数据规模经济和范围经济非常重要,衡量一个数据产品价值,没有一定规模是不可能产生价值的,而且规模越大,往往价值也越大。同一个区域,时空划分越精细,涉及主客体数量越多,使用频度越大,也就是数据量越大,数据产品能力越强,使用价值就越大;在同样的数据密度下,涉及区域越大,数据产品价值越大,省级应用大于县级应用,国家级应用大于省级应用,等等。可见,数据的人身属性和公共属性在价值权益上具有一致性,并产生效用递增的经济价值。这种边际效用递增效应意味着数据公共性越大,价值性也越大。因此,我们一方面强调数据关联对象对数据的决定权,另一方面还要同等强调数据的公共属性,让两方面的价值一致起来。数据的主要价值在于社会交往和社会利用,即对公众有用。数据不是为了保护而保护,而是为了利用。即使对于涉私数据(不等于隐私数据),其主要价值也在于社会交往的可识别性。对于关联对象而言,自利与利他是一致的,在行使对数据的安全自决权的同时,也要让数据贡献到数据的整体性、规模性、范围性之中,在数据的公共属性中才能更好发挥自利性,发挥对自身、对公众的更大价值。这种数据规模性、范围性和整体性以及人身属性、公共属性在价值权益上的一致性也是数据作为人工智能大模型预训练语料的理论基础。通过形成规模化、整体化的逻辑真实数据集,赋能人工智能大模型预训练。[12]第三,关于(15)数据平台化和(16)数据生态化,正因为数据的开发利用依赖于以安全可信数据空间(如海南数据产品超市)为核心的一整套数据基础设施,数据要素的经济特性使其必然会向平台化发展,并在平台基础上形成数据生态系统。平台会充分利用数据的规模性和范围性,数据要素利用的平台网络越大,生态越丰富,平台价值的边际效用递增就越明显。2.数据要素是能动的新质生产力数据要素的特性,包括技术特性、权益特性和经济特性,决定了作为新的生产要素,其所催生的生产力、生产关系的新质属性。数据要素是新质生产要素。2023年9月,习近平总书记在黑龙江省实地调研时首次提出“新质生产力”的概念,之后在多个场合又反复阐释:“新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。”新质生产力“由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生,以劳动者、劳动资料、劳动对象及其优化组合的跃升为基本内涵,以全要素生产率大幅提升为核心标志”。在新质生产力的发展中,以互联网、大数据、云计算、人工智能等为代表的数字技术快速发展,数据成为新质生产要素,极大改变了劳动对象和劳动资料形态,推动新型劳动对象和新型劳动资料不断涌现,使数据要素成为新质生产力中最为能动的部分,构成数据新质生产力。数据不但是必不可少的生产要素,深刻融入生产、分配、流通、消费和社会服务管理等各环节,而且可以通过汇聚、重组、融合等途径多层次、多元化地实现价值倍增,与传统生产要素紧密结合,双向赋能,从而提升全要素生产率。在这个过程中,数据基础设施全面赋能数据新质生产力的发展,是数据新质生产力的重要载体。我们知道,生产力具有三要素,即劳动者、劳动资料、劳动对象,我们将从三要素及其优化组合的角度来考察数据要素对新质生产力的贡献。2.1数据劳动者数据权益相关方都是数据生产力的贡献者,都是对数据要素价值化发挥作用的数据劳动者。首先,数据产品开发者是直接的数据劳动者。我们在研究数据价值化时曾经指出,数据产品化是核心,正是通过数据产品开发者,数据产品才得以生产出来,开发者是数据产品制造者,是直接的价值创造者,直接创造面向应用场景的使用价值。其次,来源数据提供者也是数据劳动者,其中的生产主体通过数据采集、治理等劳动而成为数据产品生产的“原材料”供应者,价值载体通过数据存储、治理以及平台工具提供等劳动成为数据产品生产的“装备”供应者,都共同参与了数据产品的价值创造。当然,细分的话,还会有从事数据产品流通、交易、营销等环节的数据处理者作为劳动者。再次,关联对象(数据来源者)也是间接的数据劳动者,随时随地在主动或被动地贡献数据。这点,我们在前面论述数据要素的经济特性,特别是数据的人身属性和公共属性在价值权益上的一致性时已经充分说明。最后,数据产品使用者也是贡献者,也是间接的数据劳动者。关于数据使用者的贡献,举例来说,在ChatGPT诞生后,2013年诺贝尔化学奖得主迈克尔·莱维特堪称使用频率最高的人,短短一年多时间,他已经向ChatGPT提出了4万多个问题。他的结论是,ChatGPT最大的特点是“你笨它也笨,你聪明它也聪明”。也就是说,它的智能程度取决于人类的提问能力。[13]从中我们不是看到了使用者对大模型的贡献吗?高质量的提问是高级的智力劳动,借助于这种劳动,大模型得以学习、提高。其实,数据使用本身也产生新的数据,使用过程也是贡献数据的过程,不同场景中的数据使用还叠加新的效用。因此,数据使用者也是间接的数据劳动者。并且由于这种使用,新产生的数据加入到数据产品生态系统中,在数据流量集聚中形成生态循环和价值递增。同时,随着数据产品的大规模生产、大规模流通、大规模使用,全民数字素养会不断提高,这是数据生产力的不断提升,不仅数据处理者,尤其是数据人才,而且数据来源者、数据使用者作为数据劳动者,对数据生产力都会做出越来越大的贡献。2.2数据作为劳动资料劳动资料是劳动者在劳动过程中用来改变或影响劳动对象的一切物质资料或物质条件,劳动资料中起决定作用的是生产工具,生产工具是生产力高低的主要标志。无需赘言,在当今数字化或信息化时代,信息技术已经成为最重要的生产工具,以数字产业化、产业数字化的形式赋能千行百业,具体体现在各类以数据赋能的数据产品中。这正是“产业互联网”“数据要素×”“人工智能+”等行动中所展现出来的数据对生产能力的极大促进和提升。例如工业软件,例如智能运输工具,等等,都是重要的数据产品,作为生产工具,都在极大提高全要素生产率。2.3数据作为劳动对象劳动对象是把劳动者的劳动加在其上的一切物质资料,