张立榕|数据生产要素化的历史进程:生产力与生产关系的视角
张立榕,清华大学马克思主义学院博士研究生。
摘 要
在当前的经济社会中,数据已经成为一种重要的生产要素。从马克思主义政治经济学的角度审视数据被生产要素化的历史进程,结合生产力与生产关系的理论框架可解释数据的演变与发展。数据在前信息化和信息化两个时代的发展差异反映出信息技术进步下社会宏观生产力的变迁,也折射出内嵌在数据中的生产关系与社会关系的变化。从“数据+算法+算力”的视角来看,数据对社会生产力具有改造和重塑的作用。作为全球数字科技大国,中国在数字生产力方面拥有巨大潜力,唯有平衡好数字生产的发展与数字生产关系的治理,我国才能在数字时代的全球性竞争中拔得头筹。
2022年12月2日,中共中央、国务院印发了《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《意见》),这标志着我国在数据战略顶层设计上的进一步完善与发展。《意见》指出:“数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。”当前,数据的生产要素属性毋庸置疑。我们常常将数据和大数据、互联网、计算机、平台经济等技术联系起来,但数据并非当今时代的新近产物,其诞生可以追溯至人类文明的早期。当人类的思维和语言系统逐渐进化到能够传达有意义的信息时,甲骨、岩石、竹简、草纸等便成为信息符码化的物质载体,早期的数据形态也随之应运而生。发展至信息化时代,数据的形态更加多元,应用也更为广泛,最终进化到当前我们所熟知的“大数据”阶段。而这一过程也伴随着人类从农耕文明到工业文明,再到现在的“数字文明”的演变,其背后的推动力是生产力和生产关系这对矛盾的发展与进步。
那么,数据的早期形态和最新形态具有哪些特征和差异?信息化时代的数据如何成为生产要素参与改造生产与流通环节,从而促进资本价值增殖?数据的演变与生产力、生产关系的变革存在什么样的关系?这些都是本文想要从马克思主义政治经济学角度探索的问题。本文旨在从历史唯物主义的视角出发,将数据放置在生产力发展的纵向视野中考察。首先,数据的发展经历了从前信息化到信息化两个阶段的发展,二者在数据的控制主体、获取方式、应用范围等方面皆存在明显的不同。这一变化既反映了以信息技术为代表的生产力变革的宏观社会背景,也折射出数据所包含的生产关系与社会关系的变化。其次,数据已经被视为一种新的生产资料,算法和算力可以视作数字生产力下新的生产工具形态,生产资料与生产工具的不同组合方式既是生产力发展的结果,也反映出一个社会生产力水平的变迁,因此本文引入了“数据+算法+算力”的视角去理解数字生产力的发展及表现。最后,数字生产力的竞争在全球范围内如火如荼地上演,要想在数字时代的比赛中拔得头筹,我国就要平衡好数字生产力的发展和数字生产关系的治理。
前信息化时代:行政工具与初级商业手段的数据
早期的数据形态是数字,它的诞生比文字早了几千年。公元前3000年左右,尼罗河流域的古埃及人创造了十进制的象形数字,并经由阿拉伯人传递到全世界,这套在当代社会依然通行的数字体系被命名为“阿拉伯数字”。和声音、符号、图案、文字等其他交流工具一样,数字的产生来源于现实社会的需求——表达并记录事物的特征。随着人类社会的不断发展,社会交往的逐渐增多,越来越多的事物可以被数字记录下来,从而人类对数字的质量有了更高要求,由此产生了数据。数据摆脱了数字的单一形态,人们可以通过对大量数据的整理和分析解读出更深层次的含义并以此来探索社会发展规律。
(一)数据与人口控制
在古代社会,最重要的生产资料是土地和劳动力,封建政权的统治往往需要稳定的劳动人口,一个政权所掌握的户籍数据越详细,统治也越稳定。无论东西方,早期数据主要服务于统治阶级的人口统计,以便执行赋税制度和徭役劳动,从而强化政府对人民的管理和规训。在古代中国,汉武帝时期推行“编户齐民”,将政府控制的人口按照姓名、年龄、籍贯、身份、样貌等情况一一载入户籍,这可以看作早期的个人身份数据化行动。到了明代,朱元璋在玄武湖上建立了一个专门的国家数据档案库——皇册库,除了人口信息,还对全国土地的数量多寡和质量优劣进行了详细登记,天下在统治者的眼前愈发透明与可控。及至近代,清政府为了“预备立宪”而开展的全国人口统计被认为是中国在现代意义上的第一次人口普查。在西方,中世纪的英格兰就有统计人口和财产情况的记录。此外,数据也服务于政治领域。例如,美国开启数据分析大门的实践就是在1790—1820年间,通过人口数据对政治议席进行分配以及20世纪早期为了竞选而开展的民意调查。
(二)数据商业应用的肇始
数字以及通过数字发展起来的统计科学对人口与社会建立起某种程度的“控制”。数据统计作为一种规范化的工具,开始在更广阔的社会视野中发挥作用。伴随着经济的发展,数据的应用逐渐拓展到商业交易领域。数据在当今社会最典型的商业应用就是将用户的人口统计学数据应用于广告的精准投递。这一商业模式的起源可以追溯到19世纪80年代在西方开始的直接邮递广告(direct-mail marketing)。直邮广告使用的个性化消息对消费者行为偏好有很好的把握,这依赖于对个人信息的有效收集和处理。同时个人信息的产权被视为数据收集者的财产,而不是收集数据对象的财产。在当时,法律也没有对数据所有权做出具体的规定,这导致对数据的占有默认能够通过数据获益。部分公司拥有自己的数据收集和处理部门,但是大部分公司将这一项工作外包给专业的第三方机构,这类机构避免了不同公司对相同数据的重复处理,同时利用数据的规模效应降低了成本,数据的非排他性和共享性使这类机构更加蓬勃发展。随后,社会量化部门(social quantification sector)的扩张继续推动美国信息基础设施的大规模建设和信息技术的进步,越来越多的经济活动和社会关系可以用数据和信息的形态展示,由此美国率先完成了早期的数据积累过程。此外,数据还零星应用在其他领域,例如查找疾病原因、城市规划、绘制地图等等。
正是在这一时期,数据完成了初步商品化的过程。当市场上出现了对专营数据业务的需求之后,便有相应的数据收集、处理机构应运而生,它们的商业目标便是通过贩卖数据商品赚取服务费用。但是,数据业务在当时只涉及部分产业,数据商品交易的市场范围也很局限,直到信息化时代开启,数据的商品化进程才开始急剧加速。
(三)数据在前信息化时代的特征
早期数据信息的收集者主要是服务于统治阶层的官吏,数据归属于国家统治者,用于税收和人口管理等。直到20世纪70—80年代,商业的发展与数据收集、计算能力的提升,使得美国的大型私人企业逐渐获得了与国家相匹敌的数据收集能力。在前信息化时代,数据的收集和使用有两条主线开展,即政府对人口的控制与初步的广告商业应用。其主要呈现以下特点:一是数据的可获得性低,准确度低,成本高,需要依赖政府和专业的商业机构进行处理和分析。同时,数据的格式不规范,缺乏统一的标准。二是数据的收集遵循自上而下的统计学操作范式,个体被淹没在大量数据的统计学意义中,因此个体是抽象的。三是数据没有获得超越文字的优先地位,数字符号系统在功能上只是作为文字的补充和配合。
总体而言,尽管中国古代社会的“数据化”过程肇始很早,但长时间只停留在国家财政、人口统计与简单的经济领域。在前信息化阶段,数据只完成了初步的商品化,尚未成为一种成熟的生产要素,因为对数据商业价值的挖掘还只停留在作为商品进行交换的初级层面,并未将其作为生产资料纳入实际生产过程。
信息化时代:全方位的数据捕捉与控制
信息化时代以来,数据变为在计算机系统中,以二进制信息单元0、1的形式表示的字符,是所有能输入计算机并被计算机程序处理的符号的总称,也是具有一定意义的数字、字母、符号和模拟量等的通称。斯尔尼塞克断言,发达资本主义的中心在于提取和使用一种特殊的原料——数据,数据不是非物质的,它高度依赖物质性的基础设施(传感器、服务器、存储器等),同时数据资源的形成不是无阻力或自动化的过程,而是需要经过清洗和整理,并组织成标准化格式后才能使用。在信息化时代,数据完成了商品化过程,并迈进下一个阶段,即生产资料化。生产资料是劳动者进行生产时所需要使用的资源或工具,是进行物质生产所必备的条件。生产资料与商品的区别在于,前者能够直接参与到物质生产过程中,而后者则大多局限在流通和交换领域。因此,生产资料相比于商品,能够更深刻地参与资本生产与再生产的循环,同时对社会生产力的影响更为直接。信息化时代与前信息化时代相比,数据更加深度地参与经济社会中的生产、交换和分配等环节,同时资本也力图从海量的数据中提取价值,扩展获取利润的版图。
(一)数据与流通革命:“以时间消灭空间”
数据形态的蜕变和资本主义流通环节的压缩有着紧密的关系,其中,互联网扮演着重要的推动作用。它起源于美国在冷战期间军事工业综合体以及随后大规模的企业投资,这些投资将互联网转变为协调企业网络和跨国市场的空间。随着互联网在日常生活和商业交易中的深化,它也成为强化资本主义对政治、经济社会管理的“黏合剂”。互联网为数据的流动和交换提供了载体与平台,重塑了资本循环的格局。马克思对流通与资本增殖有着经典的论述,我们从中可以理解互联网与数据的耦合为什么会成为资本主义新阶段的特征,即资本力求用时间消灭空间,也就是说,“把商品从一个地方转移到另一个地方所花费的时间缩减到最低限度。”资本主义生产的趋势就是尽可能地缩短流通时间,打破空间约束。“资本在流通中的形态变化越成为仅仅观念上的现象,也就是说,流通时间越等于零或接近于零,资本的职能就越大,资本的生产效率就越高,它的自行增殖就越大。”
在信息化时代,互联网技术的发展急剧压缩了数据传输的时间,同时拓展了数据传递的范围,数据处理和建模技术也参与到供应链管理中来,使得企业能够优化路线选择、订单数量、设施定位等。这些新技术彻底改变了资本主义流通系统的面貌,将原先大量货物和资料在空间中的物理移动抽象为信息、数据、金融资本的非物质电子流动,进一步提升了全球生产网络的整合和规划。理解流通革命背后的深层逻辑,就是解释新的流通方式如何促进了资本的积累和再生产。流通时间和生产时间是相互排斥的,在流通过程中,资本的生产只能被打断,剩余价值的创造暂时停滞。较短的流通时间不仅意味着剩余价值更快地实现,也意味着在同一单位时间内资本周转次数的增加,从而推动资本主义进一步发展。
互联网承接了资本的加速逻辑,数据催生了平台上的“流通革命”。首先,数据的传输范围不受到时空的限制,互联网光纤可以将数据的传输时间进行急剧压缩,并且在有网络覆盖的地区都能够成为传输的目的地;其次,区别于前信息化时代,这一时期的数据可以将各类信息统一成固定的形式进行流通,无论是连续的模拟数据还是离散的数字数据,计算机都能通过二进制编码对其进行转换,从而提升流通速度和效率。这一点就好比集装箱运输技术的发展成为物流行业变革的关键要素,集装箱大大缩短了船舶装卸的时间,并将三种离散的运输方式整合到一个单一的网络中,加速了资本周转,货物可以在船舶、火车和卡车之间互换运输,无须拆包和重新包装。数据和资本主义的结合颠覆了传统的商业组织体系,改变了流通环节的形态和逻辑。
(二)数据对劳动过程的改造与控制
恩格斯晚年在回顾历史唯物主义形成的时候认为,马克思主义是在劳动发展史中找到了理解全部人类社会历史的钥匙。劳动是人类劳动力在物质资料生产上的使用和消费,通过劳动,人类可以改变自然物的形式,从而创造了社会必需的物质条件和精神条件。人们在劳动的过程中,一方面同自然界发生关系,另一方面在社会内部结成生产关系。由此,生产力和生产关系都应该立足于劳动的范畴加以审视。一定水平的生产力在一定方式的生产劳动中得以应用与发展,也正是特定形态的劳动过程,再生产出人与人之间的生产关系。劳动过程所采用的技术是由历史发展和社会过程共同塑造的,而且必然反映了人们在生产环节中相互联合、彼此协作时的社会关系。对劳动过程和生产力的考察是无法脱离这些社会关系的。数据在信息化时代跨越式地发展体现在改造了传统的劳动过程中,同时强化了对劳动者的控制与监视,这也进一步加深劳动对资本的隶属程度,使得数字生产力在数字化的生产劳动中得以应用与发展。
大卫·哈维认为,资本主义必定具有技术上的活力,这是因为对相对剩余价值的渴求会不断激励资本主义当中处于支配地位的阶级关系去推动并确保对劳动过程的不断重组。资本主义生产过程是价值增殖和劳动过程的统一,数据通过改造流通环节而服务于资本价值增殖之后,下一步便是重塑劳动过程。在达到这一阶段之前,数据的应用方式已经伴随着经济社会的发展进行不断更新和迭代。达文波特认为,信息化时代的数据技术经历了三个发展阶段。首先是分析1.0阶段,此时的数据主要来自于企业或社团的内部,是相对较小的结构化数据的集合,用于支持描述性的分析和报告,并只局限于内部决策;其次是分析2.0阶段,出现在2000年初,在描述性功能的基础上有预测性,同时创建了基于数据的产品和服务;最后是分析3.0阶段,这一时期的特点是规范性(prescriptive),数据分析被视为一家企业业务不可或缺的一部分,也是大部分员工的工作重点。大量的数字基础设施服务于快速、敏锐的数据处理,用于支持企业决策、新产品与新服务的开发以及对劳动过程的监控等。
奈格里认为:“资本表现为扩张的力量,表现为生产和再生产,并且总是控制的力量。……劳动在增殖过程中被控制以至于其自治性在很多情况下都被极大程度地削减。”因此,对劳动力与劳动过程的控制始终是资本主义发展的一条线索,工厂制、泰勒制、福特制、后福特制等劳动组织形式的变迁反映出资本对劳动控制手段的更新迭代。在由数据催生的平台经济、共享经济中,算法控制是平台规训劳动力的核心方式。算法的本质是大量数据训练下形成的计算模型,资本借助算法的精准计算和标准化管理,实现对生产过程从任务分配、劳动监管、绩效考核和非雇佣化无酬劳动四个方面的重塑。例如平台企业可以借助算法技术将外卖员的劳动过程放置在细致入微的监管之下,并对其劳动的结果进行量化的计算和评价,以各种奖惩措施和程序设置对外卖送餐员实行时间规训和操控。还有对物流工人的劳动监控,例如亚马逊建立一个严密高效的扫描仪数字控制系统,强化从人类劳动中提取剩余价值的力度。扫描仪系统的建立意味着亚马逊不仅可以监控货物的准确位置,还可以追踪员工的实时活动。这些对劳动者及劳动过程的控制和管理都是数据在信息化时代所呈现出来的新特点。
(三)数据在信息化时代的特征
信息化时代的数据采集与应用与前信息化时代有着显著的差别(见表1)。今天的社会知识可以从非结构化的数据中产生,直接从日常生活中留下的痕迹中提取,数据源于人类行为自发的暴露,因此用户的线上线下行为都可以通过数字化平台或数字化设备直接捕获,获取成本降低。数据获取者和处理者的主体是大型的互联网企业。在大数据技术之下,企业通过数据描绘用户画像,每个人都是具体而形象的,其可以对个体(无论消费者还是劳动者)进行全方位地描摹和控制。
总体而言,在信息化时代,数据作为一种生产要素的重要性与日俱增,在互联网领域获得一种垄断地位,并超越了描述性、预测性等基本功能,成为社会经济的价值增长点。数据驱动社会生产、交换、消费、分配的趋势愈加明显。数据在这一阶段完成了生产要素化的过程,并向着资本化前进。
数字生产力:数据+算法+算力
马克思在《资本论》中认为,生产力是“生产能力及其要素的发展”。生产能力的发展体现在人类为了满足自身物质需求而改造自然的过程中,所使用的生产物质资料的手段的更新和提升,要素的发展则体现在劳动资料或劳动对象形态的变化与新要素的加入。马克思的生产力思想是在批判李斯特等人唯心主义生产力学说的过程中产生的,并在《德意志意识形态》中进行了深刻的阐释从而标志唯物史观的诞生。在马克思看来,生产力具有三种意义。首先,生产力是一种物质力量,但是对其的理解不能只局限在物质工具与技术层面;其次,生产力是人利用自然的能力,人的主观能动性在生产力发展中发挥着重要的作用;最后,对生产力的把握需要从生产力与生产关系的辩证关系中入手。
生产力发展大致经历了石器时代、青铜器时代、铁器时代和机器大工业时代,其对应的生产关系分别是原始生产关系、奴隶制生产关系、封建生产关系与资本主义生产关系。及至今日,生产力的发展跨入了一个崭新的阶段——信息时代,并诞生出数字生产力这一新样态。这表现为数字化对传统生产力的赋能、重塑和再造,即互联网、大数据、云计算、区块链、3D打印、人工智能等数字技术及其相关硬件设备构成的体系,在农业、工业、服务业等领域的应用。伴随数字生产力而来的是一套围绕数据生产、流通、交换和消费环节的全新的生产关系。生产力发展的历史,本质上可以看成是生产资料形态的不断革新和人类对生产工具使用能力的不断强化的过程。
人类文明的演进、社会形态的更迭、科学技术的进步,无不依赖生产力的推动。因此,人类社会历史本身就是一部生产力的发展史。正如列宁所言:“人类社会的发展也是受物质力量即生产力的发展所制约的。”数字生产力的诞生可以视为生产力持续渐进发展过程中的一次跨越性的嬗变,当代学者将其定义为:“通过数字技术融合其他生产要素,创造满足社会需要的物质产品和精神产品,带动国民经济增长的能力。”其依然满足劳动者、劳动资料和劳动对象的三要素组成,但与传统生产力相区别的是,数字生产力下的主要劳动者是以程序员、数据分析师、算法工程师等为代表的数字劳动者,他们生产信息通信设备、提供数字内容并服务于数字基础设施的维护和升级,他们的劳动成果以数字化产品的形态呈现。劳动资料即生产工具以算法、算力为核心,劳动对象则是海量的原始数据。
“算法”顾名思义指的是“计算的方法”,表现为一系列解决问题的计算机指令。“算法”本身是一个纯粹技术性的概念,随着人工智能、大数据等技术的发展,算法的内涵逐渐演变为“用数据训练的模型”。随着技术的发展,算法不是一套固定的计算方式,而是在不断地被“投喂”数据的过程中实现自我的升级和迭代,并和数据通过积极的正反馈循环相互关联。在数据的不断训练中,算法变得更有用、更准确,从而更有价值,不断增长的数据集反过来只有在被更强大的算法解析时才能变得更有意义和可操作性,这种积极的反馈循环是机器学习的核心。如果把数字经济比作一辆向前飞驰的蒸汽火车,数字化平台是机身,算法是内燃机,互联网空间中源源不断生成的原始数据正是作为“燃料”在持续不断地燃烧,从而推动火车的前进。斯蒂格勒认为:“平台本身是生产资料,也是生产方式,生产方式已经嵌入算法之中。”因此可以将算法等信息技术理解为生产资料的范畴。无论什么类型的数字化设备,都需要算力的支撑。狭义上,算力指的是比特网络处理能力的度量单位,而现在大家更多地用算力一词指代含义更为广泛的“计算能力”,即计算机对信息数据进行处理,实现目标结果输出的能力,具体包括计算速度、算法、大数据存储量、通信能力和云计算服务能力五个方面。当前,我国算力产业规模加速壮大,近五年平均增速近30%,算力总规模位居全球第二。算法、算力和数据好比是生产工具和劳动对象,三者的协同发展改变了经济社会的形态,变革了传统的生产、流通和消费的环节,由此催生出数字生产力,并推动数字经济逐渐从社会舞台的边缘走向中央。因此,数据生产力的基本环节和核心特征可以理解为由数据、算法、算力三者有机构成的生产能力。
结论与讨论
一个社会传播的基础设施和传播工具的发展程度影响了人们开展与信息相关的社会活动与行为模式,媒介决定了传播范式和思维方式,传播学者麦克卢汉将其总结为“媒介即信息”。数据的诞生影响了人们记录世界和看待世界的方式,尤其在信息化时代,任何事物和信息都可以被简化为计算机上二进制的字符进行流通和传播。这不仅仅是一种简单、高效的记录方式,也推动了生产力的数字化发展,从而带来了围绕数据的全新的社会关系和生产关系。正如马克思所说:“随着新生产力的获得,人们改变自己的生产方式,随着生产方式即谋生方式的改变,人们也就会改变自己的一切社会关系。”生产力的发展改变了生产方式的具体形态,从而影响了生产关系的样貌。生产关系涉及生产、流通、交换和消费环节,还包含人与物、人与人之间结成的各种相互关系,即财产关系、劳动关系、交换关系等等。具体而言,从生产资料所有制层面来看,数据作为一种新的生产要素,其所有权尚不明确,在实际操作中常常默认归属于相应的平台企业所有,这导致了数据垄断、算法歧视、隐私泄露等诸多社会问题。然而,数据要素本身所具有的非排他性、共享性等特点也为日后构建一个公有或国有的数据所有制结构提供了可能。从人们在生产中的劳动组织形式来看,以数据为核心的商业模式并没有改变资本与劳动之间剥削与被剥削的关系,反而由于弹性化、零工式的劳动组织形式而使得剥削更为隐蔽和深化,劳动过程也愈发呈现出原子化、碎片化和被监控的特点。从劳动产品的分配来看,数字劳动者和数据所有者应当通过按劳分配与按生产要素分配参与数字经济红利的共享,然而由于数据所有权尚不清晰,数据分配主体界定、数据要素定价、数据交易市场等确立依然困难重重,这使得红利共享难以实现,也为数据收益的公平分配带来了挑战。
2018年5月,习近平总书记在纪念马克思诞辰200周年大会上发表重要讲话时指出:“学习马克思,就要学习和实践马克思关于生产力和生产关系的思想。”基于马克思主义生产力与生产关系的视角去研究当前方兴未艾的数字经济,有助于我们更好地洞察隐藏在数据背后的矛盾运动与运行规律。透过生产方式在现象层面的新变化深入生产关系的本质,是一个由表及里的过程,势必将进一步在理论层面凝练出马克思主义生产力与生产关系理论分析框架在数字经济时代的适用性与延展性,同时不失为一个新的理论生长点。
数字生产力来源于人类劳动在农业文明、工业文明时期的积累和沉淀,生产力的继承和延续将是人类社会亘古不变的话题。马克思与恩格斯在《德意志意识形态》中指出:“历史的每一阶段都遇到一定的物质结果,一定的生产力总和,人对自然以及个人之间历史地形成的关系,都遇到前一代传给后一代的大量生产力、资金和环境,尽管一方面这些生产力、资金和环境为新的一代所改变,但另一方面,它们也预先规定新的一代本身的生活条件,使它得到一定的发展和具有特殊的性质。”当前,互联网、云计算、大数据、人工智能等数字技术正在颠覆传统的生产模式,重塑资本和商品流通与交换的格局,重构价值链。中国作为全球数字科技大国,在数字生产力领域拥有巨大的潜力。发展数字生产力,必须紧密结合我国经济体制深刻变革的实际,加强数字基础设施建设,培养数字技术人才,积极推进传统产业的数字化转型,同时筑牢数据安全“防火墙”。此外,我国还应积极关注数字时代对生产关系的改变和影响,破除数字行业的平台垄断与无序竞争,消除算法规制中的信息壁垒,保障数字劳动者的基本权益,明确数字生产资料的所有权归属。唯有平衡好数字生产力的发展和数字生产关系的治理,我国才能在数字时代的全球性竞争中拔得头筹。
〔责任编辑:苏媚媚〕
原文见于《东南学术》
2023年第5期
文中图片均来自网络
本微信公众号系《东南学术》杂志官方微信,如无特殊说明,本微信内容均来自《东南学术》杂志,版权所有。
微信号 : dnxs0591
● 扫码关注我们 ●
2023-10-11
2023-10-10
2023-10-09
2023-09-21