查看原文
其他

公务员如何看待大数据:基于技术认知视角的实证研究

政治学人 2021-04-25


作者简介


李莉,中国政法大学政治与公共管理学院副教授,硕士生导师

吴江,首都师范大学政法学院讲师。

一、导言

戴维·诺布尔(David Noble)在其《生产力》一书中对技术与权力的关系进行了深入探讨。在他看来,技术与及其发展并不是一个中性的过程,而是时常要跟随统治和控制的需要。有鉴于此,人们不禁要问,相对于其他技术,是否一些技术因其“天生”特点而更可能被决策者用于达到特定目的(例如,对管理对象的监控)?这里所谓的技术或技术装置,在诺布尔那里是自动机床,而我们在当下更可能想到的则是大数据技术。


当前,基于大数据的治理实践在中国方兴未艾。人们热衷于探讨大数据技术在社会治理、经济调控等方面的巨大价值;但与此同时,人们又对利用大数据技术的过程中可能出现的矛盾问题及其在政治及伦理方面的限度有所担忧。笔者认为,要想更好地探讨这些议题,首先要对一个更为本原的问题进行反思,即:治理者为何使用大数据技术?或者更具体地说,在治理者的特定视角中,大数据技术有着何种突出属性,这些属性能够用来达到什么目的?


韦伯将合法统治分为基于合理性的、基于传统的、基于魅力的三种类型。其中,合理性统治的基本特征是“建立官僚行政管理班子”并且确保“目的合乎理性或价值合乎理性”。依此看来,官僚系统在或全面或局部地应用某种新技术时,必定着眼于此类技术能够带来理性化水平的稳固或提升。显然,大数据技术亦不例外。


然而,这种将大数据技术简单地与理性化联系起来的表述或许较为泛化,难以涵盖当代官僚体系职能的多样化——这些职能的提升都可以被冠以“理性化”的名号。就大数据治理的问题而言,笔者假设:首先,在总体层面上,鉴于治理行为的主体是掌握权力者,鉴于大数据技术在收集处理数据方面极具优势,所以在大数据的各项功能中,那些直接以加强控制为导向的功能更受偏爱,这可以说是大数据技术的反-技术中性论的一面;但是,其次,在官僚体系内部,单个主体特征亦会在一定程度上影响其对大数据功能的认知,这可以说是技术中性论的一面。


由此,本项研究将着眼于治理者对大数据技术的内在属性和目的/功能这两方面的认知:(1)内在属性:大数据本身可能呈现出多种特征;每个人对大数据的界定和描述都是有差异的(当然,这里所谓的界定是较为宽泛的,既可能是可付诸语言的明确定义,也可能是一个模糊的印象)。不同的人看到的属性不同;即使两个人都认识到它有某一个属性,这个属性在他们心中的重要性也未必相同。因此,本项研究将分析具有不同特点的受访者在看待大数据技术之属性方面的差异。(2)目的/功能:观察、使用大数据技术的主体在知识水平、地位、业务需要等方面有所不同;相应地,大数据技术的有用性也会在他们面前呈现出不同维度,其中有的相对重要些,有的则无关紧要。对人们看待大数据时的主观目的进行分析亦是本研究的重点。


本项研究具有一定现实意义。政府职能的发挥不仅依赖其已获授权的权威, 而且也依赖于不断改进的治理程序和技术。更具体地看,中国的治理模式实际是一个不断依靠“行政吸纳政治”的逻辑来将法治化、规范化、技术化和标准化作为行政建设和监督的核心议题。就此而言,人们应当关注大数据技术如何在行政机制中得以合理、高效应用。本项研究能够在一定程度上帮助那些积极提倡大数据技术的决策者思考并寻找方法,以便在全社会进行宣传、引导、教育,使得作为治理微观主体的工作者个人能够正确接受大数据技术,使之得到更好利用。


二、文献综述

既有文献可以帮助人们初步了解官僚组织运用大数据技术的动因。例如,韦伯指出:


官僚体制(或者利用它的统治者)还倾向于通过公务知识,进一步提高其权力;在公务交往中获得的或者“熟谙档案的”实践知识。“职务机密”的概念不仅是官僚体制的概念,但是特别指的是官僚体制的概念,它渊源于这种权力欲望——它同专业知识的关系,大约可与商业经营秘密与技术秘密的关系相比较。


大数据技术无疑能够提供官僚组织所需要的知识。更具体地看,这种知识又可划分为三个层面:第一,官僚组织所收集的数据资料本身就是知识;第二,对这些数据进行分析(包括汇总、预测、分类、等等)是更高层面的知识;第三,基于大数据获得的上述两种知识会与官僚组织的既有知识(如业务经验、工作惯例、工作过程,等等)结合,生成新的知识。就此而言,大数据技术无疑应合了官僚组织的需要。


另外,韦伯还提到了官僚组织的资料收集倾向:


行政档案制度原则,甚至在口头讨论实际上就是规则或规章的地方,也是适用的;至少是预备性讨论、动议和随后的决议以及形形色色的指示和法令,都用文字固定下来,档案和官员们的持续动作结合在一起,就产生了办公机关作为任何现代团体行为的核心。


简单来讲,官僚组织具有记录、收集一切数据的“癖好”。这不仅包括关于社会经济发展的各种客观数据,而且还包括韦伯所说的行政档案,即工作人员在工作中接触的的各种文本,以及关于行动、效果和反馈的记录。可以想到,行政档案的价值不仅仅在于查阅,不仅仅在于确认工作者的功过得失,而且同时也是值得分析的数据资源。


现代国家为实现各种政治或军事目的而致力于“系统地收集关于国家人口方面的信息——人口的规模、构成以及年龄、职业、社会地位和经济地位等——以及收集关于国家其他方面资源的信息”;收集和分析统计数据无疑正是官僚组织的固有职能。抛开这样一种数目字管理在数学、技术上的一面不谈,这种治理首先是一种去人性化、知识化和精细化的治理。对此,福柯从规训的视角进行了深入分析。福柯在《规训与惩罚》中指出:


这是一种重要的机制,因为它使权力自动化和非个性化,权力不再体现在某个人身上,而是体现在对于肉体、表面、光线、目光的某种统一分配上,体现在一种安排上。这种安排的内在机制能够产生制约每个人的关系……因此,由谁来行使权力就无所谓了。


若抛开这一过程中伦理、人道主义的一面的话,人们可以肯定的是,近现代的一系列以某种全景敞视主义为蓝本的规训手段无疑提高了治理的效率;而大数据技术无疑是这种治理技术和策略的当代延续,只是治理之所达不仅限于“对于肉体、表面、光线、目光的某种统一分配”,而是更在于数据收集和分析软/硬件的所达之处和能力限度。

此外,福柯还强调了全景敞视主义:


……能被纳入于任何职能(教育、医疗、生产、惩罚)。当它与这种职能紧密联系在一起时,它能增加后者的效果。它能形成一种混合机制,在这种机制中,权力关系(和知识关系)能够被精细入微地调整,以适应需要监督的各种过程。


福柯的表述中有两点值得注意,其一,他强调规训手段不仅意味着权力关系,而且意味着知识关系,这一点与韦伯的洞见相同。其二,他强调规训手段是一种精细化的调整过程。无疑,当代的大数据治理也能满足治理者进行精细分类、归档、干预的需要。


总而言之,既有文献已经对大数据技术与官僚组织的偏好之间的关联进行了深入而广泛的阐述。然而,既有文献在以下问题上的分析尚不充分,即:如果说某种治理技术具有各种特点的话,那么这些客观东西是如何在治理者个人心中得到反映的?或者,具体到本文的研究目的来讲,大数据技术具有一系列的属性和功能,那么治理者又会聚焦于何种属性和功能,会对其重要性给出怎样的排序?


在本项研究中,我们结合既有文献将大数据的属性分类为七个具有关联但又具有相对独立性的维度,并考察公共部门工作者对它们的重要性的感知。这些维度是:


(1)数学性——数据的收集、清理和分析等无疑涉及较复杂的数学原理。

(2)技术性——大数据技术依赖于强大的软硬件技术。

(3)精细化——大数据能够提供提供更具体、更精细的信息。

(4)“一切皆数字”——或者说是可量化性。大数据技术的一个突出能点是寻找各种用数字来测量/衡量事物和现象的方法。

(5)获取方便——大数据技术许诺人们能够以丰富的手段收集、获取并查询数据。

(6)关联性——大数据能够帮助人们发现事物之间的规律或关联,或进行预测,进而提高决策的科学性、合理性。

(7)实时性——大数据技术有望帮助人们及时、快速获取数据,提高治理的时效性。


与此同时,我们又将大数据技术的功能归纳为:

(1)日常——大数据技术在日常事务性工作中的应用,它包括:查询并比对信息,对文件和管理对象进行归档分类,等等。

(2)公共服务——公共部门能够利用海量数据为人们提供各种公共服务。

(3)决策——人们能够借助基于大数据的各类模型提高决策水平,而基于大数据产生的各类知识亦会成为决策者得以吸收并利用的专业知识。

(4)监控——管理者能够利用各类数据防范、打击违法违规行为。


根据上述理论框架,我们拟提出以下假设:

假设1:较之抽象特征,大数据的显性特征在治理者的认知顺序中更为靠前。

假设2:治理者认为大数据最重要的功能是监控。

假设3:治理者的年龄、学历、获取知识渠道等因素会影响其对大数据特征和功能的认知。


三、数据搜集及分析方法

(一)数据搜集

本研究选取Z省党政机构公务员群体作为调查对象。选取该群体的原因有两个:首先,该省公共部门近年来积极运用大数据技术,党政机构公务员对这一技术如何与本职工作之间的关联具有一定的了解;其次,研究者自2018年7月开始进入Z省关注其利用大数据技术开展的基层治理创新实践项目,因此能够更加便利地搜集调整数据。本研究的调查对象是较为特殊的党政机构公务员群体,笔者很难采用随机抽样的方法采集数据。因此,本研究采用方便抽样,利用于Z省市党政干部培训系列活动的机会,在培训讲座过程中通过二维码发放问卷,并成功回收475份问卷(其中有效问卷405份)。


(二)分析方法

本文利用模式模型(pattern model)对排序数据进行分析。排序(ranking)是指评价者依据某种标准(如科学性、可行性、个人偏好等)为多个选项排出顺序,最优选项被赋值为1,次优选项被赋值为2……以此类推。 模式模型[11]可用于确定一组选项的相对排序,如果模型自变量是多个评价者的排序或打分的话,模型输出的相对排序就可代表他们的总体偏好。模式模型假定每次对比是非独立的、有关联的,因此要计算各种对比结果的联合概率。设有J个以j和k标识的事物,在y = (y12, y13,…, yjk,…, yJ, j-1)中,yjk表示在事物j和事物k两者中进行选择的情况,当事物j优于事物k时,取值为1,反之为-1,则某种偏好模式的概率为:

其中,c为归一化系数;π是价值系数(worth parameter),表示事物在偏好标尺上的位置,也就是受偏好的程度。在对模式模型进行可视化时,每条竖线代表一个价值标尺,价值系数则用竖线上的点表示。点的位置越高,它所代表的事物的受偏好程度越高。


四、分析结果

(一)描述性分析


1、数据概况

受访者的人口统计学概况如下:


第一,性别:受访者性别比例较悬殊。男性公务员285名(70.4%)、女性公务员120名(29.6%);


第二,年龄:处于18-25岁之间的受访者有48人(11.9%);处于26-30岁之间的有109人(26.9%);31-40岁之间的有166人(41.0%);41-50岁之间的有74人(18.3%);51-60岁之间的有8人(19.8%); 


第三,学历:受访者中,拥有本/专科及以下学历的有343人(84.7%);拥有硕士研究生及以上学历的有62人为(15.3%)。


第四,工职级:受访者的行政级别集中在较低层级,其中,科员或无级别者有140人(34.6%);正/副科人员有246人(60.7%);正/副处及以上者19人(4.7%)。


第五,工作单位层级:来自乡镇级单位的受访者有75人(18.5%);来自县级单位的有232人(57.3%); 来自市级单位的有80人(19.8%); 来自省级单位的有18人(4.4%)。


2、知识获取渠道和重要性感知

在问卷中,我们设置了以下问题:“在以下方式中,哪一种方式为您提供的与大数据相关的知识最多?”结果显示,通过大众媒介(报纸/电视)获取信息的比例最高,达到了42.2%;选择科普性文章、会议这两种形式的比例也比较高,分别占了17.4%和19.3%。通过专业学术论文(5.7%)、书籍(4.2%)、培训(7.9%)、面对面交流(3.7%)的渠道来获取相关信息的比例较低。从信息来源来看,对于大数据知识的获取呈现较为明显的碎片化和“浅阅读”模式:公务员并未因为身份或从事相关工作而偏好专业性较强的知识渠道。


我们还问及公务员对自身工作重要性的感知。结果显示,认为大数据与其平时的工作有关联的达到了60.5%,其中表示关联非常大的有24.0%,表示关联比较大的有36.5%。与此同时,受访者还表示,大数据未来会对其自己所从事的工作产生非常大的影响的占有41.0%,有相当程度的影响的有47.2%。尽管我们在调查时并未考虑样本中各类别公务员的代表性,但上述数据还是能够在一定程度上表明,公务员对于大数据之于自身工作的重要性有着较为明显的肯定态度。


(二)排序


1、大数据的特点是什么?

各类媒介的广泛宣传已经使得大数据成了一个为人熟知的常识性概念。但是,涉及个体如何理解大数据的研究相对较少。我们在调查中发现,受访公务员对大数据的主观理解呈现出多样性。


(1)总体排序:就整体而言(图1),在受访者心中大数据最为重要的特点依次是精细化、实时性、关联性、获取方便、技术性、“一切皆数字”和数学性。其中,精细化、实时性、关联性、获取方便四个特点的分值不仅高而且较为接近,而技术性、“一切皆数字”和数学性三个特点的分值较低。这一结果也显示出这七个特点可划分为两个群落,其一为具体显性特征(精细化、实时性、关联性和获取方便);其二为抽象特征(技术性、“一切皆数字”和数学性)。

(2)年龄:不同年龄受访者对大数据特点的认知略有差异(图2)。18-25岁之间的受访者认为大数据最为重要的特点是信息的精细化;而26-30岁之间的人则认为大数据最为重要的特点是关联性、获取方便和实时性(这几项的得分非常接近);31-40岁之间的人认为大数据最为重要的特点是精细化,但关联性、实时性、获取方便这三项的分数紧随其后;41-50岁之间的受访者则认为大数据最为重要的特点是实时性;51-60岁者则突出关注精细化。虽然不同年龄组的排序有差异,但人们最看重的还是显性特征。另外,技术性排序处于中间位置,可见四个年龄段的人都认为大数据的技术特征既不是最重要的也不是最不重要的。另外,各年龄段的受访者都将大数据的数字特点(“一切皆数字”、数学性)排到了最后。

总体而言,受访者对大数据特点的认知的共性多于差异;年龄不是影响其对大数据认知的重要变量。可见,年龄越大者与年轻人在对大数据特点的认知上存在差异的观点并不成立。


(3)信息渠道:以上结果表明,受访公务员并没有把技术性作为最重要的特点。这一结果不同于笔者的预期。那么原因何在?我们猜测获取知识的媒介对受访者的认知具有一定原因,因此又进行了进一步检验(图3)。通过培训和书籍获取大数据相关知识的受访公务员认为大数据最重要的特点是实时性;借助论文者和在面对面交流时获取信息者最看重的是精细化;通过科普文章和会议获取信息的人认为最重要的特点是关联性;而利用大众传媒(报纸、电视)者对精细化、实时性和便利性的印象几乎同样深刻。可见,尽管信息渠道的确会对人们对大数据特点的感知产生影响。但人们无论偏好何种渠道,都不太可能对抽象特征(技术性、“一切皆数字”和数学性)感兴趣。

(4)行政级别:结果显示,科员或无级别者与正/副处及以上级别者都很看重关联性;但笔者猜测两者看重关联性的原因是不同的:后者关注关联性,是因为看重大数据在辅助决策方面的作用;而前者在工作思路上尚未定型,更愿意在新技术方面进行更多尝试,因此对关联性的关注并不出于决策目的,而仅仅出于拓展思路、丰富工作方法的目的。

(5)学历:对新技术的认知是否会受到教育程度的影响?数据显示(图5),学历带来的差异并未显著到能够使我们给出有意义的解释的程度;特别是,高学历者也并不比低学历者更看重大数据的抽象特征。

(6)单位层级:最为突出的特点是(图6),省级单位工作最为看重的是大数据的技术性,而其对数学性的印象,尽管排在偏好标尺的末端,但也明显高于受访者。笔者认为,这是因为省级单位工作者更多地需要从全局层面对大数据治理中的项目规划和技术资源分配进行思考;相比之下,基层工作者则更多地看重大数据偏实务层面的特点。

 2、大数据可以发挥什么作用?

人们是如何看待大数据在治理领域的功能的?对这个问题,我们亦采用排序题进行调查。


(1)总体排序:统计结果(图7)显示,大数据在公共服务领域的作用最受偏爱,其对优化决策的效果在标尺上紧随其后;而处理日常事务方面的作用受偏好的程度远远落后;监控作用在人们心中的位置最低。


那么,受访公务员对于大数据作用的重要性排序是否受到年龄等因素的影响呢?

(2)年龄:图8显示,不同年龄段的受访者对于大数据所发挥的作用的排序呈现出一定差异。51-60岁群体关注大数据辅助决策的作用的程度远高于其他群体;18-25岁群体更看重大数据在公共服务方面的应用;而在26-30岁、31-40岁、41-50岁这三个群体看来,大数据在公共服务、决策这两个领域的作用差不多是同等重要的。总的来讲,较之于年长者,年轻人更看重公共服务的功能。

(3)学历:尽管拥有本/专科及以下学历者与拥有硕/博士学历者在公共服务方面的偏好是趋同的,但后一个群体显然更看重大数据在辅助决策方面的作用。究其原因,笔者猜测,受访者中只拥有本/专科学历的公务员主要从事基层公共服务领域的相关工作,因此他们对这方面功能的感受更直接。而高学历受访者则出于对专业知识的敏感性和实际工作内容而更了解大数据技术在决策方面的应用情况。

(4)信息渠道:调查显示(图10)通过报纸/电视、科普文章、专业论文来获取知识的受访者认为大数据发挥最重要作用的领域是公共服务领域;而通过人与人的直接沟通(会议/汇报、面对面交流、培训获取信息的人则更看重决策作用。笔者对这种差异产生的原因作出如下猜测:客观来讲,大数据在公共服务方面的应用在很大程度上是在处理机械化、程式化的问题(比如信息的存诸、查询、匹配等),而这些内容更易于大众传媒、科普文章以及内容更具针对性的专业论文给出明确易懂的描述;相比之下,人与人在直接沟通时更易于传达多维度的、情境化的信息,对这些知识的理解更依赖于人们的直觉和判断力,而这种信息的多元性与决策过程中的信息多元性是相仿的。相结果就是,以人与人直接沟通的形式了解知识的人更倾向于把大数据放在决策语境下去思考。

(5)职级:对大数据功能的排序亦受到职级的影响。(图11)科员/无级别者、正/副科级受访者最看重大数据在公共服务领域的运用;正/副处级及以上者则则关注决策领域。笔者认为这在一定程度与受访者在本职工作中投注精力的主要领域有关。


五、结语

本文关注的主要问题是,大数据技术在公共部门能否得到合理看待和运用。当然,人们对“合理运用”的界定也可能是相当不同的,因此,单就本文有限的探讨主题而言,我们最关心的具体问题是:第一,在大数据本身的特征方面,人们对显性特征(关联性、实时性、精细化、获取便利)和抽象特征(数学性、事物的可测量性、技术性)的感知是否平衡?第二,治理者是否更倾向于将大数据于于监控目的,还是说,他们更看重它在提高决策科学性、为公众提供便利等方面的作用?


在第一个问题上,本项调查显示,受访者更看重的无疑是大数据的显性特征,或者更直接地讲,是那些直接跟现实用途有关的特征。对此,笔者有两点看法:一方面,使用者能够忘却大数据的抽象特征的前提是,相关技术已经足够先进和成熟,以至于使用者在使用它时只需要关注具体、现实的事务即可,而技术装置的技术性则很好地隐藏了自身。但另一方面,使用大数据技术的治理者与使用这类技术的普通人的差异也许就在于,前者理应对技术中去人性化的一面,以及隐藏在所谓客观的技术原则和处理方式之后的偏见和固化有所认识。就此而言,要求治理者更多地关注大数据技术的抽象特征似乎并不为过。


在第二个问题上,本项研究亦在一定程度上为技术中性论提供了支持,具体而言:具有不同特质的主体的确对技术的功能有着不同的看法。不过令人感到欣慰的是,总的来讲,至少本次调查中的受访者似乎并没有像预想的那样把监控看成是大数据的首要功能。


人们看待技术的视角的多样化固然有益,但尚有一个问题:如果说技术的合理应用尚需全社会或高层决策者形成一定共识并将相关的基本价值观进行普及,又会怎样?更直接地讲,对大数据技术的正当运用或许一方面需要高层决策者予以适当引导,另一方面亦需要形成一定共识的社会舆论给予一定约束。当然,这两方面行动都必须以对公共部门工作者既有价值观的了解为基础,而本项研究的目的也正是为人们提供一些与此相关的基本信息。

责任编辑:张赫   一审:王铮  二审:闪晶晶

文章来源:《电子政务》,2019年06期。

相关阅读:

“官员悔过书”的大数据分析

杨慧 许欢 | 大数据技术优化政治生态发展路径研究


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存