查看原文
其他

PNAS:看数字轨迹如何揭秘美国政府“隐秘”的职能结构

Frank Xu 集智俱乐部 2022-04-27


导语

现代社会的政府职能多样,结构复杂,政府职能的多样性无时不刻地影响着社会的经济,社会环境以及组织与个人的行为。政府如何组织架构来执行多样的职责?政府的结构之间又有什么不同?



最近,有美国科学家小组通过大数据分析了50个美国政府部门的网络踪迹,这其中包括了3250万个网页和47361个机构中包含的1.1亿个超链接。他们发现,这50个国家机构的网络规模与人口规模高度相关,并根据法定义务围绕易于识别的职能展开工作。该研究发表在美国国家科学院院刊 PNAS 上,本文是对这项工作的解读。


论文原题:

Functional structures of US state governments

论文地址:

https://doi.org/10.1073/pnas.1803228115


他们发现,这些网路踪迹显示出这些组织架构很多样化。进一步研究发现,政府结构与经济结构高度相关,而地理位置和收入水平与政府机构的关系有限。选民的意识形态偏好,对政府角色的认知——这两者和州政府的规模与结构并无关联。



大数据带你看

美国政府的网络踪迹


2014年,研究者从网络上利用爬虫技术收集到了美国政府在网络上的踪迹,这其中就包括了无数部门的网页和其中包含的超链接。


图1 展示的是美国政府的网络踪迹。

其中,A过程是收集和确认政府职能机构的数据。B过程发现网络上的马萨诸塞州政府结构与马萨诸塞州法律普通法规定的结构类似:红色节点显示的是网上呈现的机构与法定的机构都存在,黄色节点显示的是只有法定机构中有,蓝色的节点显示的是只有网上的机构才有。


在数据收集的过程中,研究者认为这些网址代表了政府职能机构履行公共责任,网站名代表了政府机构的职能,网页数量大致代表了政府机构履行职能的强度,网站之间的超链接代表了不同机构之间的联系。


尽管有些政府职能在网上不一定找得到踪迹,但是通过爬虫大量的数据采集(47361个机构的3250万网页以及1.1亿超链接),研究者找到了一些职能机构间的网络踪迹。比如彩票司与游戏管理委员会高度相关,彩票司受委员会管辖,却与酒精与药物滥用管理办公室无太大关联。



网络踪迹中

政府部门的专业化


根据研究者找到的这些网页,我们会发现这47361个机构的职能范围远远超过了美国国家统计局目前对于政府职能的分类。比如说,这些官方统计中就不包括国际贸易,人权,家庭与孩童支持等,而这些职能在网络上却是政府机构的重点职能。


为了得到一个能包含所有政府职能的分类,研究者采用了潜在弃置项模式分析——先找到网络上机构描述的关键词,然后去官方统计中找类别匹配,如果官方统计中没有这个类别,就增补一个类别。


最后得出了28个大类中(比如经济发展,公共安全)的166个特定职能(比如消费者权益保护与教育,火灾防护等),表1就列出了这其中的28个大类。



同时,为了检验分类的正确性,研究者在众包平台Mechanical Turk上招了一群无此分类经验的独立评估人,这些独立评估人之间对研究者的分类高度赞同(95%赞同),且评估人之间的意见高度一致(k=0.89)。


由此,新的政府职能分类诞生,涵盖范围广,功能细分多。



网络踪迹中

政府职能的一致性


研究者从政府的两个组织特征入手,分别是法律规定和组织的层级结构。


首先是法定的机构和职能,为了检验网页和超链接有多大程度上代表了法定机构,研究者首先手动写出了马萨诸塞州法律规定的职能结构,然后把这些结构与2004年网络上显示出来的职能结构做对比。


结果显示,这些网页和超链接之间的联系都与马萨诸塞州法定的职能机构有很好的对应(图1B),552个机构中392个有网页,而那些没有网页大多是小的顾问组织以及委员会。而且,机构间的超链接也很好地反映了法定机构间的联系。


进一步研究还发现,机构间的网页超链接也显示出,法定的职能机构间有很多的非法定但有意义的联系,在马萨诸塞州这里就有1743项这样的联系,比如药物监管注册委员会和公共卫生服务办公室之间的联系。


如图2所示,这些网络踪迹显示出了50处这样的政府机构网络,其中有99.09%的机构间的超链接处于同一州内。图2A视觉化呈现了整个政府机构网络,图2B是马萨诸塞州在网络中的位置。


图2显示的是美国政府的职能网络,图2A表示政府机构按州分而形成了小型群落,我们重点画出了乔治亚州(绿点),南卡罗来纳州(蓝点)和马萨诸塞州(红点);

图2B表示马萨诸塞州在图中的占比,节点大小代表该州每个机构的网页数量(以此来代表密度);

图2C表示职能网络在各个州的集合。点大小代表在所有州中参与职能机构的数目,从中心到外围按照超链接的多少辐射;

图2D表示的是乔治亚州,南卡罗来纳州和马萨诸塞州的职能网络,无论是从意识形态上来说还是物理上来说,乔治亚州比南卡罗来纳州更像马萨诸塞州。


另一个是从组织的层级结构来说。


几乎所有政府的网络架构顶部的都是法定的政府主体,包括州长,议会,县和市政府,然后连接到一些具体的职能部门,再连接到更精细职能的执行机构,比如学校和医院。


这样的内部联系其实属于一个流线型层级结构,高一级的结构包含下层结构,并直接连接下层结构,就像信息在经历和下属之间流动那样。


在10000个相同机构和连接数的随机生产的网络中,最后只有5%的连接才产生层级结构,这说明不同机构之间有互惠作用——一个机构倾向于连接已经连接它的机构,这样就逐步形成了职能机构的族群。


图3A描述的是政府机构按照职能的中心地位统计出来的层级结构,职能越中心越重要,那么这个职能就会越靠近顶部,越靠近中心。


图3 政府职能结构呈现明显的层级结构。X轴上是按中心度划分的一般性职能的节点,y轴上分布的是根据他们中心度划分的166个具体职能情况,越中心越靠近顶部。


综上,我们发现政府也有一些官僚制度的特征,包括与法律规定和组织层级结构的一致性。



政府职能机构

州与州之间有大不同


美国的州立政府有很大的自治权,这也使得他们在网络上的踪迹反映出来的职能机构非常多元化。


研究者发现,第一,有些职能,比如科研和国际贸易,只在少数州的网络踪迹中出现。其实一共只有七个职能出现在了每个州的政府里面。第二,研究者还发现在具体执行职能的时候,每个州呈现出来的组织结构也大不相同。


图4表示的是,对于每个职能类别来说,通过观察可以在网络踪迹中发现三个具体执行方面的不同,(1)是具体执行某个职能时包含的机构数目(规模);(2)每个网站的网页数量,代表的是某特定职能相关活动的密度;(3)执行某特定职能时其他机构的参与度,代表的是机构之间的联系。


图4 州政府职能结构大不同, A——C部分代表的是就每个职能的规模,密度和连接度而言,每个州的标准差,D部分表示的是对于每个职能而言,按以上三个方面分出来的州政府机构的多样性,越往顶补越多样化。


研究者还发现一些现代政府的特征,比如其规模随人数增加而扩大。但是进一步研究发现,在28个职能大类中起主要作用的只有2个类别——学校和当地行政机关。


他们的网站往往在人口更多时规模更大,活动密度更大,与其他机构连接更紧密,其他26个职能类别中,人口数目只能解释规模和连接度4%的多样性,而在活动密度上也仅仅只有12%。



进一步探究

州政府职能大不同


州政府不停地在改造当地的环境,他们也在一定程度上反映了当地的环境。但是在如何反映当地环境这方面,学术圈一直存在争议。我们选取了4个被广泛认可的关于政府如何运作的影响因素:


(1)   意识形态。民众对于政府的角色认知不一,反映了不同程度的自由与保守,意识形态上相似的州可能拥有相似的政府;

(2)   经济结构。经济学者早已发现政府与经济的关系。经济结构上类似的州可能拥有相似的政府;

(3)   收入水平。居民收入水平相近的州可能有类似的政府;

(4)   地理位置。地理位置上类似的州可能拥有相似的政府。


为了检验这四个因素,研究者把每组配对的州在执行28类职能时的规模,活动密度和连接度方面检验了相似性,也检验了这三个方面的相似性,表2报告的是当两个州在意识形态(2005年末-2010年),经济结构(就业人数),收入水平(人均GDP)和地理位置(两个州之间的距离)相似时,它们就会在检验的四个方面(规模,活动密度,连接度以及前三个维度的相似性)呈现相似。



我们会发现,经济结构的解释力最强。


居民的就业方向在四个检测维度上都与政府的相似性有关,而地理位置和收入水平的作用有限。地理位置能预测职能结构中活动密度和连接度的相似程度,但不能预测其规模的相似程度,收入水平与规模上的相似度弱相关,与活动密度和连接度的相似度无关。


至于意识形态上的相似性,则在四个检测维度上与政府的职能结构均无关联。



总结


通过大量的数据采集和分析,我们发现网络踪迹为我们提供了一个全面而可信的框架,告诉我们政府在执行职能时他们的机构特征,也帮助我们了解可能会影响这些机构特征的因素。


这个研究的主要发现是50个州的州政府层级结构中职能高度分化,遵从法定的权利与义务,政府规模因人口规模而扩大。我们也发现在州际间政府结构的相似性其实会因就业方向大不相同,这与收入和地理位置无太大关系,与选民的意识形态(对政府角色的定位)无关。


还存留一些悬而未决的问题——


  • 为什么地理位置与政府的规模,活动密度和连接度无关?

  • 在决定政府结构方面,经济和地理条件会不会比选民的意识形态更重要?

  • 有没有可能是因为选民的意识形态影响政府结构需要更长的时间周期?

  • 为什么收入水平和政府的规模有关却与活动密度和连接度无关呢?


这些都有待进一步探索。


研究者希望这个研究打开了一个窗口,让后人更直观更细致地研究政府的作用。随着近年来网络的快速发展,我们可以通过这个角度更好地观察政府的演化过程。




作者:Frank Xu

编辑:王怡蔺


推荐阅读


大数据揭露美国劳动市场如何两极化

大数据会暴露你的社会阶层吗?

价值5亿美元的大数据如何帮助贫困国家消除饥饿?

牛津大学:大数据知道你更想和谁约会

加入集智,一起复杂!


推荐课程


PC端:

https://campus.swarma.org/gcou=10407





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存