公共数据开放对城乡居民收入增长的积极影响
本文基于中国地级城市政府推行实施公共数据平台上线的准自然实验,分析公共数据开放对城乡居民收入的积极影响效应。
研究表明:政府公共数据开放显著促进了城乡居民可支配收入以及收入增长水平的提升,而且对农村居民的收入增长率促进效应相对更大;机制分析表明,公共数据开放通过促进贸易货物要素流通,加快居民就业结构转换促进城乡收入增长;异质性分析表明,公共数据开放对中西部城乡收入增长率的提升效应更为显著。
此外,数据开放对南北地区的城乡收入增长率虽然都具有显著提升效果,但仅仅改善了南方地区的城乡收入协调增长水平。
基于此,地方政府应充分认识公共数据开放的巨大经济价值,提高公共数据资源使用的便捷、高效和合法性,让数字经济红利惠及民众;深度挖掘公共数据开放为我国中西部开发带来的数字机遇和数字红利,以生产要素顺畅流通促进城乡居民就业转型,激活创业细胞,促进城乡居民增收;准确把握公共数据开放对南北地区的效果差异,推动公共数据多样化供给;积极释放公共数据的社会福利价值,借此促进城乡居民增收与城乡居民收入协调增长。
实现全体人民共同富裕是社会主义的本质要求,也是中国式现代化的重要特征。党的二十大报告指出,“共同富裕是中国特色社会主义的本质要求”,而且要“坚持把实现人民对美好生活的向往作为现代化建设的出发点和落脚点,着力维护和促进社会公平正义,着力促进全体人民共同富裕,坚决防止两极分化”。
可见,共同富裕不仅仅是经济和民生问题,也是关系党的执政基础的重大政治问题。当前,我国发展不平衡问题仍然普遍存在。习近平指出,“必须清醒认识到,我国发展不平衡不充分问题仍然突出,城乡区域发展和收入分配差距较大”。
随着工业化、城镇化优先发展战略的深入实施,我国经济水平得到迅速发展,城乡人民生活水平也明显提升。与此同时,我国空间发展格局却出现了城乡与区域发展不均衡现象,城乡经济收入差距较大仍是城乡二元结构的重要表征。因此,如何切实推进城乡人民共同富裕以及改善“城乡收入不均衡”问题成为中国经济高质量发展进程中面临的现实问题。
逐步推进城乡人民共同富裕需要良好的社会环境。当前,随着我国经济发展步入新常态,新一代网络技术革命深刻地改变了社会要素资源分配与经济发展格局,为全面推进城乡人民共同富裕打开了机遇之窗。作为新时期的新型要素资源,网络数据已然成为建设数字中国和推进中国式现代化的战略性资源。2
024年政府工作报告指出,“我们要以广泛深刻的数字变革,赋能经济发展、丰富人民生活、提升社会治理现代化水平”,这表明数字变革技术对城乡收入增长、促进全民共同富裕具有深刻影响。近年来,我国数字经济逐渐与实体经济融合,并全方位融入人民生活与社会生产活动中,积极有效地推动了传统产业转型以及丰富了人民精神物质生活,数字经济已然成为推动中国经济高质量发展的重要引擎。
其中,公共数据要素更是在数字经济发展中起着普惠性、引领性和示范性的重大作用,对实体经济赋能、促进全民共同富裕具有重要现实意义。公共数据资源要素是最重要的引领性基础数据资源,具有普惠性和均衡可及性特征,对民生改善具有巨大的潜在价值。因此,如何高效纳入数字变革技术以及有效利用公共数据资源以提升全民数字福利已经成为当前政府和学术界关注的重要议题。
关于数字经济的现有研究较为丰富,较多学者已经深入探讨了数字经济或互联网发展对地区经济发展、创业行为以及居民收入等方面的影响[4-7],但是,针对公共数据开放的社会经济效益研究还极为稀缺。理论上而言,公共数据开放对城乡收入增长可能具有两方面影响。
一方面,公共数据开放可能加强集聚效应,城市地区可能具有更强的信息技术使用优势,从而使得城市地区收入增长效益更大,不利于城乡协调发展。另一方面,公共数据开放具有普惠效应,能够有效弥合城乡信息禀赋差距,破除农村地区信息区域壁垒,更大程度促进农村居民收入增长。
然而,现有文献还未能做到对以上不确定性结果的定量探讨,公共数据开放如何影响城乡收入增长仍是一个有待回答的重要议题。就公共数据开放视角的研究而言,现有文献较多探讨公共数据的开放决定因素以及开放程度评价,少部分文献探索其社会以及经济价值创造。纵观现有文献,聚焦于省份层面的公共数据开放研究较多,仅少数研究做到了对地级市层面公共数据开放的深入研究。总之,针对公共数据开放的社会经济影响研究还存在较多待探索的领域。
鉴于此,本文基于地级市层面的公共数据开放信息,结合多期双重差分法研究公共数据要素对城乡居民收入增长的重要影响,以此揭示公共数据与城乡收入增长的内在关联及其影响机制。
相较于现有文献,本文的创新之处在于:
第一,将新型公共数字技术要素纳入城乡经济增长理论并提供新的微观经验证据。以往研究较多从理论探讨方面去描述公共数据要素资源对整体社会经济价值的创造,较少从城乡二元语境中分析公共数据要素的普惠性影响。本文基于地级市政策推动公共数据平台上线这一自然实验,分别从城市和农村视角论证了公共数据要素赋能城乡收入增长的普惠性和非排他性效益,这是本文从研究视角上进行的拓展。
第二,将公共数据开放与城乡收入协调增长置于统一框架进行研究,探索了公共数据要素对新型城镇化建设的现实价值。现有研究对公共数据开放的整体社会价值创造的定量研究较少,针对均衡性发展视角研究更为稀缺[13]。本文在对公共数据要素的经济增长效能研究基础上,进一步探索了城乡收入增长的协调效应,将城乡协调发展纳入研究框架,以此为公共数据要素共享以及共促城乡协调发展提供新思路。
第三,本文使用了更为精确的城市层面数据进行有关定量研究,以此为中国城乡协调发展提供更为准确的研究结论以及更加切实可行的政策建议。本文使用手动搜集并精确核对的城市数据平台上线数据,结合中国县(市)社会经济统计年鉴数据对城乡居民收入增长效应进行研究。本文中更为精细化和准确化的数据相较于省级公共数据开放的研究[14-16],更具代表性和准确性。希望本研究对于深化数据资源体系建设、合理挖掘数据要素潜能、促进城乡协调发展具有启示意义。
一、制度背景与研究假说
(一) 公共数据开放的制度背景
数字时代下,数据资源成为土地、劳动力、资本和技术以外的第五大生产要素,同时也成为国家基础性战略资源,其巨大潜力驱使各国政府借助信息技术,通过数据开放制度鼓励数据创新应用,可以挖掘数据价值以实现增强行政效能的目标。
美国于2009年上线国家数据开放平台,英、法、加等国家也陆续出台相关政策以建设数据开放网站[18]。我国政府强调公共数据开放以赋能实体经济的高质量发展。国务院于2015年8月31日发布《促进大数据发展行动纲要》,强调了我国存在政府数据开放共享不足等问题,应“大力推动政府部门数据共享”和“稳步推动公共数据资源开放”,通过加快各地区、各部门、各有关企事业单位及社会组织信用信息系统的互联互通和信息共享,进一步丰富面向公众的信用信息服务并提高政府服务和监管水平。
随后,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》《“十四五”规划和2035年远景目标纲要》和《“十四五”数字经济发展规划》等也强调了“推进政府数据开放共享”的重要性。国务院于2022年6月6日发布《关于加强数字政府建设的指导意见》,进一步强调“建立健全数据治理制度和标准体系,加强数据汇聚融合、共享开放和开发利用”。
国家发展和改革委员会等四部委于2024年5月14日发布了《关于深化智慧城市发展推进城市全域数字化转型的指导意见》,进一步明确了“构建开放兼容、共性赋能、安全可靠的综合性基础环境”,“有序推动公共数据开放”。在中央政策的支持下,各地政府积极响应并出台公共数据开放管理相关立法,多个省市陆续成立并升级数据集团公司以强化对公共数据的运营管理。
公共数据开放是指政府整合公共数据资源,开放给社会主体平等使用的过程。
一方面,公共数据开放为公众提供查询权力并保障其知情权;
另一方面,公共数据开放能够保障公众对公共数据的使用权,社会主体能够直接下载公共数据或者利用开放API提取使用公共数据。公众在使用公共数据的过程中可以更便利地进行企业选址、资源挖掘和促进产业升级,进而实现公共数据开放地商业价值和社会价值提升。
关于公共数据开放的内容,不仅包括内部政务数据,还包括市场主体在商业活动中产生的与社会公共利益相关且具有公共属性的数据,其需要具备未经过加工或解读以及数据获取上存在非竞争性与非排他性这两个特性:前者有利于使用者对原始数据进行整合、提炼与分析,以数据优化经济决策的形式,发掘数据的潜在价值;后者有利于公共数据面向全部社会主体,依靠市场的力量激发数据要素活力。
(二) 数据搜集与核对
鉴于公共数据开放内容的上述特性,需要限定一个科学合理范围来定义城市是否完成了公共数据开放,以此便于学者对公共数据开放政策进行深入研究。有关研究认为,公共数据不仅包括政府内部的政务数据,而且需要涵盖企业等市场主体的相关数据。
根据上文对公共数据开放的定义,本文将公共数据开放平台定义为包含企事业单位等多元市场主体所产生的与社会公共服务相关的数据开放平台,而不仅仅局限于国家法定公开的相关数据与政策内容。为确保研究的科学性和严谨性,本文定义的公共数据开放平台需要满足以下3个条件:
(1)平台提供未通过加工、解读等方式处理的原始数据信息;
(2)数据获取面向全体公众,不需要额外权限;
(3)数据可以直接下载或读取,不需要其他额外技术手段处理。
据此,本文确定了规范步骤进行数据搜集:
(1)限定公共数据平台为政府集中式统一数据开放平台,剔除政府具体业务部门开发的独立数据平台;
(2)人工手动搜索城市名称+“数据开放”“数据资源”“公共数据”“政务数据”等关键词,获取数据开放平台的网址并逐一核对。
(3)根据上文定义对公共数据开放平台进行人工筛选后,参考复旦大学DMG数字与移动治理实验室发布的《中国地方政府数据开放报告(城市)》、华中师范大学信息管理学院发布的《中国政府开放数据利用研究报告》对数据进行交叉验证,获得了截至2023年底共计170个城市公共数据平台信息以及首次上线时间(如图1所示),将其作为“城市—年度”层面是否上线公共数据开放平台的虚拟变量,并以此开放数据进行有关研究。
图1 地级城市公共数据开放趋势图
(三) 研究假说
我国持续推进基础性、普惠性民生建设,人民生活水平全方位提升,居民幸福感显著提高。居民人均可支配收入从2012年的16 510元增加到2022年的36 883元,扣除价格因素,2022年比2012年增长83%,全民收入得到快速增长。
为了深入厘清城乡居民收入的变化情况,本文基于《中国县(市)社会经济统计年鉴》的数据展示了我国城乡居民的可支配收入变化水平(如图2所示)。图2显示,自2013年以来,我国城乡居民收入都呈现显著增加趋势,农村居民的收入增长速度高于城镇居民增长速度。
但自2015年以来,农村居民的收入增长率相对降低,因此,如何维持并提升农村居民收入增长速度成为当前乡村振兴的一个重要问题。庆幸的是,数字经济时代给我国城乡居民收入增长带来了新机遇。公共数据开放作为数字经济发展背景下城乡居民使用公共数据的重要途径,可以通过多维渠道对城乡居民收入产生影响,以此促进共同富裕与城乡协调发展。
图2 地级城市城镇和农村可支配收入变化趋势
首先,城乡生产要素自由流动有利于提高要素配置效率、优化城乡关系和促进城乡融合发展。一方面,新型数字信息能够影响外来投资和生产要素利用;另一方面,良好商业环境的营造也需要新型数字技术助力。
那么,公共数据开放可以有效推动数字信息和数字技术扩散以促进生产要素的流通。
第一,公共数据开放有利于全体居民获取数据资源,而数据资源作为当今数字时代最为重要的生产要素之一,可以赋能居民进行经济价值创造。
第二,公共数据开放有利于提升居民信息获取效率,进而优化自身行为决策。此外,公共数据开放能够通过降低企业成本、增强企业内部控制以及强化区域人才集聚效应与技术集聚效应,并以此推动生产要素流通并增加社会经济产出,最终实现城乡居民增收。
其次,区域经济发展除了受到传统交通基础设施的影响外,还受到信息基础设施建设水平的制约。
公共数据开放平台的建设可以促进数字基础设施的完善,破除因传统基础设施差异造成的信息壁垒,让城乡居民可以更便利地获取数据信息,优化其就业和创业等决策,进而推动城乡居民就业结构的转型。此外,因为城乡居民的社会发展水平、要素配置、教育水平、基础设施等方面存在天然差距,我国城乡数字鸿沟也是城乡二元经济结构在数字时代的表征。数字鸿沟通过更大程度上抑制低收入组家庭创业及农村家庭非农就业,加剧收入不平等状况。
此时,公共数据开放有利于缩小城乡间信息间隙。信息公开化以及普惠化,让农村群体也能及时获取高价值的就业信息资源,减小因信息劣势对农村居民在就业创业等方面的消极影响,进而促进整体社会就业结构转型并增加城市整体创业活力。此时,新型信息技术变革可能使得收入较低的农村群体具有更大的边际收益倾向,因此,相较于收入较高群体具有更高的收入增长速度。
综上所述,本文提出以下假说:
假说1:公共数据开放不仅能促进城乡居民收入以及收入增长速度,还能推动城乡收入协调增长。
假说2:公共数据开放通过提升城市要素资源流通、促进城乡居民就业转型、增加城市创业活跃度来促进城乡居民增收。
二、数据与研究设计
(一) 数据来源与变量定义
本文使用的数据主要来源于三个方面:
其一,本文所用地级市层面的城乡居民收入信息来自于2013年到2019年的《中国县(市)社会经济统计年鉴》;
其二,公共数据开放信息来自作者对全国地级市城市网站逐一手动测验与搜集;
其三,控制变量信息来自《中国城市统计年鉴》,对于缺失值情况根据各地级市统计年鉴进行补充,倘若仍然存在缺失值则采用线性插值法补全。此外,对核心变量观测缺失的城市样本进行剔除,最终获得我国274个地级城市共1 918个面板观测作为本文研究样本。
被解释变量:城镇居民可支配收入、农村居民可支配收入、城镇居民收入增长率、农村居民收入增长率与城乡协调增长。具体地,前面两个指标为具体的年度收入水平,后面三个指标采用增长率来反映增长或者相对增长情况。关于城乡收入水平方面,采用统计年鉴提供的实际年度可支配收入水平信息。关于城乡收入增长方面,即采用城镇居民人均可支配收入增长率和农村居民人均可支配收入增长率来反映城市的二元经济体的收入增长情况。关于城乡协调发展层面,本文采用城市居民人均可支配收入增长率与农村居民人均可支配收入增长率之差来反映。倘若城乡收入增长率差值为正,则表明城市居民的收入增长更快,城乡发展差距拉大;倘若城乡收入增长率差值为负,则表明城市居民收入的增长率低于农村居民,城乡发展差距逐渐缩小。
自变量:公共数据开放。倘若一个地级城市政府推进并开放了公共数据线上平台,那么将该城市在开放年份及后续年份期间定义公共数据开放为1,否则为0。为了准确核定某城市是否为公共数据开放城市,本文进行了详细和严格的搜集认证工作,这能保证公共数据开放城市组群的正确划分,也能便于后续进行严谨的科研分析。具体搜集程序和步骤此处不再赘述,详见本文第二章内容。
控制变量:考虑到城市本身的社会经济和资源禀赋状况也可能影响到城市内部的城乡发展水平,因此,在满足本文研究需求与借鉴相关文献的基础上,本文还控制了地级城市层面的控制变量。详细的控制变量信息和定义如下:经济发展水平,由人均地区生产总值(亿元)的对数值表示;产业结构指标,由第二和第三产业除以地区生产总值的比值反映;人力资本水平,为避免回归分析中数值太小问题,本文采用每百人在校大学生对数值来衡量;金融发展水平,本文选用年末金融机构贷款余额占地区生产总值的比值来反映;城市投资水平,采用固定投资总额占地区生产总值的比重表示;城市政府治理水平,沿用文献常用做法,选取一般公共预算支出占地区生产总值占比来度量;本文还纳入了城市民生保障水平,即每百人医院、卫生院床位数指标。关于变量的详细定义以及测算方式见表1。
表1 变量定义
变量类别 | 变量名称 | 代理名称 | 测算方式 |
被解释变量 | 城镇人均可支配收入 | UR | 城镇居民人均可支配收入(万元) |
农村人均可支配收入 | RR | 农村居民人均可支配收入(万元) | |
城镇居民收入增长率 | URG | 城镇居民人均可支配收入增长率 | |
农村居民收入增长率 | RRG | 农村居民人均可支配收入增长率 | |
城乡协调增长 | HCR | 城乡收入增长率之差 | |
自变量 | 公共数据开放 | PDO | 城市是否开放线上公共数据平台 |
经济发展水平 | LPGDP | 人均GDP对数值 | |
产业结构 | SECOND | 第二产业占比 | |
产业结构 | THIRD | 第三产业占比 | |
控制变量 | 人力资本水平 | HEDU | 每百人在校大学生数对数 |
金融发展水平 | FINA | 年末金融机构贷款余额占GDP比重 | |
投资水平 | FAI | 固定资产投资占GDP比重 | |
政府治理水平 | GOV | 一般公共预算支出占GDP比重 | |
民生保障水平 | NBP | 每百人医院卫生院床位数 |
注:公共数据开放数据信息来源于作者手动搜集整理。
在对变量进行定义之后,表2汇报了有关变量的描述性统计信息。鉴于《中国县(市)社会经济统计年鉴》在2013年才开始统计农村居民可支配收入指标,因此,本文选取2013年到2019年的数据进行实证研究。从表2可见,样本期间我国城市居民的年度平均可支配收入(UR)大约为30 000元,而农村年度可支配收入水平(RR)不到14 000元,城乡收入差距仍然比较显著。
城镇居民可支配收入增长速度(URG)大约为8%,农村居民可支配收入(RRG)增长速度在10%左右。其中,就城乡收入增长的协调发展程度(HCR)而言,城市居民比农村居民的收入增长率略低。公共数据开放(PDO)情况方面,截至2019年,受到公共数据开放影响的城市观测样本占比达到10%。最后,第二产业和第三产业生产占比都达到40%以上,其他控制变量的统计特征也与最近研究相似[22-23]。
表2 描述性统计
变量名称 | 观测数 | 均值 | 标准差 | 最小值 | 最大值 |
UR | 1 918 | 3.03 | 0.85 | 1.56 | 7.38 |
RR | 1 918 | 1.36 | 0.49 | 0.35 | 3.74 |
URG | 1 918 | 0.08 | 0.04 | -0.28 | 0.39 |
RRG | 1 918 | 0.10 | 0.05 | -0.33 | 0.49 |
HCR | 1 918 | -0.02 | 0.05 | -0.51 | 0.35 |
PDO | 1 918 | 0.10 | 0.31 | 0.00 | 1.00 |
LPGDP | 1 918 | 10.75 | 0.55 | 9.04 | 12.58 |
SECOND | 1 918 | 0.45 | 0.10 | 0.11 | 0.79 |
THIRD | 1 918 | 0.43 | 0.10 | 0.16 | 0.84 |
HEDU | 1 918 | 1.94 | 2.05 | 0.02 | 12.94 |
FINA | 1 918 | 1.04 | 0.63 | 0.12 | 9.62 |
FAI | 1 918 | 0.93 | 0.43 | 0.02 | 4.57 |
GOV | 1 918 | 0.21 | 0.10 | 0.04 | 0.92 |
NBP | 1 918 | 0.48 | 0.17 | 0.14 | 1.41 |
注:数据资料来源于《中国县(市)社会经济统计年鉴》《中国城市统计年鉴》与各城市统计年鉴。
(二) 实证研究策略
本文从城市和农村两个视角来研究公共数据开放对城乡居民收入增长的影响,结合多期双重差分法来分析政府公共数据开放对居民带来的收入增长效应。将城市在开放年份及后续年份期间定义公共数据开放为1,否则为0。通过对比处理组城市和非处理组城市在数据开放前后的收入增长变化,以此衡量政策的经济价值效应。具体的识别策略式如下:
其中,
如果
(三) β 收敛检验分析
为了简略刻画我国城乡居民收入的共同富裕的推行成效,本文还以条件
条件
其中,
基于式(2)的条件
从现实意义来看,农村居民的低收入群体可支配收入增长更快,优化型
表3 城乡可支配收入β 收敛检验结果
URG | RRG | |
(1) | (2) | |
L.城镇居民可支配收入 | -0.107*** | |
(0.022) | ||
L.农村居民可支配收入 | -0.186*** | |
(0.045) | ||
控制变量 | 是 | 是 |
R2 | 0.314 | 0.439 |
样本量 | 1 918 | 1 918 |
注:1. *、**、***分别表示在10%、5%、1%水平上显著。2.所有列均为省份层面的聚类稳健标准误结果。
三、实证结果分析
(一) 基准结果分析
根据式(1)的基准实证分析结果见表4。表4中第(1)到(5)列分别表示公共数据开放对城镇居民可支配收入、农村居民可支配收入、城镇居民收入增长率、农村居民收入增长率以及城乡协调增长的政策影响效应。在表4的回归中本文均控制了有关控制变量、城市固定效应和年份固定效应,且所有回归结果均将标准误聚类到省份层面。
列(1)和列(2)表明,政府公共数据开放都显著促进了城镇和农村居民的可支配收入水平提升。从经济价值而言,对农村居民收入提升的促进作用并不小于城市居民。
列(3)和列(4)表明,政府公共数据开放对城镇居民和农村居民的收入增长率也同期具有提升效应,加快了全体居民的收入增长速度。仅从增长率变化数值来看,对农村居民的收入增长率贡献达到2.8%,超过城市居民的两倍水平。由此,本文使用更精确的城乡收入增长率差值来衡量公共数据的协调促进作用。
列(5)显示了公共数据开放对城乡收入增长率差距的影响效果,可见数据开放对城市居民的收入增长率贡献程度显著更低。这意味着公共数据对农村居民的收入增长促进效益更大,有利于促进城乡协调发展。关于其他控制变量的分析结果,与现有文献基本保持一致[13]。由此,假说1得以验证。
表4 基准结论:公共数据开放与城乡收入增长
变量名称 | UR | RR | URG | RRG | HCR |
(1) | (2) | (3) | (4) | (5) | |
PDO | 0.033*** | 0.033*** | 0.011*** | 0.028*** | -0.017** |
(0.008) | (0.009) | (0.003) | (0.007) | (0.008) | |
LPGDP | 0.040 | 0.000 | 0.008 | -0.032* | 0.041* |
(0.055) | (0.023) | (0.019) | (0.019) | (0.020) | |
SECOND | -0.397 | -0.203* | -0.140 | -0.175 | 0.035 |
(0.310) | (0.119) | (0.121) | (0.112) | (0.110) | |
THIRD | -0.490 | -0.334** | -0.170 | -0.294** | 0.123 |
(0.330) | (0.160) | (0.130) | (0.123) | (0.120) | |
HEDU | 0.007 | -0.001 | 0.002 | -0.002 | 0.004 |
(0.006) | (0.001) | (0.002) | (0.002) | (0.003) | |
FINA | 0.012* | -0.002 | 0.005* | -0.003 | 0.008** |
(0.006) | (0.004) | (0.003) | (0.004) | (0.003) | |
FAI | -0.018 | -0.022*** | -0.008 | -0.023*** | 0.015* |
(0.013) | (0.005) | (0.005) | (0.005) | (0.008) | |
GOV | -0.414** | -0.010 | -0.180** | -0.037 | -0.143* |
(0.161) | (0.067) | (0.070) | (0.064) | (0.078) | |
NBP | 0.032 | 0.049 | 0.005 | 0.030 | -0.025 |
(0.080) | (0.064) | (0.030) | (0.052) | (0.046) | |
城市FE | 是 | 是 | 是 | 是 | 是 |
年份FE | 是 | 是 | 是 | 是 | 是 |
R2 | 0.991 | 0.994 | 0.371 | 0.467 | 0.496 |
样本量 | 1 918 | 1 918 | 1 918 | 1 918 | 1 918 |
注:1. *、**、***分别表示在10%、5%、1%水平上显著。2.所有列均为省份层面的聚类稳健标准误结果。
(二) 平行趋势与安慰剂检验
基准结论成立的前提是满足事前平行趋势假设。平行趋势假设可以排除处理组和非处理组城市并不会受到其他潜在不可观测因素或政策的影响,从而保证结论的可信性。为此,借鉴方锦程等[13](2023)的思想,在方程(1)中加入各年份虚拟变量和处理组的交乘项,使用事件分析法进行平行趋势检验。
其中,
其中,图3到图5中实线为回归系数,虚线为95%的置信区间。可以明显看到,在公共数据开放政策试点前三期,试点城市与非试点城市的居民收入、收入增长率以及城乡协调指标都没有显著变化差距,而在公共数据开放以后,数据开放试点城市的前四项指标都呈现显著上升现象,即试点城市的城乡居民收入与收入增长指标增长幅度都显著大于非试点城市。
而且,这一政策引致的增长效应在农村居民群体中还呈现递增趋势。
此外,公共数据开放也相对显著增加了农村居民收入增长率,使得图5中城乡增长率差距指标出现负向显著的结果。综上而言,本文的事前平行趋势假说得以满足。
图3 城镇可支配收入(左)和农村可支配收入(右)的平行趋势检验
图4 城镇可支配收入增长率(左)和农村可支配收入增长率(右)的平行趋势检验
图5 城乡协调增长指标的平行趋势检验
此外,本文还进行500次反事实安慰剂检验来验证基准结论稳健性。鉴于本文共有5个核心被解释变量指标,此处仅以农村居民收入增长率以及城乡协调发展指标为例,展现安慰剂检验结果。
安慰剂检验的思想在于,公共数据开放的政策试点城市和开放时间是外生的,那么如果随机选择相同数量样本的伪试点城市和伪开放年份进行分析,就不太可能会出现显著的伪政策效应结果。本文虚拟政策处理的安慰剂检验具体过程为:
第一,首先确定政策处理组样本数量,然后在总样本中随机选取相同数量的伪处理组城市;
第二,将政府数据开放随机排序,再与随机选取的伪处理组城市进行交乘,构成随机的伪DID处理项;
第三,将之前所构建的伪DID处理项进行双重差分分析,得到伪政策处理效应系数;
第四,将以上三步进行500次循环分析,最后将500次伪政策处理效应系数进行分布密度拟合。图6和图7分别为农村可支配收入增长率和城乡可支配收入增长率差的安慰剂检验系数密度拟合图,可以看到安慰剂检验的伪政策处理系数基本分布在0值附近,而且显著区别于本文基准回归系数。根据安慰剂检验结果,可以认为基准结论并不受到遗漏变量等因素的偏误影响,进而进一步验证本文结论的稳健可信度。
图6 农村可支配收入增长率的安慰剂检验
图7 城乡可支配收入增长率差的安慰剂检验
(三) 机制探索
以上实证分析证明了公共数据开放能够同时促进城乡居民收入增长,而且对农村居民收入增长效率促进作用更大。
在此,本节进一步考察公共数据开放影响城乡居民收入增长的潜在机制。对于同时促进城乡收入增长视角,本文拟从改善区域信息壁垒、促进生产要素流通角度进行分析;对于更多促进农村居民收入的视角,本文拟从就业转型与私营创业角度进行分析。
在收入较低地区,区域经济环境往往伴随着交通基础设施建设落后、信息基础设施供给不足等特征,这可能引致两方面的社会后果。
其一,交通基础设施落后可能打击资本的投资信心,进而产生外来投资疲软和生产要素流通不畅等问题,会对经济生产与跨区域交易活动产生消极影响,不利于地区经济发展水平提升,进而阻碍城乡居民增收;
其二,信息基础设施落后会加剧信息不透明对城乡发展的影响,会阻塞投资者和当地的双向信息交换渠道,进而引致城市商业机遇的缺失和对商业潜能挖掘的不足,不利于城市创业活跃度的稳步提升,增加了城乡居民收入增长的成本。随着城市公共数据平台上线,公共数据要素潜能得以释放,生产要素资源进一步畅通,进而引领市场主体挖掘商机并优化经济行为决策,以此产生普惠增收效应。
基于数据可得性原则,本文参考刘修岩等(2017)的研究,用城市货运量与客运量分别代表生产资源要素与人力资本要素的流通水平。公共数据开放对要素流通水平的影响结果分析见表5,其中列(1)和列(2)为公共数据开放对城市货运总量以及公路货运量的影响效应,列(3)和列(4)为公共数据开放对城市客运总量以及公路客运量的影响效应。表5结果表明,城市数据开放有效促进了生产要素的流通水平,但是对人口要素的流动并没有显著影响。因此,本文认为公共数据开放更可能是通过生产要素的流动,以此增加城市市场主体的经济活跃度,提高城乡居民的收入水平。
表5 机制分析1:公共数据开放与要素流动
变量名称 | 货运总量 | 公路货运量 | 客运总量 | 公路客运量 |
(1) | (2) | (3) | (4) | |
PDO | 2 253.363** | 1 977.026*** | -612.056 | -684.621 |
(1 042.255) | (756.332) | (472.223) | (638.070) | |
控制变量 | 是 | 是 | 是 | 是 |
R2 | 0.831 | 0.591 | 0.872 | 0.716 |
样本量 | 1 918 | 1 918 | 1 918 | 1 918 |
注:1. *、**、***分别表示在10%、5%、1%水平上显著。2.所有列均为省份层面的聚类稳健标准误结果。
其次,本文还从城乡居民就业转型和城市创业活力来探索公共数据开放促进城乡协调增长的潜在机制。随着公共数据的开放,农村居民也相对更加平等地享受公共数据资源。就居住地地理分布而言,农村居民更多地居住在郊区或者山区地带,区域地理壁垒可能造成城乡之间的“数字鸿沟”,这使得农村居民只能获得相对低质量以及滞后的就业或创业信息,“数字鸿沟”的存在使得农村居民在就业或创业市场都处于不利地位。政府对公共数据的开放,使得城市就业市场信息公开化以及普惠化,农村群体也能及时获取高价值的就业信息资源,从而促进整体社会就业结构转型,也可能增加城市整体创业活力。有鉴于此,本文采用产业结构和私营创业信息来验证以上机制猜想。具体的回归结果见表6。
列(1)中不难看出政府数据开放能够减少城市的一二产业从业人员占比,这就有效增加了城市第三产业从业人员占比。对于农村居民群体而言,较多居民从第一产业职位转向了服务业等第三产业中,这有效增加了农村居民的收入水平。根据新古典经济趋同理论思想,随着经济发展与技术变革,收入较低群体具有更大的边际收益倾向,因此,相较于收入较高群体具有更高的增长速度。这说明,公共数据开放能够更多促进农村居民的收入增长速度。
此外,表6列(2)表明,随着城乡居民的就业结构转型,更多农业参与者会转向服务业等领域,增加个体私营创业行为,提升城市创业活跃度。这表明,公共数据开放扩宽了数据使用群体的福利可达性,提升了市场商机可及性,更多促进创业资源向农村居民转移,以此实现农村居民收入的后发追赶。由此,假说2得以验证。
表6 机制分析2:公共数据开放与就业转型
变量名称 | 一二产业从业人员占比 | 个体或私营从业占比 |
(1) | (2) | |
PDO | -0.004*** | 0.020** |
(0.001) | (0.010) | |
控制变量 | 是 | 是 |
R2 | 0.985 | 0.828 |
样本量 | 1 918 | 1 918 |
注:1. *、**、***分别表示在10%、5%、1%水平上显著。2.所有列均为省份层面的聚类稳健标准误结果。
四、异质性分析
经济地理的基础理论和世界各国的发展实践表明,由于受到自然地理环境和社会经济基础等多方面因素的制约,经济发展在空间维度上往往是非均质、不平衡的。
现阶段,我国经济已经由高速增长转向高质量发展,优化区域经济结构、转型经济增长动力已经成为实现中国式现代化的迫切要求。而政府公共数据开放具有弥合区域壁垒、畅通要素流通、促进城市创业活力以及优化居民就业结构的多重普惠影响,因此,对我国非均质发展的地理空间模块也可能具有差异性影响。
为此,本文将城市样本划分为东部与中西部城市进行异质性分析。虽然本文研究同时关注城乡居民收入与收入增长水平,但是,收入增长水平能够同期反映居民收入水平的方向(即收入增加或减少)和效率(即收入增长速度)特性,因此,本节异质性分析将以增长速率为例进行异质性分析。
根据地理模块划分进行公共数据开放的异质性效应分析结果如图8所示。其中,Panel A表示公共数据开放对城镇居民可支配收入增长率的影响,Panel B结果表示对农村居民可支配收入增长率的影响,Panel C表示对城乡可支配收入增长率差距的影响结果。从Panel A和Panel B可以看到,无论是城镇居民还是农村居民,公共数据开放对中西部城市居民收入的影响都较为显著。
一般而言,数字经济发展与地区经济发展程度正向挂钩,由此,东部地区的数字经济水平也比中西部地区整体更高。而随着公共数据开放实施,数字经济的格局得以重塑,使得中西部地区居民收入增长获得更大提升。可见,城市公共数据开放不仅有利于城乡经济的协调发展,还有利于中西部地区对东部地区经济的后发追赶,从而促进区域协调发展。但仅从东部和中西部的城乡增长率差别来看,两个地理空间模块的城乡居民收入增长并没有显著差异。
图8 东部和中西部地区异质性分析
从我国地理空间角度而言,“东西差距”由来已久。但是,近年来,“南北差距”也正在逐渐显现。随着中国式现代化的推进以及数字经济深入赋能实体经济发展,以往高度依赖资源发展的北方地区正在失去比较优势,南北经济分化问题也在逐渐凸显。
其中,北方地区创新驱动不足、新旧动能转换困难是导致南北经济差距逐年扩大的重要原因。公共数据开放具有非排他性的普惠效应,特别对于北方地区城市能以此促进区域产业结构优化,从而提升区域经济发展。
鉴于此,本文将样本城市划分为南北两个地区进行异质性分析,关于南北地区的具体划分标准参考张辉(2023)的研究。针对南北地区的公共数据开放政策效应分析结果如图9所示,与图8类似,Panel A、Panel B和Panel C分别表示公共数据开放对城镇居民可支配收入增长率、农村居民可支配收入增长率和城乡可支配收入增长率差距的影响结果。
从Panel A和Panel B可以看到,公共数据开放对北方地区的城乡居民收入都具有显著促进作用,而且,相对更大程度促进了北方城市的城镇居民收入增长速度,相对更高促进了南方地区的农村居民收入增长速度。此外,从Panel C可以看到,公共数据开放能够更大地促进南方农村居民的收入增长速度,但是对北方地区的城乡居民收入增长率贡献程度没有显著差异。
由此可知,公共数据开放可以显著促进南北地区的城乡收入增长水平,但是,从收入协调增长角度来看,数据开放能够更好地促进南方地区的城乡协调发展水平,而如何有效利用公共数据要素促进北方地区的城乡协调发展问题还需得到重视。
图9 北方和南方地区异质性分析
五、结论与启示
(一) 研究结论
协同实现“经济持续稳定增长”与“促进城乡协调发展”是共同富裕的重要内容,也是中国政府的施政目标。作为新型数字经济资源的重要组成,公共数据开放在破除区域信息壁垒、促进生产要素流通、优化就业结构以及资源配置方面扮演了重要角色。本文以274个地级市城市为例,结合手动搜集的城市公共数据开放数据,借助多期双重差分模型研判政府公共数据开放平台上线对我国城乡居民收入增长的影响作用,得到以下基本结论:
1.政府公共数据开放显著促进了城乡居民可支配收入以及收入增长水平提升,而且对农村居民的收入增长率促进效应相对更大。这一结论表明,政府公共数据开放不仅能够促进城乡居民整体收入水平的提高,还能有效改善城乡协调增长水平。基准结论在事前平行趋势和安慰剂等稳健性检验下依然稳健。
2.公共数据开放促进城乡居民收入增长的机制在于,公共数据开放有效缩小了区域信息壁垒、促进生产要素流通、促进了居民就业结构转型以及提升了个体和私营企业创业行为。
3.异质性分析发现公共数据开放更加显著促进了中西部地区的城乡居民收入水平增长。这为公共数据开放促进区域协调发展提供了经验证据。此外,公共数据开放能够同期促进南方和北方地区的城乡收入水平提升,但仅仅有效改善了南方地区的城乡协调增长水平。
(二) 政策启示
上述研究结论对鼓励地方政府实施公共数据开放、促进城乡居民收入增长、均衡城乡协调发展水平具有较好的政策启示:
1.应充分认识公共数据开放带来的巨大经济价值潜能,以多元化规范化机制促进公共数据资源使用的便捷性、高效性和合法性,让数字经济发展的红利可以惠及全体民众。
2.深度挖掘公共数据开放为我国中西部开发带来的数字机遇和数字红利,以生产要素顺畅流通促进城乡居民就业转型,激活创业细胞,促进城乡居民增收。特别针对西部落后地区,推动公共数据开放,赋能实体经济,焕发其活力,鼓励引导市场主体积极有效利用数据资源,以此实现对东部发达地区的后发追赶。
3.准确把握公共数据开放对南北地区的效果差异,推动公共数据多样化供给。公共数据开放可有效促进南北地区的城乡收入增长,但是对北方地区协调增长水平提升的效果欠佳。据此,政府须进一步丰富公共数据资源的供给类型,对准信息供需接口。此外,还需加大对农村居民使用公共数据的培训指导,以最大程度激发公共数据对农村居民的增收效能,以此促进城乡协调发展。
4.在新型数字变革的大潮流下,推进全民掌握和使用公共数据资源,积极释放公共数据的社会福利价值,借此协同实现城乡居民增收与城乡居民收入协调增长。
来源 北京交通大学学报社科版,原标题为《公共数据开放与城乡居民收入增长:来自政府数据平台上线的证据》(作者:谢尚,赵鹏军)