查看原文
其他

"互联网+交通物流"与人口城镇化;基于"两新一重"融合模型

王贵东 杨德林 经济学报 2022-12-31

本文选《经济学报》2021年第 8 卷第 1 期

引文格式:王贵东,杨德林.“互联网+交通物流”与人口城镇化:基于“两新一重”融合模型[J].经济学报,2021,8(01):129-158.

              审稿点评:

该文研究“互联网+交通物流”对人口城镇化推进的影响,选题较为新颖,论文结构安排合理,理论分析与实证模型构建过程均体现出一定的专业功底。



作者:

王贵东  清华大学  经济管理学院

杨德林  清华大学  经济管理学院



摘 要  本文主要研究"两新一重"政策,为了便于数学化、模型化处理,本文将"两新一重"提炼为以"互联网+"为核心要素的新基建、以人为本的新型城镇化、以交通物流为典型代表的老基建。在理论方面,本文将"两新一重"融合至城镇化模型中,在动态 一般均衡框架下剖析交通物流以及"互联网+交通物流"如何影响人口城镇化。在实证方面,利用 2004—2018 年 73 个国家面板数据,采用加权 LIML 工具变量法检验本文理论模型。研究发现∶交通物流促进了城镇化发展,且"互联网+"强化了交通物流对人口城镇化的正影响。此外,在金砖五国之中,中国交通物流对城镇化发展的总促进作用排第三,而中国互联网对城镇化发展的总促进作用排第一。


关键词  新基建;互联网+;交通物流;两新一重

以下为全文推送:

也可以识别二维码电脑下载PDF全文



或点击下方原文链接  查看PDF全文

0 问题提出

2020 年是极其特殊的一年。这一年中国政府既要全面建成小康社会,又要有效应对COVID-19 疫情、中美贸易摩擦等全球事件。在第一季度 GDP 同比下降 6.8%的背景下,中国政府提出"两新一重";大力支持新型基础设施建设、新型城镇化建设,大力支持交通、水利等重大工程建设。本文试图研究"两新一重"的数学内在逻辑,以之为决策层提供有效的理论支持。


目前,大多数社会科学工作者对国家政策的研究属于唯象( Phenomenology)分析,侧重用概括事实、经验总结等方式解释社会现象背后的发展规律。本文试图打破唯象,对现象自身的内在原因作深层次数理分析,将"两新一重"政策数学化、模型化。为了易于处理,本文忽略了"两新一重"的一些细节。虽然这些细节会使本文的理论分析不够全面,但政策要点的抽象化处理有利于理清政策背后的数学逻辑。具体而言,本文将"两新一重"提炼为以"互联网+"为核心要素的新基建 、以人为本的新型城镇化、以交通物流为典型代表的老基建,从而将其抽象为互联网、人口城镇化、交通物流三个元素。本文主要以人口城镇化这一元素为落脚点,研究互联网和交通物流对人口城镇化的影响,试图回答以下问题;交通物流能否影响人口城镇化?如果影响,那么"互联网+交通物流"是强化还是弱化该影响。为此,本文的研究思路是∶先构建"两新一重"的城镇化融合模型,剖析互联网、交通物流如何影响人口城镇化,然后利用世界各国历史数据去验证理论模型。如果验证通过,那么本文的理论模型可以反映世界城镇化发展的一般规律,进而为中国政府有效实施"两新一重"政策提供理论支撑。


本文的创新点主要体现为两方面∶(1)理论部分,将"两新一重"融合至城镇化发展理论模型。该模型在动态一般均衡(Dynamic General Equilibrium,DGE)框架下,借鉴了城市平衡增长模型(Black and Henderson,1999;王贵东,2018)、 Maslow 需求层次理论、单中心城市理论(Brueckner,1987)、Samuelson 冰川模型、 Engel定律等。(2)实证部分,巧妙运用权重解决数据样本的代表性问题


1 文献综述


中国的经济发展方式已发生转变,体现为以工业经济为主要推动转向以工业经济、城镇经济共同推动(王国刚,2010)。正确处理好工业化与城镇化的关系,将有助于产业和人口集聚的效率提升与社会民生 的协调发展(黄群慧, 2018)。中国要在 2035年基本实现社会主义现代化,必然要解决农村人口向城市转移的问题。为了加快农村转移人口的市民化,推进城镇化持续、健康发展., 2014年 3月《国家新型城镇化规划(2014—2020 年)》出台,提出到2020 年将常住人口城镇化率提高到60%左右;2019 年 4 月《2019 年新型城镇化建设重点任务》印发,提出全面取消Ⅱ型大城市落户限制,全面放开放宽Ⅰ型大城市落户条件。根据国家统计局最新数据,2019 年中国的常住人口城镇化率为60.60%,已经完成 202O年 60%的规划目标,但该年常住人口城镇化率与户籍人口城镇化率仍有16.22个百分点的缺口。2020 年是全面建成小康社会的收官之年,但席卷全球的 COVID-19 却给中国带来前所未有的挑战,由此造成的禁足无疑会对人口由农村向城市流动形成物理障碍,尤其是农民工就业密集的行业(韩长赋, 2020),甚至有可能出现农民工滞留农村的逆城镇化现象。在这特殊的历史交汇期,如何健康、稳定地推进城镇化显得至关重要,而"两新一重"政策的适时提出,在某种程度上也反映出中国政府稳健推进城镇化的决心。


中国的城镇化和劳动力转移是不同质的。虽然中国的人口城镇化率已由 1978 的 17.92%提高到 2019 年的 60.60%,但中国的城镇化水平却存在着高估(王春光,2006;李爱民,2013),基本处于不稳定的半城镇化状态①。国内学者对中国城镇化的快速发展给出了不同解释,也提出了很多担忧。在城镇化阻力方面,通过运用推拉理论模型,李强(2003)认为制度是农民工流动最大的阻碍;而随着中国从农村与城市的老二元结构向城镇内部户籍居民与流动人口的新二元结构转变(陈云松和张翼,2015),王曦和陈中飞(2015)发现户籍制度构成了中国城镇化的主要障碍;对于中国农村人口更易地域流动、职业流动却难以身份流动的特殊现象,王通(2018)认为既有政策因素、市场因素的阻滞,也有农村流动人口自身的"联根"属性②。在城镇化推力方面,多数学者(王春光,2001;陶然和徐志刚,2005;段成荣等,2008;任远和乔楠,2010;杨菊华,2015)认为,中国的城镇化主要是由农村剩余劳动力(或流动人口)的被动推进,并从各方面研究城乡融合问题。通过分析7种城镇化推进模式,李强等(2012)认为政府是中国城镇化的主要推动者;国务院发展研究中心和世界银行联合课题组(2014)则认为中国城镇化的一大推动因素是 1980 年开始实施的决策权下放,但是担忧城镇化与居民收入的脱节。但夏柱智和贺雪峰(2017)坚持认为,国内多数学者将中国城镇化视为城镇吸纳农民的单向流动是不完全符合中国事实的,而应当将其看作农民在城乡间的双向流动。此外,中国城镇化快速发展中还出现了一些结构性问题③,区域之间存在较大差异(熊湘辉和徐璋勇,2018)。


与多数文献不同,本文的城镇化研究融合了"两新一重",重点研究其在城镇化发展中的动力机制。由于中国已经进入全面推进城乡一体化的新阶段(魏后凯,2016),所以本文的研究对象不再是过去简单割裂的城乡二元经济结构,而是复杂的城市、农村动态一般均衡系统,符合中国城乡融合发展的战略性定位。关于一般均衡理论,其最早由 Walras 于 1874 年提出,用来确定完全竞争市场的系统均衡价格和产量。80年后,Arrow and Debreu(1954)首次利用不动点理论给出了一般均衡理论的严格数学证明。一般均衡理论与不同理论交叉,产生了可计算一般均衡理论 CGE(Johansen,1960)、动态 一 般均衡理论 DGE(Hicks,1939)、动态随机一般均衡理论 DSGE(Kydland and Prescott,1982)等。目前,一般均衡理论研究仍处于经济 学前沿,并且在 经济周 期(Smets and Wouters,2007)、住房市场(lacoviello and Neri,2010;骆永民和伍文中,2012)、金融贸易(Christiano et al.,2010;康立和龚六堂,2014)、政府税收(Golosov et al., 2014)、人工智能(陈彦斌等,2019)等领域均有广泛应用。


2 理论演绎


本文理论模型主要借鉴 Black and Henderson(1999)、王贵东(2018)①、周京奎等(2019)②。


 2.1 消费者


假设家庭成员主要分布在农村和城市,农村生产价格为1的中间投入品,城市利用中间投入品生产价格为 P的最终消费品。在代表性家庭中,农村成员的比重为z;城市成员的比重为 1-z③,不妨定义 Urbanization=1-z。进而,"综合"代表人的最优决策为


(1)


其中,c、food分别为非食物消费、食物消费,令 food 值恒定;1/σ、1-σ分别为不同时点的消费替代弹性、效用的消费弹性,满足σ>0④;p、g 分别为时间贴现率、人口增长率,满足p>g;I、h分别为收入、人力资本。下标1、2 分别代表农村、城市。


式(1)意味着家庭成员的收入虽然有所不同,但家庭成员并不是以自 身效用最大化,而是以家庭效用最大化。另外,food 没有进入效用 函数,这 主要源于 Maslow 需求层次理论。该理论认为人类的需求是分层的,若低层次需求没有得到满足,则高层次需求无关紧要∶若低层次需求基本得到满足,则高层次需求构成人类行为的主要激励力量,此时低层次需求已无关紧要。言下之意,本文假设消费者的低层次需求(食物类)已得到满足,而高层次需求(非食物类)为消费者的主要激励力量。这个假设基本符合中国居民生活现状,即温饱问题已解决并向全面建成小康社会的更高目标迈进。


2.2 生产者∶农村部门


农村居民在选址宅基地时,通常选择靠近最肥沃土地、最茂密树林、最旺盛鲜草 、最集中鱼群的黄金地段,所以农田、树林、草原、江河湖海等①工作地离字基地越远,其单位土地产出越低。不妨假设农村以宅基地为中心,向外呈环状辐射,可得代表人i的单位土地产出为(1/R')(n2n%)h。其中,R为工作地的辐射距离,参数β, 反映其产出衰减速度;n, 为农村人口规模,参数 δ, 反映其外部性②;h,、h分别为农村的平均人力资本、居民i的人力资本,参数v,、θ,分别反映其外部性、弹性。再假设代表人i的工作地配置面积为 d,R,从而保证所有居民的产出均相等。其中,d,为人均农业用地配置系数,由于d,越大意味着人均农业用地越多,所以在某种程度上 d,可以表示农村土地配置。那么,农村代表人i的产出为


(2)


与此同时,农村技术创新水平的提高,可以有效降低农业生产成本,提高农业生产效率。又因为收入等于最终产出(乘以价格1)减去生产成本,所以可以假设农村代表人i的收入满足

其中,D,代表农村技术创新,是创新驱动发展战略的体现。"三农"方面的技术主要包括化肥技术 、转基因技术 、杂交技术、大棚技术、排灌技术等。综上可得农村人口规模为

其中,R,为农村边缘半径,0≤β,≤1③。令R,处的地租为零,且所有居民的通勤成本和地租之和恒等,可求得总通勤成本、总地租分别为∶




农村居民在工作地生产获得收入 W,,在工作地与宅基地之间通勤损耗成本,向农村管理者支付地租但也获得农村管理者的转移支付 T,所以农村居民的最终收入为I=W+T-(TRent+TCommuting;)/n;。进而,农村管理者的决策为



需要说明的是,转移支付主要用于补偿生产活动中人口规模的外部性,即 T;=MP.u-MPt=δ;Wi。与此同时,由Henry George 理论可知,总转移支付 n,T, 等于总地租 TRent,②,即II,=0,再结合T,=δ,W,可得


(3)

最后,综上所有关系式可得

(4)

(5)


2.3 生产者∶城市部门


在进入城市分析之前,有必要交代城市和农村的区别。(1)空间结构区别。本文假设城市也是圆形空间结构,但城市的居住地在外围,工作地在中心(CBD)。也就是说,城市和农村在空间结构上最大的区别是将工作地和居住地对调。当然,农村中的一些讨论在城市中依然适用∶地租方面,离工作地越远的居住地,其租金越低;只不过在农村是向工作地收租金,在城市是向居住地收租金。通勤成本方面,离工作地越远的居住地,其交通成本越高。转移支付方面,由于城市具有非常明显的人口集聚现象(即较强的人口规模外部性),所以每个城市居民均享有转移支付。产出方面,每个城市劳动者产出相等。(2)占地面积区别。农村工作地的占地面积 d,R' 要大于城市居住地的占地面积 d,R^①,并且d,大于d,,这主要是自然属性的不同,因为农村主要把土地用作生产,而城市主要把土地用作居住。很明显,d,可以反映城市土地配置的集约化;由于城市土地配置越集约,d2 越小,故可用 dz'表示城市土地配置的集约化。(3)人口集聚区别。本文认为城市具有较高的人口规模外部性δ,,而农村δ,则相对较低。城市方面∶其行业繁多,上下游行业、相似行业间既互补,又存在技术、知识溢出。城市还具有较多的"准"公共物品,且只有离"准"公共物品一定距离内,才能被其覆盖。这些无疑使得城市的人口更加集中。农村方面∶农田、树林等工作地,分布比较分散,农村工作者都是在彼此分割的土地上单独工作,彼此间相互交流也很少。而草原、江河湖海等工作地,若以圈地形式确立好产权,则与农田、树林一样有较低的正外部性;若产权不清晰,甚至还会出现负外部性,不过,当今社会这种糟糕情况已经很少了。(4)城市工作地集中,农村宅基地集中。在工作时,由于城市具有较高的人口规模外部性 δ,,所以城市的工作地较为集中。在夜间休息时,由于农村较偏远,容易受到周边猛兽的侵袭,并且农村的治安也较差,所以农村宅基地相对集中可以有效抵御危险事件的发生。


假设作为消费者的城市居民还充当企业本身,这样可以消除企业内部的外部性干扰,进而代表性企业 j的生产函数为


(6)


其中,D, 表示城市技术创新,是创新驱动发展战略的体现;n,为城市企业数量或人口规模;hz2、hz、xy分别为城市的平均人力资本,企业j的人力资本、企业j 的中间投入品,且满足α<1。由W,=maxPXz-xy可得xy=(1-a)【(1-a)'"D,P(n23nz)h3】",进而


(7)

仿造农村部门,可得

(8)

(9)

(10)


2.4 动态一般均衡


对于消费者决策,由式(1)可以构造"综合"代表人的现值 Hamilton 方程,整理得



(11)


对于中间投入品市场,不妨用 m,、m,、N分别表示农村数量、城市数量、总人口。假设中间投入品有三个作用∶①城市企业的生产要素;②农村和城市居民的食物,定义 Engel 系数s=food/I,(因为food 值恒定,所以s满足 Engel 定律);③支付农村和城市居民的通勤费用。

本文采用 Samuelson 冰川模型①的方式处理物流成本。假设物流效率为 ln,冰川模型意味着只有lan(其中,lw≤1)的中间投入品从农村运输至城市。不难发现,物流成本与L,呈反向关系。进而,中间投入品满足市场均衡


(12)

动态求解式(11),并结合式(4)、式(9)、m,n,/m,n,=z/(1-z),可得

(13)

其中,


由式(13),可知Urbanization/ola>0,即定理1∶ 物流效率的提升,将会促进人口城镇化。提升物流效率的方式主要有以下两种。


一是,有效缩短物流线路。①相邻自然村"组团"异地搬迁,在靠近城乡干线位置建设行政村中心社区,旨在缩短运距。②)弯曲道路通过架桥梁、打隧道变成直线道路。③基于互联网 Internet 新基建,采用先进的物联网技术,在多个物流节点之间选择最优线路。


二是,有效应急突发事件。通过互联网 Internet 实时获取运输路段的突发事件,如果前方路段出现大雪、大雾、山体滑坡、交通阻塞、道路劫匪等状况,可以提前切换至备用线路。①避开交通阻塞路段,减少生鲜货物因长时间堵车而造成的价值衰减。②避免驶入因突发事件造成的无法通行路段,减少迂回折返。③及时避开劫匪横行路段,降低货物盗失概率。


以上分析中涉及互联网因素,可以理解为互联网提升物流效率,而提升物流效率又促进人口城镇化率,即(OUrbanization/ol,n)(Jl,/oInternet)>0。


但是,本文关心的不是"物流效率是不是互联网影响城镇化的中介变量",而是"互联网是不是物流效率影响城镇化的调节变量"。不妨将式(12)所表示的中间投入品均衡想象成多个时间、多个空间的市场均衡,那么在多个时空的市场均衡下,必然存在多个物流效率头寸(即实际物流效率与代表性物流效率之差)。如果没有互联网的交互式通信,则意味着这多个头寸并不能被发货方和收货方及时掌握并有效调整生产,进而会削弱物流效率对城镇化的促进作用。如果存在互联网的交互式通信,则发货方和收货方就能及时掌握头寸并迅速调整生产,达到正向调节物流效率对城镇化的作用,即a(OUrbanization/ol)oInternet= o2Urbanization/olä,oInternet>0,再结合定理1,可得

定理 2∶"互联网+"强化了交通物流对人口城镇化的正影响。


2.5 理论逻辑分析


定理1指出,物流效率的提升,可以促进城镇化。其经济学逻辑可简略地由图1给出。在图1中,城市需求线向右下方倾斜,农村供给线向右上方倾斜, OB 为物流效率提升之前的价格,OB,为物流效率提升之后的价格。随着物流效率的提升,运输成本由 AB降低为 AB,,对应着货物运输损耗由 CD 降低为 C,D,。不难发现,农村部门对中间投入品的生产由 CB 降低为 C,B,,而中间投入品生产的减少意味着农村劳动者的减少。与此同时,输送至城市部门的中间投入品由 BD 增加为 B,D,而中间投入品输送的增加意味着城市部门对最终商品的生产有所增加,最终商品生产的增加意味着城市劳动者的增加。也就是,物流效率的提升,降低了农村总人口m,n,,提高了城市总人口m,n,。需要说明的是,由式(3)、式(8)可知,交通物流并不会影响代表性农村和代表性城市的人口规模①,这意味着物流效率的提升主要通过减少农村数量、增加城市数量来促进城镇化发展①。在现实中,表现为近郊农村②转化为中心城市的卫星城(例如,撤县设市),孤岛城市单独发展转变为城市群共同发展。


需要特别说明的是,人口通常随着产业迁移,而产业随着人口迁移的情况相对较少。③ 作为上游产业的农村部门和作为下游产业的城市部门,两者之间的产业比例在动态一般均衡框架下确定,然后按照确定后的产业比例进行劳动力配置④。这里隐含了一个假设,即劳动力在城乡之间的物理流动⑤是无摩擦的。但是,这个隐含假设是可以放宽的。虽然本文的交通物流主要聚焦货物运输(即中间投入品的运输),但也同样适用于人口运输(即劳动力流动转移)。这是因为交通条件的改善也可以加速劳动力流动转移,从而迅速实现劳动力与产业的合理匹配。⑥



定理 2中,"互联网+"强化交通物流对人口城镇化的正影响,其中的关键原因在于互联网的交互式通信。


3 实证计量


本文的被解释变量为人口城镇化,核心解释变量为物流效率、"互联网+"。在数据方面,国家级数据最为合适,其原因为∶①如果选择中国省级(或市级)数据,则定理1和定理2的陈述对象为省内(或市内)人口城镇化,而跨省(或跨市)人口流动①将会对省内(或市内)人口城镇化产生很大干扰。反观国家级数据,由于不同的国家存在文化、语言以及边境等限制.所以跨国移民人口比例将远低于中国跨省(跨市、跨县)流动人口比例,这意味着国家级数据更为合理。2"两新一重"为国家级政策.并非地方试点政策。因此.从政策的执行层面来看,国家级数据更为合理。③)本文核心解释变量中包含互联网,考虑到很多国家在本国国境设置防火墙(比如,中国、美国、韩国、朝鲜、印度尼西亚、伊朗等),而在国内各级行政区较少设置防火墙,这意味着互联网在国家之间具有较好的区域分割,防火墙的存在使得国家级数据更为合理。总之,在综合考量各类数据优劣之后,本文认为国家级 数据最为理想。本文 数据主要来源于世界银行 2020 年5月公布的 World Development Indicators(WDI)②以及世界各大组织机构。


3.1 变量选择


被解释变量∶人口城镇化率(urbanization)。其计算公式为∶城镇人口/总人口。数据来源∶联合国人口署(United Nations Population Division)。由于世界人口城镇化率为各个国家人口城镇化率的加权平均,所以人口基数越大的国家,其代表性越强。本文拟采用各国人口作权重进行加权计量回归。与此同时,本文理论模型中的城镇化研究主要是指区域内部的城镇化,这意味着国与国之间的跨区域货物流动、人口流动等因素将会对本文研究有所干扰。为了降低这类干扰,本文将赋予跨区域流 动较多的国家更低的权重。权重计算的详细步骤为∶第一步,选取各国人口 pop,作为初始权重;第二步,计算各国进出口总额占 GDP 的比重 imex.;第三步,利用前两步所得参数,计算世界各国的修正参数为-imex; imexmaxweight,=pop;×--imeXmim imex.wmax不难发现,该权重综合考量了人口总量及对外依存度。


核心解释变量∶物流效率(traffic),在国际各大组织机构的公开数据中,关于物流效率的直接指标几乎不可得,所以需要额外构造一个可以反映物流效率的间接指标。众所周知,物流主要指货运,而非客运。目前,国际最通用的货运指标为货物周转量(Turnover of Freight Traffic),该指标是货物重量与运距乘积的加总,通常被简化为"货物总重量×平均运距"。其中,第一项"货物总重量"不能反映物流效率;第二项"平均运距"可以逆向反映物流效率。很显然,对交通物流的统筹优化,必然涉及对物流线路的整体调整,致使"平均运距"不断缩小。为了消除"货物总重量"的干扰,本文使用不变价的购买力平价(Purchasing Power Parity,PPP)GDP①作货物周转量的除数,这是因为货物总重量与购买力平价 GDP 之比通常较为稳定。前者反映商品在物流环节中的全部汇总,后者以一价定律反映商品生产的最终汇总(比如,将 GDP 全部转化为面包重量)。货物周转量)最终,可得物流效率为 trfi = 1;-每工,注意,货物周转量购买力平价 GDP在处理不同的交通工具时,采用更贴近现实的相加形式而非相乘形式,主要是因为现实中存在多种交通工具联合运输的情况。数据来源∶国际铁路联盟(International Union of Railways,UIC)、国际民用航空组织(International Civil Aviation Organization,ICAO)、世界银行。根据定理1,本文预期物流效率的回归系数为正。


核心解释变量∶互联网(internet),本文选用互联网覆盖率作代理变量。数据来源;国际电信联盟(International Telecommunication Union,ITU)。对于该指标,如果用户在3个月内使用电脑、手机、PDA、数字电视等终端设备接入互联网,则被统计为互联网用户。


核心解释变量∶"互联网+交通物流"(interet_lntraffic),以互联网和交通物流的交互项形式引入。根据定理2,本文预期互联网与物流效率交互项的系数为正。


控制变量∶①技术创新(patent),本文选择人均专利申请量作代理变量,其计算公式为∶本国居民专利申请量/总人口,数据来源;世界银行、世界知识产权组织(World Intellectual Property Organization,WIPO)。②"互联网+技术创新"(internet_lnpatent),以互联网和技术创新的交互项形式引入。③人口密度(pdensity),其计算公式为∶总人口/土地面积,数据来源;联合国粮农组织、世界银行。④人口流动(passenger),其计算公式为∶旅客周转量/总人口,数据来源;国际铁路联盟、国际民用航空组织、世界银行。⑤金融便利(finance),其计算公式为∶ATM 数量/土地 面积,数据来 源∶世界 银 行、国 际货 币基金 组 织(International Monetary Fund,IMF)、联合国粮农组 织(Food and Agriculture Organization of the United Nations,FAO)。⑥移动电话(cellphone),即蜂窝通信覆盖率,数据来源∶世界银行、国际电 信联盟。该指标主要 涵盖 移动蜂窝(Mobile-cellular)形式的公共交换电话网络(PSTN)语音通话服务,但不包括数据流量服务。需要说明的是,如果一部双卡双待的移动电话开通了两个账户(两个 SIM卡),则计数为二。与 internet的宽带不同,cellphone 的窄带传输速度较慢,用户通常只需支付较低的费用即可开通语音通话服务。⑦年份因子变量(i.year),用于捕捉时间固定效应对计量回归的影响。注意,本文以正体前缀"i."表示因子变量。


工具变量∶研发密度(rd)。本文选用研发密度 rd作技术创新 patent的工具变量(IV),数据来源;联合国教科文组织(United Nations Educational,Scientific and Cultural Organization,UNESCO)。研发密度,是指研究开发费用占 GDP的比重。本文并未选用研发密度作技术创新的代理变量,其原因为∶研发只能代表技术创新的潜力,还未转化为生产力,只能间接影响经济社会发展;而专利代表当前技术创新水平,直接影响经济社会发展。


最终,本文有效样本量为 637,覆盖 73个国家,其中不乏中国、美国、日本、韩国、德国、法国、英国、印度、俄罗斯、澳大利亚等重要国家。表 1为变量统计信息,并作加权处理。



在正式计量回归之前,本文对所有变量进行了以下处理∶①变量对数化。对呈现指数变化趋势的变量取对数,这类变量包括 patent、traffic、pdensity、 passenger、finance、cellphone,并约定以正体前缀"In"表示对数化;对百分比变量不作对数化处理,这类变量包括 urbanization、rd。②变量去中心化。中心既可以指统计学含义的中心(比如,变量的加权均值、加权中位数),也可以指现实社会中的某个参照系(比如,以世界平均水平或以中国作参照)。在基准计量模型中,本文采用世界平均水平作参照,以有效时间序列的平均值①作逻辑中心。


3.2 交互项讨论


本文 的交互项 internet_Intraffic、internet_lnpatent 中含有对数 化变 量 lntraffic、lnpatent,如果不进行去中心化处理,则对数化变量的缩放会影响 internet的系数显著性。为了方便理解,不妨以 internet_lntraffic 为例,把非去中心化的计量模型压缩简化为


(5)


如果式(15)中变量 traffic 的单位发生变化,不失一般性,假设 traffic 的单位由国际常用的"十亿"改为中国常用的"亿",那么 traffic的数值扩大为原来的 10倍,代入式(15)可得



对比式(15)、式(16)中 internet 的系数,可以得到一个一般性结论;当交叉项中含有对数化变量时,如果不进行特别处理,那么对数化变量的缩放就会影响另一个变量的系数显著性,甚至完全改变系数符号。另一方面,对照式( 15),可 以构造一个去中心化的计量模型


(17)


观察式(17),不难发现∶当交叉项中含有对数化变量时,如果进行去中心化处理,那么对数化变量的缩放不会影响另一个变量的系数显著性。这是因为两个对数化变量的相减运算.等于两个对数 化变 量的真数 先相除再取对数.这 意味着对数化变量的缩放被完全抵消。因此,去中心化可以有效避免"利用单位①来操控解释变量的系数显著性"之嫌①。


对去中心化式(17)进行计量回归,则 intemet-internet 的系数为 β, lntraffic-Intraffic 的系数为β,交互项的系数为β..。进一步整理(17)式,还可得



直接对比非去中心化的式(15)和去中心化的式(18),不难发现∶internet 的系数 α=β-βIntraffic,lntraffic 的系数α,=β,-β..intemet,交互项的系数αx=β。很明显,去中心化影响了internet、lntraffic的系数,但不影响交互项的系数。


需要说明的是,为了压缩符号,在后续计量回归中,本文直接采用 internet、 Intraffic;、lnpatent。分别表 示各自的 离差形式 internet-internet、Intraffic,- lntraffic、Inpatent;-Inpatent。


3.3 计量回归结果


利用以上对数化处理及中心化处理的数据,本文采用层层推进的方式展示计量回归结果,详见表2。在该表中,所有模型均采用稳健方差,均以世界平均水平作参照,均考虑时间固定效应。其中,模型(4)为基准计量模型。这些计量模型的区别在于∶模型(1)为加权普通最小二乘法(OLS);模型(2)为固定效应(FE);模型(3)为加权固定效应;模型(4)为加权工具变量法(IV)。



在模型(3)中,针对"所有个体固定效应均为零"的零假设,其F统计量的p值为0.000,说明 FE 优于 OLS。这是因为FE考虑了不同国家的异质性,而 OLS未考虑不同国家的异质性。


样本代表性问题。通过控制权重,可以有效解决样本代表性 问题。一方面,世界各国并非对等个体。如果在计量回归时将加勒比海、大洋洲、欧洲等地区的小国与中国、印度、美国、日本等大国平等处理,那么回归结果将会被扭曲,甚至这些小国城镇化发展的特殊规律可以完全抵消大国城镇化发展的一般规律。另一方面,世界各国的对外依存度也不尽相同。例如,日本和越南两国的人口均在1亿人左右,但越南的对外依存度(2018 年 208.31%)远远高于日本(2018 年 36.64%),如果在计量回归时将两国平等处理,那么回归结果必然会被扭曲。这是因为越南的城镇化是越南重度参与全球产业分工的结果,它已经不能反映越南作为独立经济体的城镇化发展规律,而日本虽然也处在全球分工系统之中,但日本的对外依存度并不高,意味着日本的城镇化在某种程度上可以反映日本作为独立经济体的城镇化发展规律。也就是,相比于日本等较低对外依存度国家,需要将越南等较高对外依存度国家的权重调得更低。在客观数据方面,通过对比考虑权重的模型(3)与未考虑权重的模型(2),可以发现∶模型(3)的组内 R²(0.9214)大幅高于模型(2)的组内 R²(0.6374),意味着加权方法优于普通方法。甚至,未考虑权重的模型还会严重扭曲计量回归结果。例如,在模型(2)中,Intaffic、internet_lnpatent 的系数不仅不显著,而且还为负①。


内生性问题。如果存在内生变量,那么普通回归方法将难以满足一致性基本要求。不仅这个内生变量的估计系数有偏,而且外生变量的估计系数也可能会受影响。如果外生变量与这个内生变量相关,则外生变量的估计系数也会有偏。就目前来看,绝大多数文献(甚至是权威期刊中的文献)没有考虑"内生控制变量对核心解释变量的有偏性影响",这些文献似乎只关心核心解释变量的内生性解决方案,而对控制变量的内生性置之不理,有意无意地忽略内生控制变量对核心解释变量的有偏性影响,或者直接先验性假设所有的控制变量都是外生变量,又或者直接先验性假设所有的控制变量与所有的解释变量之间两两不相关。


出于学科建设的科学性和学术研究的严谨性②,本文并不只局限于核心解释变量的内生性问题,本文将要检验的是每一个核心解释变量、每一个控制变量的内生性,并针对每一个内生变量给出解决方案。本文对内生性的解决方案为;系统性地增、减、变更若干控制变量组合,以消除若干核心解释变量的内生性,并针对控制变量组合内的每一个控制变量的内生性作自检。如此往复,一直到内生核心解释变量的数量降到可控范围并且满足每一个控制变量均为外生变量为止。在该方案下,本文利用控制变量组合(Inpatent、intemet_lnpatent、 L1.Inpdensity③,lnpassenger,Infinance,Incellphone,i. year)解决核心解释变量 lntraffic、internet、intermet_lntraffic 的内生性问题。


需要特别强调的是,本文关心的不是"控制变量的回归系数是否显著不为零",而是每一个控制变量都必须是外生变量①,以及这个控制变量组合可以有效减少内生关键变量的数量。虽然本文解决了核心解释变量的内生性问题,但本文选取的控制变量 lnpatent、internet_lnpatent 却存在内生性问题。由于交互项 internet_lnpatent 中 intemet 的内生性已经得到有效解决,所以只需要解决 lnpatent 的内生性,本文选取拟选取 rd作 lnpatent 的工具变量。具体到操作层面,选取 rd、L1.Inpatent 作 lnpatent 的工具变量,选取交互项 intemet_rd、 L1.internet_lnpatent作 intemet_lnpatent 的工具变量。表2中的模型(4)为IV基准计量模型,本文进一步将模型(4)的完整计量回归结果呈现于表 3。其中,表 3左侧为第一阶段回归,分别以内生控制变量 lnpatent 和内生交互项控制变量 internet_lnpatent 作被解释变量;表 3右侧为最终回归,以 urbanization 作被解释变量。



在表 3中,对于核心解释变量 lntraffic、internet、internet_Intraffic 以及每一个控制变量、工具变量,其 C 统计量的p值均大于 10%,意味着 lntraffic、intemet、 internet_Intraffic 以及所有的控制变量、工具变量均为外生变量。对于变量组(Inpatent,internet_lnpatent),其内生 检验统计量的 p值为 0.0005,意味 着(Inpatent,internet_lnpatent)为内生变量组①。在表 3的第一阶段回归中,每一个工具变量的系数均显著不为零,意味着所有的工具变量均满足相关性。每一个工具变量的冗余检验(Breusch et al.,199),其统计量p值均小于1%,意味着所有的工具变量都不是弱工具变量。


与此同时,不可识别检验的 Kleibergen-Paap rk LM 统计量(Kleibergen and Paap,2006)p值为 0.0000,说明工具变量组合②可识别。弱工具变量检验的 Kleibergen-Paap rk Wald F统计量(Kleibergen and Paap,2006)为 112.919,对于名义显著性水平为5%的检验,其真实显著性水平远远低于 10%,说明不存在弱工具变量。过度识别检验的 HansenJ统计量p值为0.1179,说明工具变量组合满足过度 识别。


3.4 计量分析及金砖五国比较


模型(4)以世界平均水平为参照系,旨在考察各个变量取值世界平均水平时,其对人口城镇化的影响。如果模型(4)的估计结果符合定理1和定理 2 所述,那么可以证明定理1和定理 2 具有一般性规律。更进一步,由于金砖五国在世界经济舞台中的作用愈发重要,所以本文还试图研究金砖五国在人口城镇化方面的差异性。对于金砖五国,可以分别选择中国、巴,西、俄 罗斯,印度。南非五国作参照系,进行五次计量回归,得到五组估计系数。


需要说明的是,由于本文计量模型的特殊性,即使采用同一套数据,通过选择不同的参照系,也能得到不同参照系下不尽相同的计量估计结果,其原因如下。


不失一般性,以交通物流对人 口城镇化的影响为例。将式(17)对lntraffic求导,可得



当 internet=internet 时,ourbanization/olntraffic=β。也就是,β,恰好可以表示某个参照系下lntraffic 对 urbanization 的边际效应。参照系既可以为世界平均水平,也可以分别为中国、巴西、俄罗斯、印度、南非等国家①。


当 intemet ≠ internet 时,不妨假设 internet 为世界平 均 水平取 值,那么 ourbanization/创lntraffic =β.+βx,(internet-intemet世界子均水平)。如果 internet 分别为中国、巴西、俄罗斯、印度、南非五国取值时,那么可以得到五个urbanization/ olntraffic 取值。也就是,只需要利用模型(4)的估计系数,就可以"直接计算"五个国家交通物流对人口城镇化的不同影响。但是,这种"直接计算"方法并不可取。原因如下;一是,"直接计算"不如另选参照系重新估计精确。这是因为传统计量为均值估计,其变量的估计系数在均值附近最为精确。虽然模型(4)的系数估计值在世界平均水平附近最精确,但在中国、巴西、俄罗斯、印度或南非等取值下并不一定是最精确的。为了获得金砖五国的最精确估计,则需要分别以中国、巴西、俄罗斯、印度、南非为参照系,重新进行五次回归。二是,"直接计算"难以获得金砖五国变量系数的显著性。为了获得金砖五国变量系数的显著性,则同样需要重新进行五次回归。


鉴于以上逻辑,本文在基准计量模型(4)的基础上,分别又以金砖五国作参照系分别进行五次计量回归。其中,模型(5)~模型(9)分别以中国、巴西、俄罗斯、印度、南非为参照系,详见表 4。根据前文式(18)的分析可知;参照系的改变会以大概率显著改变核心解释变量 intemet、Intraffic 以及控制变量lnpatent 的系数,但不会显著改变交互项 internet_lntraffic和 internet_lnpatent 的系数。横向对比模型(4)~模型(9),可以发现交互项 internet_Intraffic、internet_Inpatent的系数确实没有发生显著变化②。与此同时,通过核心解释变量 internet、lntraffc系数的显著变化可以直接分析金砖五国的异质性。其原因为∶在前面的式(17)中,当研究的国家正好为参照系时,如果只变动 lntraffic 而保持其他变量不变,那么交互项的作用完全可忽略(因为交互项取值几乎等于零),这意味 lntraffic的系数可以反映 lntraffic 对参照系国家的全部边际作用。这相当于剔除交互项后直接对计量模型进行回归。同样,internet 的系数也反映了各自对参照系国家的全部边际作用。



在表4中,物流效率 lntraffic 的系数全部显著为正,与城镇化理论模型中的定理1一致,意味着物流效率的改善确实促进了城镇化发展。这与当今现实基本吻合,即使在更为久远的历史,物流效率也正 向影响着城镇化。比如,在没有互联网的前两次工业革命时期,交通物流工具由蒸汽机进化为内燃机、电动机,引发物流效率极大提升,并伴随着人类进化史上第一次大规模城镇化。对比模型(4)~模型(9)可知∶以中国 2004—2018年的发展情况为参照系,交通物流对中国城镇化发展的总促进作用略高于世界平均水平,并在金砖五国中排第三。虽然中国的物流效率在金砖五国中几乎是最高的①,但在金砖五国中其对城镇化的促进作用并不突出。本文猜测其原因可能为∶中国的某些特殊因素使得物流效率对城镇化的促进作用大打折扣。比如,户籍制度、宅基地制度、客运发达等。需要说明的是,客运不属于物流范畴,物流专指货运。虽然物流和客运属于不同概念,但两者具有一定相关性。户籍制度使得部分农民工进城后的市民身份得不到有效承认,宅基地制度使得部分农民工不会轻易放弃原来的农民身份,而中国发达的客运又使得中国农民工找到了一种"钟摆式"的生活方式作为权衡。发达的物流(货运)促使农民工从农村向城市不断聚集,从事最终产品生产,但发达的客运又促使部分农民工选择了居住在靠近工作地的城乡结合部地带作过渡。


互联网 internet 的系数全部显著为非负。其中,在世界平均水平。中国,俄罗斯参照系下,internet 的系数显著为正;在巴西、印度、南非参照系下,internet的系数不显著不为零。事实上,本文并不关注不同参照系下 internet 的系数符号,本文更关注不同参照系下 internet 的系数排序。对比模型(4)~~模型(9)可知·以中国2004—2018 年的发展情况为参照系,互联网对中国城镇化发展的总促进作用虽然略低于世界平均水平,但在金砖五国中排第一。中国在金砖五国中的互联网作用最高,这和现实情况基本一致。中国目前在互联网应用方面走在世界前列,比如移动支付、共享单车、线上外卖、电商平台等。然而,为什么金砖五国低于世界平均水平,本文猜测其原因可能为∶互联网为全球性公共物品。金砖五国作为领土大国和新兴经济体,其在经济快速发展中组建了广阔的互联网骨于网(Backbone Network),这些骨于网不仅仅服务金砖五国用户,还可能服务全球任何一个接入互联网的他国用户。比如,东南亚 A 国用户通过互联网与东南亚 B 国用户进行通信时,其信息必然经过多个路由节点(即互联网的存储转发分组交换技术),而这些路由节点很可能在金砖五国境内。也就是,其他国家的互联网用户相当于免费乘车者,使用了金砖五国的网络节点。需要说明的是,互联网的路由并不遵循最短传输线路原 则,而是遵循最短传输时间原则。由于信息在光纤中以近乎光速不断反射前进,所以信息在光纤中的传输时间可忽略不计,真正影响传输时长的是多次存储转发的时延、多次中继的时延等。即使A国、B国用户的物理距离可能不到 500 公里,但信息在互联网中的路由线路很可能比地球的赤道还长。


"互联网+交通物流"internet_lntraffic 的系数在模型(4)~模型(9)之间无显著差异,并且显著为正。由于物流效率lntraffic 的系数也显著为正,所以互联网确实强化了交通物流对城镇化的促进作用,该结论与城镇化理论模型中的定理 2 基本一致。针对如何提高"互联网+"在各个领域的调节作用.本 文认 为主 要遵循两个原则∶一是提高互联网的渗透率。倘若互联网在该领域的渗透率几乎为零,那么纵使互联网与该领域指标的乘积再大,互联网也不会与该领域发生实质性的交互作用。二是该领域自身必须充分发展。否则,"互联网+"会加速该领域的衰落。在"互联网+"时代,颠覆某个领域的,可能不是同行,而是跨界。例如,打败康师傅方便面的,不是统一,而是线上美团外卖;颠覆金融业的,不是传统银行,而是支付宝 、微信;迫使苏宁转型的不是国美,而是京东电商∶让山寨手机绝迹的,不是同行小作坊,更不是法律法规,而是小米等线上手机。因此,中国必须抓住"互联网+"这一历史机遇。


4 稳健性检验


本文的稳健性检验主要包括∶替换估计方法,缺失值处理,极端值处理,内生性问题等。需要说明的是,所有的稳健性检验都是在基准计量模型(4)的基础上进行的。


4.1 替换估计方法


在表 5 中,模型(10)将模型(4)的 LIML 法替换为 GMM2S(Two-step Feasible GMM Estimation)法,但 GMM2S 法有一个劣势∶在存在弱工具变量时, GMM2S 不如 LIML 稳健(Stock and Yogo,2005)。不难发现,除了 internet_ lntraffic 系数的p值提高为0.074 以外,其他核心解释变量的系数在 1%的水平上均显著不为零。模型(11)将模型(4)的 LIML 法替换为 CUE(Continuously- updated GMMestimation)法,CUE 法可以有效处理异方差和自相关扰动问题(Hansen et al.,1996)。不难发现,除 internet_lntraffic系数的p值提高为0.031以外,其他核心解释变量的系数均在 1%的水平上显著不为零。也就是,即使对估计方法进行替代,核心解释变量的回归系数仍然较为稳健。



4.2 缺失值处理


针对缺失值,本文主要采用线性内插和几何内插的方法填充。其中,对呈现指数变化趋势的变量采用几何内插,对普通变量采用线性内插。在表 5中,模型(12)已对缺失值进行内插填充。不难发现,模型(12)的观测值由模型(4)的 514提高到711之后,每一个核心解释变量的系数在1%的水平上均显著不为零。也就是,扩充样本量后,核心解释变量的回归系数仍然稳健。


4.3 极端值处理


针对极端值,本文主要采用分位数归并的方法处理。在表5中,模型(13)将小于等于 5%o分位数的数据归并为 5‰分位数,将大于等于 995‰分位数的归并替换为 995%o。不难发现,模型(13)对模型(4)的极端观测值进行归并后,除了 internet_lntraffic 系数的p值提高为0.030 以外,其他核心解释变量的系数在 1%的水平上均显著不为零。也就是,对极端值进行归并处理后,核心解释变量的回归系数仍然稳健。 


4.4 内生性问题


表2至表5中的模型(4)~模型(13)全部为工具变量法。由于考虑了内生性问题,所以这些模型的回归结果可信度较高,主要体现为∶在模型(4)~模型(13)中,所有工具变量在 10%的显著性水平上均不能拒绝其与随机扰动项正 交,即工具变量满足外生性;第一阶段回归中的所有工具变量的系数在 5%的显著性水平上均为非零,即工具变量满足相关性;所有工具变量在 5%的显著性水平上均拒绝其为冗余变量,即工具变量并非弱工具变量。对于工具变量组的不可识别检验,每个模型均为可识别;对于工具变量组的弱工具变量检验,每个模型均不存在弱工具变量;对于工具变量组的过度识别检验,每个模型均为过度识别。总而言之,工具变量法的前提条件均满足。也就是,在不同类型的工具变量法下,核心解释变量的回归系数仍然稳健。


5 结语


为了全面透彻地剖析城镇化发展一般规律中"互联网+"、交通物流与城镇化的关系,同时也为政策制定者提供"两新一重"政策的理论支撑,本文构建城镇化发展基准理论模型,在动态一般均衡框架下重点研究交通物流、"互联网+交通物流"对人口城镇化的影响。在理论部分,本文研究发现∶物流效率的提升可以促进人口城镇化,并且"互联网+"强化交通物流对人口城镇化的正影响。在实证部分,本文利用 2004—2018年73 个国家的面板数据,进行加权 LIML工具变量法实证检验,其回归结果十分稳健,表明本文构建的理论模型反映了世界各国城镇化发展的一般规律。此外,通过分别选取金砖五国作参照系,研究发现∶在金砖五国之中,中国交通物流对城镇化发展的总促进作用排第三,而中国互联网对城镇化发展的总促进作用排第一。

参考文献


▼往期精彩回顾

访谈录| 白重恩教授经济学研究经验分享(附视频)

刘玲玲谈“十四五”与区域经济协调发展之生产力空间布局的革命(下)

刘玲玲谈“十四五”与区域经济协调发展之生产力空间布局的革命(中)

“十四五”与区域经济协调发展之生产力空间布局的革命(上)

洪银兴谈新发展阶段经济学的理论创新和十大改变

访谈录|李子奈老师谈计量经济学应用研究

戴蕙阳,施新政等:劳动力流动与企业创新

《经济学报》入选《中文社会科学引文(CSSCI)来源期刊(2021-2022)

【目录】《经济学报》2021年1期目

近期《经济学报》相关经济学论坛汇总

清华经管学院举办“新时代经济管理学科建设论坛” | 37周年院庆

朱玉杰,张上冉:不同发审机制下的承销商声誉与债券融资成本

陈启斐,王双徐:发展服务业能否改善空气质量?来自低碳试点城市的证据

徐远华,孙早:中国工业加速创新的机制

管汉晖:中国的工业化:过去与现在(1887-2017)

扫码关注我们
积跬步、至千里,经济学与您携手启程


或点击下方原文链接  查看PDF全文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存