查看原文
其他

基于百度大数据的全国城市重要性评价和城镇化分区划定

百度地图慧眼 百度地图慧眼 2019-09-12

作者:马琦伟,阚长城

阚长城 百度地图资深研发工程师,马琦伟 中国城市规划设计研究院学术信息中心博士

【百度慧眼中规院联合创新实验室】是百度地图慧眼与中国城市规划设计研究院共建的联合实验室。双方发挥各自的资源、技术优势,形成一系列具有行业前瞻性、实用性的研究成果,并促进研究成果的转化与应用。双方联合研究的领域包括:城镇化发展动态监控与政策支持、城市空间诊断、评估与模拟、人工智能与城市智慧管理、城市空间决策支持与业务咨询等。

01

前言


评估城市的重要性、了解城镇化的分区发展情况,是新型城镇化发展监测中的两个重要内容。前者是评价城市发展绩效、优化城市发展定位、制订城市发展战略的基本依据,后者则是了解区域城镇化格局、精准制订城镇化分区引导策略的基础。在城镇化格局快速变化的今天,及时、可靠的掌握这两项内容,关乎我国城镇化推进的大局,意义不言而喻。

传统上我们一般通过静态的GDP、人口规模、土地规模等指标来计算上述信息,结果的时效性和准确性仍有进一步提高的空间。这是因为,城镇体系是一个各类要素时刻流动的复杂动态网络,仅仅采用静态的数据和指标难免会有“刻舟求剑”的缺憾。因此,为了捕捉瞬息万变的城镇化动态格局,规划和决策中必须引入高精度的动态数据。

百度迁徙大数据是一类典型的动态大数据,其实时性和高覆盖度保障了其能相对真实的反映我国城镇化中的内在特征。本研究使用这一数据源,主要研究了我国城镇化动态格局中的上述两个特征:城市的中心性和城镇化分区。

图 1由2017城镇短期人口迁徙数据构成的复杂网络

(流动人口规模低于500的迁徙路线不予显示)

考虑到迁徙目的的差异性,本研究将人口迁徙分为短期人口迁徙和常住人口迁徙两类。短期人口迁徙是以商务、旅游、探亲等为目的的迁徙,其外出时间一般不太长,事后仍返回原居住城市;常住人口迁徙则是以异地迁居、求学、务工等为目的的迁徙,将长时间驻留在迁徙目的地。短期人口迁徙和常住人口迁徙反映了城镇化中的不同特征,我们将分别从这两个视角出发来考察城市的中心性和城镇化分区。


02

全国各城市的中心性评价


2.1 评论方法

从网络的视角看,一个城市的中心性反映了其在整个城镇体系网络中的地位和重要性。本研究使用PageRank算法来度量城市的中心性。这一算法由谷歌公司的两位创始人佩奇 (LarryPage) 和布林 (Sergey Brin)共同提出,原用于评价网页的重要性,近年来广泛应用于复杂网络理论的各个领域。从城镇网络的角度来看,PageRank算法的思想主要有两点:

(1)如果一个城市与很多其他城市存在频繁的人口迁徙的话,说明这个城市比较重要,也就是PageRank值会相对较高。

(2)一个城市与另一个PageRank值很高的城市之间的人口迁徙强度越大,那么该城市的PageRank值会相应地提高越多。

图 2 PageRank算法示意

相比其他网络算法,PageRank算法的计算结果正符合我们对中心性的定义:中心城市应当是辐射周边大量城市,且与其它中心城市联系紧密的关键节点。因此这一算法能更准确的度量城市中心性。


2.2 基于短期常住人口迁徙的城市中心评价

使用PageRank算法,基于2017年全国短期人口流动数据,我们对全国各地级市的中心性进行计算,并根据HT-index方法将其分为5个级别。

 3基于短期人口流动的中心性排名和空间分布

同样使用这一方法,我们基于2017年常住人口流动计算中心性,结果如下:


图 4基于常住人口流动的中心性排名和空间分布

图 3与图 4的结果略有差异,但总体上都反映出如下的特征:

(1)北京、上海、成都、广州和深圳是全国人口城镇化中的关键节点。这些城市的人口吞吐量极大,且与全国各城市存在广泛的联系,使得其重要性凸显。

(2)东部地区和中西部地区的城镇化模式存在不同。东部沿海地区在人口迁徙方面呈现“带状绵延”模式,即在北京、上海、广州和深圳四极引领之下,东部沿海城市的中心性等级值普遍在2级以上,整体上形成东部地区的人口城镇化发展带;同时,中西部地区则呈现“节点带动”模式,表现为绝大部分城市的中心性比较低,而有少量城市中心性较强,成为区域城镇化增长极。

03

全国城镇化发展分区的划分与比较


3.1 划分方法

城镇体系研究中另一个重要的内容是划分城镇化发展分区。本研究认为,城镇化发展分区应当是具有独特城镇化发展模式的地理空间单位。通过将全国划分为若干个城镇化发展分区,有助于深入探讨城镇化发展路径的地域性差异,并进一步有针对性的出台、施行调控政策。

从人口迁徙的角度来看,城镇化发展分区划分的标准是:分区内部的人口迁徙密集,一体化程度高,而分区之间则相对独立。为落实这一标准,我们采用了Infomap算法。该算法以复杂网络理论和通讯理论为基础,是复杂网络社群识别的一种算法,其基本思想是寻找一种最优的社群划分方式,使用于描述整个网络结构的信息量最小。要实现这一点,Infomap的策略是使社群尽量紧密,社群之间的信息传递尽量简洁——如果我们把人口看作城市之间传递的信息,那么Infomap算法与城镇化发展分区的划分要求是较为一致的,表明这一算法可以满足研究的需要。


3.2 基于短期和常住人口迁徙的分区

使用Infomap算法,基于2017年全国短期人口流动数据,我们将全国划分为25个分区。

 5根据2017年短期人口流动计算的城镇化分区


由上图的结果,我们可发现以下特征:

(1)城镇化发展分区的边界与省行政边界基本吻合。

(2)京津冀、长三角、珠三角和成渝四大城镇群的发育程度较高,城镇化发展分区已超越行政边界,区域一体化态势比较明显。

同样的,我们使用2017年全国常住人口流动数据,将全国划分为18个城镇化发展分区,结果如下。


图 6根据2017年常住人口流动计算的城镇化分区


3.3 差异分析

从上图可以看出,基于常住人口迁徙的分区结果和基于短期人口迁徙的分区结果存在相当大的不同,这种不同是由于两种迁徙的目的和模式不同而造成的。

前文已述,短期人口迁徙以商务、旅游、探亲等为主要目的,更多反映的是各城市之间的经济社会联系强度;而受自然地形地貌对短期人口流动的自然阻隔影响,以及现阶段省级行政边界对道路交通、市政设施、公共服务设施等各项要素的配置较强的引导和限定作用,省内经济社会联系强度往往相对较大,省行政边界与基于短期人口迁徙的城镇化分区边界重合度自然也较高。

另一方面,常住人口迁徙则更多反映区域中心城市的人口吸引力,这种吸引力尽管受空间距离和地形地貌的影响,但当中心城市的就业市场规模、公共服务水平等指标远高于周边地区时,其影响力很有可能跨越行政边界。

在图 7中,我们可以看到许多在一个或数个强大的“人口磁极”吸引下,由若干省份和地区组成的城镇化分区。例如:

(1)以北京为城镇化中心的京津冀分区中,天津、河北全境各市均以北京为常住人口迁徙的主中心,形成一体化的分区。

(2)以上海-苏州为中心的长三角分区中,广泛涵盖了上海市和浙江、江苏、安徽三省的全部行政辖区,以及江西省和河南省的部分地市,充分显示了上海及周边苏州等市组成的大都市区强大的人口吸纳能力。

(3)以广州、深圳为中心的珠三角分区中,覆盖了广东、广西、湖南三省的全部行政辖区,以及江西省的部分城市,同样显示了珠三角城市群作为我国主要城镇群之一的区域带动能力。

(4)由沈阳、哈尔滨、长春三极带动的东北分区,包括了辽宁、吉林、黑龙江三省,以及内蒙古自治区的东部地区,反映东北地区大量人口向这三个中心城市不断集聚的实际情况。

(5)由成都、重庆双核带动的西南分区,覆盖了整个西藏自治区、四川省和重庆市,反映出成渝城市群在西南人口内迁中的重要地位;与之类似的是位于河西走廊东部的兰州在西部人口东迁中的枢纽作用。

 7基于常住人口迁徙的城镇化分区及城市中心性分级

04

结语

本文使用百度人口迁徙大数据,使用PageRank算法和Infomap算法,解析了我国城镇体系动态网络中的一些内在特征。

在城市的中心性评估方面,北京、上海、成都、广州和深圳五个城市是全国人口城镇化中的关键节点。在我国城镇化空间模式上,东南沿海地区的“带状绵延”模式与内陆地区的“节点带动”模式并存。

在城镇化发展分区方面,基于短期人口迁徙的分区划分和基于常住人口迁徙的分区划分结果存在较大差异。基于短期人口迁徙的分区边界与省域行政边界基本一致,反映城市经济社会联系与行政管理之间的内在联系;基于常住人口迁徙的分区边界往往由多个省市组成,可以视为区域中心城市的人口城镇化腹地。

在上述初步研究的基础上,本联合创新实验室将就城镇化的模式、动因和未来发展情景开展更加深入的研究。


数据洽谈合作请联系huiyan@baidu.com。

 



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存