查看原文
其他

基于多源数据的中国人口时空变化及流动格局

地理信息世界 慧天地 2022-07-16

点击图片上方蓝色字体“慧天地”即可订阅

章转载自微信公众号地理信息世界GeomaticsWorld,作者:宋崴,赵莹,关可汗,版权归原作者及刊载媒体所有。


【作者信息】

,赵莹,关可汗

长春市规划编制研究中心,吉林 长春130000


【摘要】本文利用不同年份统计年鉴数据,通过人口密度、增速、洛伦兹曲线、尼基系数等指标计算方法对全国人口流动迁移趋势和分布均衡性变化特征进行分析。利用2020年春运返乡期间百度迁徙数据,基于网络中心性、联系强度、首位流以及K-壳分解算法分析人口流动空间分布格局。结果表明中国人口不均衡趋势越来越显著,中小型城市人口逐渐向区域中心级城市转移。华中地区形成多个人口流失集聚区,广东省和浙江省人口吸引能力最强。全国共形成20个城市群,其中京津冀、长三角、珠三角和成渝城市群内部人口流动联系最为紧密。

【关键词】时空变化;均衡性;迁徙数据;流动格局;城市群

【中图分类号】P425.8

【文献标识码】A

【文章编号】1672-1586(2021)05-0100-06


引文格式:宋 崴,赵 莹,关可汗.基于多源数据的中国人口时空变化及流动格局[J].地理信息世界,2021,28(5):100-105.



引  言


中国不同区域自然地理条件存在巨大的差异,对人口分布格局产生着重大的影响。同时,随着改革开放进程不断加快,区域不均衡发展差距拉大,劳动力就业结构经历了深刻的变动,人口也处于不断变迁的状态,导致全国人口分布差异性和流动人口规模显著扩大。规模巨大的流动人口及其空间集疏过程,对我国城镇体系、城乡结构及社会经济格局具有重大影响。因此,人口时空变化分布研究以及精准及时地掌握人口流动的空间特征与规模结构,为解决城市发展中的区域空间布局优化、城市功能定位和资源配置等问题提供研究依据。


利用传统的统计年鉴等普查数据计算人口规模结构特征指标能够从时空变化上分析人口的变迁特征。但由于数据具有特定的时间截面效果,并且统计口径多为户籍人口,与实际的常住人口及流动情况有所差异,无法体现区域间人口流向性特征和相互作用关系。随着大数据时代的到来,海量人口位置信息的收集使得基于个体粒度的时空移动轨迹获取成为可能。GPS、LBS、手机信令分析等技术的发展为人口分布聚集、短距离出行活动及城际迁徙等人口时空行为提供了大量、高精度的实测数据支撑,在人口流动格局特征观测等方面具有突出的作用。同时,网络分析为人口流动研究提供了一种新的视角,卡斯特尔(Castells)和泰勒(Taylor)等相继提出了“流空间”“中心流”理论。若将城市视为网络中的节点,那么人口的迁移量即为网络节点间流要素载体。借助复杂网络中的指标方法来评测人口流动网络,进而分析人口迁徙格局。本文选用不同年份中国城市及各省统计年鉴,同时补充2020年春运返乡期间百度迁徙及网络导航数据,开展全国人口时空变化特征以及中国城市人口网络联系格局分析,为人口流动与城市网络研究以及区域城镇体系规划提供新的研究视角、思路与科学参考。


 数据源


全国人口时空变化分析主要利用中国城市、各省的统计年鉴数据。选取 2006、2011和2018年中国城市统计年鉴以获得2005、2010和2017年全国各市的人口统计数据。将其进行空间化处理,由于中国城市统计年鉴只包含两百多的主要城市数据,因此需要查找缺失地区的省份统计年鉴以进行补充。动态人口流动格局分析主要利用百度迁徙数据。百度迁徙基于LBS定位服务技术、通过手机定位信息映射用户行为轨迹,塑造出人口流动过程中产生的起止城市、路径流强度。春运返乡期间的人口迁徙数据能了解务工人群的家乡归属地分布情况,侧面反映全国各省市人口流失及吸引能力。本研究选取2020年除夕之前的春运返乡阶段,即1月10日至23日,抓取这期间不间断的逐日、地级行政区划之间人口流动数据,共2.46亿人次的跨城出行。另外,抓取全国城市间高德导航数据最短驾车距离以代替传统两点间直线距离。


研究方法


洛伦兹曲线


20 世纪初美国经济学家M.O. 洛伦兹(Max Otto Lorenz)提出了LORENZ曲线,是一种利用人口累计百分比和收入累计百分比数据生成曲线而形成的一种直观表达国民收入与分配平均程度的图示方法。将人口数据按收入的低高顺序进行分组,以人口累积百分比作为横轴,收入累积百分比作为纵轴,将数据展绘到笛卡尔平面直角坐标系中,即形成需要的洛伦兹曲线(图1)。当Lorenz曲线为直线OL时,即通过原点的45°线,表示人口累计百分比等于收入累计百分比,收入分配达到完全平等的状态。而当Lorenz曲线为折线ONL时,表示收入分配达到完全不平等态势。


图 1 洛伦兹曲线

Fig.1 Lorenz curve


尼基系数


意大利统计学家基尼(GINI)根据洛伦兹曲线的特性,将它指数化并命名为基尼系数,它是定量描述洛伦兹曲线常用的方法。其数值是洛伦兹曲线图中绝对均匀线与曲线之间的面积和绝对均匀线与绝对不均匀线之间的面积之比,值域为[0,1]。如果所描述的现象均匀分布,则G=0,如果绝对不均匀则G=1。人口分布越是趋向均衡,洛伦兹曲线的弧度越小,尼基系数也越小,反之人口分布越是趋向不均衡,洛伦兹曲线的弧度越大,尼基系数也越大。基尼系数的大小定量地反映了所描述现象的均衡程度,计算公式为:



公式 (1) 是利用定积分的定义将对洛伦兹曲线的积分分成n个等高梯形,并计算其面积之和得到的。其中Wi为各城市对应的人口累加百分比。


网络中心性


点度中心性是衡量城市网络中某一城市对其他城市的影响力和控制力,对于一个有向型城市网络,一个节点存在内向程度中心性(入度,Ii)和外向程度中心性(出度,Oi) 两个中心性指标。两者之差则为该节点的净流入量,计算公式如下:



式中,Tji为节点j指向i的关系量,即为其他城市流入某城市的人口输入量;Tij为节点i指向j的关系量,即为某城市流向其他城市的人口输出量;k为节点数量,即城市个数。


K- 壳分解


城市群的识别是新型城镇化发展中的一项基础性任务,对于区域政策制定、经济社会调控具有重要意义。在网络联系中城市群具有更加显著的作用与功能。K-壳分解算法便提供了一种识别网络中心节点的手段,是一个层层递进、删除次要节点的过程。通过逐层剥离,剔除小于特定值的网络连接边,从而简化网络,最终获得关联强度较高的组团节点,作为城市群。又由于城市群不仅需要内部具有足够大的联系强度,同时各城市须在空间上邻近,如果两城市距离过远,即便两者间有很强的关联性,也不能划分为同一城市群。因此,选取基于距离阻尼的K-壳分解算法来提取城市群。各城市间的关联量比上网络导航距离,距离越远,阻力值越大,对两城市之间人口流动总量折损越多,进而通过城市之间的加权迁徙强度来提取城市群。


研究成果


全国人口时空特征


2005和2017年中国城市人口密度分布情况如图2所示。总体来看,中国人口密度在胡焕庸线两侧有着明显的差异,西侧人口分布极为稀疏,密度基本均低于50人/km²,而密度超过400人/km²的城市均分布于东侧。2005年人口密度超过800人/km²的城市还较少,仅零散分布于郑州、武汉、南京、上海、广州等城市。随着中国总人口的增加,2017年中国人口密度超过800人/km²的面积明显增大,主要在华北平原和长三角区域出现聚集和连片效果。同时在川渝地区和珠三角区域人口密度也有所提升。但另一方面,随着总人口数量的提升,人口密度低于50人/km²的区域面积却由524.6万km²增长至 533.5万km²,说明人口分布呈现出不均衡发展的趋势。


图 2 不同年份中国人口密度分布

Fig.2 Population density distribution of China in different years


利用各城市人口规模增长速度指标分析全国人口变化的空间差异性。2005―2010年,由于城市发展差异还不显著,人口流动性也相对较弱,人口年均变化率空间差异性并不明显,有40.9%的城市人口增长率超过11‰,仅有5.5%的城市人口规模表现为负增长。但在2010―2017年,人口增长率超过11‰的城市数量明显减少,仅剩全国城市的12.7%。其空间分布除了西部还存在连片的效果外,东部均零散分布,并且多位于北京、西安、成都、贵阳、长沙、杭州、苏州、广州等发展快速的城市,人口增速极化效果愈加显著。而表现为负增长的城市则增加至29.3%,空间上多在人口高速增长的城市周边形成一些中小城市的聚集效果,这主要由于发达城市的虹吸作用效果所致。同时,值得注意的是,整个东北三省区域,除了沈阳和大连还保持着较低的正增长效果外,其他所有城市均为负增长,属于全国人口减少的突出集中区域(图3)。


图 3 不同年份中国人口增速分布

Fig.3 Distribution of China's population growth in different periods


在研究人口空间分布均匀性问题上,按照Lorenz曲线的基本计算原则,分别计算中国城市面积累积百分比和人口数量累积百分比,得到人口和面积Lorenz曲线分布特性的数量关系。2005、2010和2017年,人口和面积的分布基本符合二八定律原则,约20.01%、 20.15%、20.08%的人口分布在76.24%、76.46%、76.86%的国土面积上,不均衡性明显。为分析人口不均衡性的变化情况,利用尼基系数进一步定量计算。计算 2005、2010和2017年中国人口分布尼基系数分别为0.708、 0.711和0.716。2005年人口尼基系数已超过0.7,属于人口分布极不均衡的状态。而近十多年中尼基系数仍不断增大,并且年均增长速度在加快,人口分布不均衡趋势愈加显著。


 全国人口流动规模特征


全国城市的网络中心性结果如图4所示。计算春运返乡期间各城市日均人口出度,前5位迁出城市中有3个均位于广东省,分别为深圳市、广州市以及东莞市,北京和上海则排在第三和第五位。同时前20位迁出城市中广东省城市占6个,流动人口吸纳能力远高于其他省份或直辖市。从各城市人口出度的空间分布上来看,东部沿海城市日均人口迁出量差异不大,发展比较均衡,一体化效果比较明显。而西部和内陆地区城市迁出人口等级差异较大,多为一个等级较高的区域中心城市需要带动周边其他较多体量等级很小的城市,迁出人口等级差异明显。


从各城市人口出入度的空间分布上来看,川渝地区属于中国春运返乡期间的人口流入重点区域。相对于迁出城市而言迁入人口等级高的城市有向内陆转变的趋势。由于全国城市的人口出度、入度总量持平,但入度排名前位城市的迁入人口明显少于出度排名前位城市的迁出人口,说明中小城市的人口迁入数量明显提升,空间分布较为均匀。人口迁出表现为局部区域聚集特性,而人口迁入则较为均衡,说明人口发展更趋向于个别经济繁荣的城市,春节返回家乡的中小城市。


从各城市人口净流入量的空间分布上来看(图5),人口净流入量小于-1万人的城市基本均为各省省会城市及直辖市,并且省会城市与周边城市反差效果较为明显。而北京、天津、西安、郑州、成都、武汉、长沙、昆明以及长三角、珠三角等城市人口净流出更为显著,超过5万人。人口净流入超过1万人的城市基本均分布于胡焕庸线以东的华中区域。其中,在重庆周边、郑州与长三角之间、长沙与珠三角之间形成了几处人口净流入高值聚集区,超过日均4万人。胡焕庸线以西和东北地区人口的净流入量基本小于±1万人,人口流动性相对较小。


Fig.5 Daily net migration of population in China's cities


全国人口流动联系特征


省际人口迁徙活动分为无向流动和有向流动两种(图6)。其中,无向流动统计任意两省间的往来人口之和。人口省际关联总体呈现南高北低、东高西低的空间差异特征。其中,流动规模前10位的关联省份包括广东-广西、广东-湖南、北京-河北、江苏-安徽、江苏-上海、四川-重庆、安徽-浙江、广东-江西、江西-浙江以及广东-湖北。整体人口迁徙网络形成 4大组团,主要聚集区分布于京津冀、长江中下游、长三角以及成渝地区。但长江中下游省份间的关联性较为均衡,而南部仅以广东省为中心与周边省份有强关联性,具有显著的单向主导吸引力。


图 6 省际人口流动联系

Fig.6 Inter-provincial population mobility links


春运返乡期间的人口省际有向流动中,分别选取人口流入省份为出发地,人口流出省份为目的地进行统计,以发现人口流失省份的人口去向。空间上看,东南沿海和京津冀地区人口流量最大,并以其为出发地向内陆及东北流动。从首位流来看,广东、福建、浙江、上海、江苏、北京、天津以及辽宁等典型人口流入省份的春运首位人口流出省份分别指向广西、江西、安徽、江苏、安徽、河北、河北以及吉林省,说明人口迁徙有明显的距离效应。上海并没有直接吸引人口流失大省的人口,首位吸引的人口来自同为人口流入省份江苏,说明长三角区域具有边缘 - 中心 - 核心的双层关联结构,这可能由于上海人口落户限制、生活成本高等原因所致。对于河南、安徽、江西、湖南、广西5个显著的人口流失大省而言,其春运迁入首位流分别是浙江、江苏、广东、广东、广东,说明广东对南部省份的吸引力极强。


编写代码抓取网络导航数据获取任意两城市之间的行车最短距离,然后计算两城市往返人口总量与平均距离之商得到加权迁徙强度,进而利用 K- 壳分解算法进行逐层简化,结果如图7所示,共20个城市群。结果与“十三五”规划中提及的19个城市群基本一致,其中长江中游城市群目前划分成较为独立的长株潭城市群和武汉城市群。2018年国家提出关于建立更加有效的区域协调发展新机制的意见,提出建立以中心城市引领城市群发展、城市群带动区域发展的新模式。通过人口迁徙大数据分析结果看,目前全国已基本形成区域式的多城市群分布状态。其中,京津冀、长三角、珠三角以及成渝城市群内部城市相互联系更为紧密。


图 7 城市群划分

Fig.7 Division of urban agglomerations

 

结束语


本文利用不同年份全国城市和各省份统计年鉴数据,对全国人口时空变化特征进行分析,揭示了近20年全国人口流动迁移趋势和人口均衡性变化情况。利用2020年春运返乡期间全国城市百度迁徙数据以及高德导航数据等网络大数据,获得具有指向性的人口流动信息和城市间空间距离,对空间人口流动联系结构进行分析。得到如下结论:在2010―2017年全国人口不均衡性分布发展趋势愈加明显,年均增速超过11‰的区域仅分布于北京、西安、成都、贵阳、长沙、杭州、苏州、广州等个别发达城市,而负增长城市由2005―2010年的5.5%增长至29.3%;在全国的人口流动性上,广东省和浙江省属于人口吸引能力最强的两个省份,安徽、河南属于人口流失减少最多的两个省份;各省中多为省会城市吸引力最强,但广东深圳、东莞,江苏苏州、无锡,福建厦门、泉州,山东青岛以及河北廊坊吸引力则超过其省会城市广州、南京、福州、济南和石家庄;全国人口无向迁徙网络主要形成四大组团,聚集区分布于京津冀、长江中下游、长三角以及成渝地区。


作者简介:宋崴(1978—),男,吉林长春人,高级工程师,学士,主要从事城乡规划及空间数据分析


E-mail:277091622@qq.com





内容转载、商务活动、投稿等合作请联系

微信号:huitiandi321

邮箱:geomaticshtd@163.com

往期精彩推荐

精准定位 科学布防 测绘地理信息助力天津亮剑“奥密克戎”

专访中国地理信息产业协会会长李维森:自立自强,开创产业高质量发展新局面

测绘地理信息青年科学家沙龙分享 | 龚健雅院士圆桌对话




《慧天地》敬告

《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界融合趋势,探索企业核心竞争力,传播测绘地理信息文化,为测绘、地信、遥感等相关专业的同学提供日常学习、考研就业一站式服务,旨在打造政产学研用精准对接的平台。《慧天地》高度重视版权,对于原创、委托发布的稿件,会烦请作者、委托方亲自审核通过后才正式推发;对于来自网站、期刊、书籍、微博、微信公众号等媒介的稿件,会在作者栏或者文章开头显著标明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的优质作品,转载时如出现侵权,请后台留言,我们会及时删除。感谢大家一直以来对《慧天地》的关注和支持!


——《慧天地》运营团队

编辑:王轲 审核:张自轩
指导:万剑华教授

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存