聚焦︱基于用户画像数据探寻杭州常住人口增长特征
The following article is from 百度地图慧眼 Author 同济大学&慧眼
导读
近年来,杭州迎来了常住人口快速增长期。本文通过时空大数据,揭示了杭州市中心区边缘区常住人口集聚现象背后的人群社会属性变化特征,并指出:基于时空大数据所进行的城市常住人口特征识别与统计将极大促进对城市常住居民构成特征的动态认知,有助于解读城市发展政策、地区产业结构、劳动力市场需求等社会经济因素对城市人口动态变化的影响程度。
本文旨在基于前序文章“杭州常住人口究竟有多少?——基于时空大数据测算结果的比较与讨论”中基于时空大数据跟踪测度城市常住人口变化趋势的基本思路,进一步探讨杭州常住人口的变化特征。在延续杭州市常住人口规模激增现象的讨论基础上,笔者利用百度慧眼数据的用户画像功能,进一步揭示杭州市中心区边缘区常住人口集聚现象背后的人群社会属性变化特征。通过与2017、2018两个年度杭州市统计局所发布的人口数据公报的横向比较,从常住居民的受教育水平、消费水平、从业类型等社会经济属性视角,解读杭州区县、街道两级空间统计单元下的人口用户画像数据。
分析结果再一次论证了杭州常住人口近期所呈现的激增现象,其中,中心城区边缘区内相对高学历、高消费人群的增长特征最为显著。同时,中心城区还存在特定从业人口规模的减少趋势,这应与地区产业职能的更替发展息息相关。笔者认为百度慧眼用户画像数据有助于从常住居民的社会经济属性视角,揭示城市产业职能的空间分布及其演化发展特征。
1、针对两个年度百度慧眼数据进行质量检验
笔者基于百度慧眼所统计归纳的2017、2018两个年度的杭州人口数据,以及杭州市统计局公布数据的横向比较,尝试探讨杭州常住人口增加特征及其背后的社会经济影响因素。本研究使用的两个年度数据,均以统计公布数据的11月1日标准时间点进行常住人口规模统计,即统计公布数据与百度慧眼数据针对2017、2018两年度的人口统计时间段一致。
在进行两组数据源的数据分析前,首先进行了针对百度慧眼数据的质量检验。通过百度慧眼数据原始设备识别数(即百度慧眼直接识别的六个月以上常住人口)相较于公布调查数据的常住人口识别率可以发现(如表1):
表1 2017与2018两个年度,百度慧眼原始设备识别数相对于统计公布数据中常住人口的数据识别率(单位:万人)
2017、2018年百度慧眼数据的原始设备数识别率保持总体一致。其中,2018年全市总体识别率相较于2017略有增长,且杭州中心城区边缘区的余杭、滨江、江干、萧山四区识别率较高,均不同程度超过了当年统计公布数据的100%以上。此外,位于杭州远郊的淳安、建德、临安、桐庐四县市识别率较低,远低于全市总体识别率水平。
通过对2017、2018两个年度两组数据源的识别率比较,可以初步判断:
1)百度慧眼数据对两个年度常住人口规模的识别总量基本符合公布统计数据所调查获得的各区人口分布特征,百度慧眼数据的常住人口识别量在空间分布上符合杭州常住人口空间分布的一般规律,该数据可以作为下一步继续深化分析的基础;
2)百度慧眼数据原始设备数的识别率在中心城区边缘区均超过100%以上,则其扩样后的常住人口数将大大超过公布调查数据结果。可以初步判断,杭州中心城区边缘区的实际常住人口应当高于同时期统计公布数据的调查结果。
2、杭州常住人口增长幅度或远超公布统计数据规模,且各区县常住人口的增长趋势不一致
通过比较2017、2018两个年度间的各区县常住人口变化总量可以发现:基于统计公布数据的人口增长总量为33.8万人,其中下城、上城两区为人口负增长区县,余杭、萧山、江干、滨江依次为人口增长最为显著地区(如表2)。
表2 基于杭州市统计局公布数据的2017、2018两个年度常住人口变化情况比较-增长幅度由小到大排列(单位:万人)
与此不同,基于百度慧眼数据原始设备识别数的人口增长总量为44.5万人,其中仅下城区为人口负增长区县,人口增幅最大的几个区县则与公布统计数据结果不同,依次为余杭、萧山、富阳、临安(如表3)。
表3 基于百度慧眼数据的2017、2018两个年度常住人口变化情况比较(单位:万人)
两组数据源对杭州各区县人口的统计存在两个方面的差异:
其一,是2017至2018年末总人口增长规模的差异。基于百度慧眼原始设备识别数的统计结果,杭州常住人口的增量即已达到了44.5万人。考虑到还需进行数据扩样,则推算的全样本人口增长规模将至少超过60万人,远高于公布统计数据所提供的人口增长规模。
其二,是2017至2018年末杭州各区县人口增长规模的差异。基于百度慧眼数据的统计结果,杭州常住人口不仅在中心城区边缘区,如余杭、萧山等区发生显著的人口增长现象。同时在城市近郊区的富阳、临安等区也存在常住人口显著增长现象,这与统计公布数据所呈现的结果存在显著差异(如图1)。
图1 依托两种数据源比较杭州各区县常住人口的增长规模(橙色为百度慧眼数据、蓝色为公布统计数据)
一言以蔽之,杭州常住人口近年的快速增长现象已无争议。当下不仅需关注常住人口的增长规模如何,而更需关注人口增长的特征如何、以及出现激增的主导因素为何。为了进一步揭示杭州常住人口的增长特点,及其增长人口的社会经济特征,笔者采用了百度慧眼的用户画像功能,将常住人口的相关属性(受教育水平、消费水平、行业特征等)也纳入到了分析之中,以获得对杭州全域人口增长特征更全面的认知与解读。
1、以受教育水平指标解读常住人口的空间分布变化情况
通过百度慧眼画像数据对常住居民受教育水平的识别分类可以初步获知,本科及以上学历的常住居民人口规模在江干、西湖、下城、萧山、余杭五区发生了较为显著的变化(如图2)。
图2 2018、2018杭州各区县中本科以上学历人口的合计百分比
其中,位于中心城区边缘区的余杭、萧山两区本科及以上常住居民的人口总量占比显著提高,这反映了在杭州常住居民快速增长过程中,相对高学历人群在以上两区的快速集聚现象。与此相反,江干、西湖、下城三区的本科及以上学历居民规模占比下降。
此外,高中及以下学历的常住居民人口规模在江干、西湖、下城、余杭四区呈现相对显著的变化(如图3)。
图3 2017、2018杭州各区县中高中及以下学历人口的合计百分比
其中,江干、西湖、下城三区的高中及以下学历居民规模占比明显下降,仅余杭区高中及以下学历居民的人口总量占比显著提升,这反映了相对低学历人口规模在杭州中心城区、部分中心城边缘区的减小。
以常住居民的受教育水平指标解读常住人口增长特征可以发现:杭州相对低学历居民的人口规模变化较小,而相对高学历居民的人口规模变化较大,且相对高学历居民常住人口的增长主要集中在中心城区边缘区的余杭、萧山地区,这也是近两年杭州常住人口增长最为主要的地区。
2、以消费水平指标解读常住人口的空间分布变化情况
通过百度慧眼画像数据对常住居民消费水平的识别分类可以初步获知,高消费水平的常住居民人口规模在下城、余杭两区发生了较为显著的变化(如图4)。
图4 2017、2018杭州各区县中高消费水平人口的合计百分比
其中,位于中心城区边缘区的余杭区高消费水平居民的人口总量占比显著提高,这也反映了在杭州常住居民快速增长过程中,高消费水平人群在余杭区的快速集聚现象。
与此相反,下城区的高消费水平居民规模占比明显下降。此外,低消费水平的常住居民人口规模在江干、西湖、下城、余杭四区呈现相对显著的变化(如图5)。
图5 2017、2018杭州各区县中消费水平人口的合计百分比
其中,江干、西湖、下城三区的低消费水平居民规模占比明显下降,仅余杭区低消费水平居民的人口总量占比提升。
以常住居民的消费水平指标解读常住人口增长特征可以发现:低消费水平居民的规模占比变化特征与相对低学历人群的变化特征保持一致,而高消费水平居民的规模占比变化特征与相对高学历人群的变化特征也具有较高的相似性。
3、在近年杭州常住居民人口的激增现象中,增长人口更具有高学历、高消费水平特征
通过前述的比较分析可以初步推断,低学历-低受教育水平常住居民的人口增加幅度较小,而高学历-高受教育水平常住居民的人口增加幅度更为明显,两类人群在空间分布上的变化特征也不尽相同。相较于各区统计单元下人口变化的百分比指标比较,将人口变化特征呈现在杭州街道、镇一级空间单元上,受教育水平与消费水平的变化关联性将更为直观(如图6-图9)。
对于杭州中心城区边缘区而言,高学历、高消费水平人群增长现象最为显著,新增常住居民中的相对高学历人群主要集聚在这一区域。相对地,低学历、低消费水平人群的增长不仅仅存在于中心城区边缘区,在位于城市郊区的核心街道、镇区,亦呈现低学历、低消费水平特征居民的人口规模增长。
此外,低学历、低消费人群在杭州城市中心区、部分中心城区边缘区存在明显人口规模减少,导致这一现象的因素应当是多方面的,笔者推测杭州劳动力市场与行业就业需求的演化或为影响常住人口增长特征的重要因素,即近年来杭州常住人口增长中的“高-高”、“低-低”组合特征受到产业结构发展态势的影响作用巨大。
1、杭州各区县从事不同行业类型的常住居民人口规模变化情况
以街道、镇级空间统计单元看,在近年杭州全局常住居民人口快速增长的大趋势下,依然存在局部地区常住居民人口的逆增长。可见对当前的杭州而言,不仅存在外来就业人口的大量迁入现象,或许还存在少部分既有居民的流失、迁出现象。为了进一步讨论局部地区街道、镇常住人口变化特征与居民从事行业特征可能存在的关联性,笔者再次利用百度慧眼数据的用户画像功能,对杭州2017、2018两年间从事不同行业类型的常住居民人口规模进行了比较分析。
2017年末至2018年末的一年间,杭州具有从事高端服务业、高端制造业特征的常住居民人口呈现显著增长趋势,而具有从事传统制造业特征的常住居民人口呈现减少趋势(如图10)。
图10 基于百度数据的杭州2017至2018个行业从业人口规模总体变化情况
金融保险业作为高端服务业的代表性行业之一,其从业人口从增加总人口的占比规模上看应占比最高,相反作为传统制造业代表的纺织服装业,其从业人口规模应处在逐步减少的趋势中,这或许反映了杭州城市产业结构的进一步演进与升级,导致不同等级行业类型的从业人口规模发生了显著转化。从人口规模变化的现象上看,便是高端服务业、高端制造业从业居民的大量流入,与之对应的是传统制造业、低端制造业从业居民的逐步消失。
2、从业人口增长最多与最少的行业——金融保险&纺织服装
将人口增长特征的解读聚焦在最具代表性的行业类型上看,百度慧眼数据所识别出具有金融保险业从业特征的常住居民,其人口的显著增长主要位于杭州中心城区边缘区的余杭、萧山、江干、西湖等地区(如图11)。
图11 两年间从事金融保险业常住居民的人口变化规模
所识别出具有纺织服装业从业特征的常住居民,其人口的减少则主要位于杭州中心城区、中心城区边缘区的下城、江干、萧山、西湖等区(如图12)。
图12 两年间从事纺织服装业常住居民的人口变化规模
再次以街道、镇级空间统计单元的简单横向比较,金融保险业从业人口在空间分布上的变化特征与高学历、高消费水平人口在空间分布上的变化特征较为统一,而纺织服装从业人口在空间分布上的变化特征则与低学历、低消费水平人口在空间分布上的变化特征相一致(如图13、14)。
由此,可以初步推测在杭州近年的人口快速增长中,更多定居杭州的居民具有相对高学历、高消费水平、从事高端服务业与高端制造业特征。相反地,具有相对低学历、低消费水平、从事传统制造业的外来居民,其增长势头并不显著,且在杭州局部地区呈现人口规模减少趋势。
1、杭州常住人口存在显著的激增现象,统计公布数据所反映的增长情况与实际人口增长规模或存在一定差距。
通过百度慧眼数据、公布统计数据两组独立数据源对杭州2017、2018两个年度常住人口的横向比较可知:
1)近年以来杭州常住人口的快速增长现象毋庸置疑,两组数据源共同证明了以余杭、萧山、江干、滨江等区为代表的中心城区边缘区成为了人口快速增长的空间单元;
2)两组数据源对杭州常住人口规模增长的统计结果并不统一,以百度慧眼数据原始设备数统计结果看,2017至2018年末杭州常住人口的增量或将远超公布统计结果的33.8万人;
3)两组数据源所呈现的各区常住人口增长态势不尽相同,以百度慧眼数据看常住人口不仅在中心城区边缘区存在大量增长,以富阳、临安为代表的城市郊区也存在常住居民的显著增长趋势。
笔者认为将两组独立数据源所统计的常住人口数据进行比较,两组数据结果的统一性有助于揭示并验证杭州常住人口在总量与空间上的增长态势,而其差异性则提供了进一步讨论杭州常住人口增长特征的切入点。
2、杭州人口的显著增长从全局上看应是外来就业人口快速集聚产生的结果,且外来就业人口具有一定的共性特征。以用户画像数据看,具有高学历、高消费特征、从事高端服务业、高端制造业的人口增长最为显著,而低学历、低消费特征、从事传统制造业的人口规模增长并不显著。
通过依次比较分析杭州各区(县)、街道(镇)两级空间统计单元的常住人口画像数据,以受教育水平、消费水平、从事行业特征三个指标维度对常住居民的人口增长特征进行解读可知:
1)杭州2017至2018年度常住居民人口的快速增长主体为相对高学历、高消费水平,且从事以金融保险业为代表的高端服务业或高端制造业群体,而相对低学历、低消费水平,从事以纺织服装业为代表的传统制造业群体的人口增长并不明显;
2)杭州常住居民的人口增长特征亦在空间分布上存在差异,相对高学历、高消费水平、从事高端服务业及高端制造业人群在中心城区边缘区集聚增长,而相对低学历、低消费水平、从事传统制造业人群的空间分布则相对分散,在城市郊区的核心街道、镇区中也存在一定人口规模的增长;
3)从空间分布视角看,城市人口的增长并不绝对,进行空间人口的讨论不仅要看全局更应看局部。通过从事行业类型观察城市局部地区人口规模的变化趋势,或能够将城市产业结构演替对城市常住居民未来构成特征的影响结果一窥究竟。
综上所述,关于杭州城市常住人口的讨论已从人口增长与否、增长多少转向了如何增长、增长特征的解读。基于时空大数据所进行的城市常住人口特征识别与统计将极大促进对城市常住居民构成特征的动态认知,并基于常住居民在时空维度上构成特征的变化,解读城市发展政策、地区产业结构、劳动力市场需求等社会经济因素对城市人口动态变化的影响程度。
责任编辑:林冬娜、邓小云
文章来源:百度地图慧眼