查看原文
其他

面向国土空间规划编制的多源人口大数据模型研究

崔学森,张鸿辉等 中国国土空间规划 2022-07-26

本文作者

崔学森,广东国地规划科技股份有限公司大数据中心高级大数据工程师

张鸿辉,广东国地规划科技股份有限公司副总裁、广东省智慧空间规划工程技术研究中心主任、教授级高级工程师

洪良,广东国地规划科技股份有限公司大数据中心技术总监、高级规划师


导读

在国家大数据战略与新一轮国土空间规划编制等工作的背景下,大数据从数据支撑、分析方法、决策支持等方面为新一轮的国土空间规划编制提供了新的解决方案。其中,人口底数往往对一个地区的经济产业发展具有举足轻重的影响,人口流动监测在空间要素配置、公共应急预警等方面扮演重要角色,人口规模与特征则是城镇体系规划、产业空间布局规划及职住平衡分析的基础工作。利用传统的调查手段获取的人口基数与流动情况不仅耗资巨大,且难以支撑精细化的人口分布、人口结构与人群活动等分析。本文通过总结相关空间规划项目中人口模型的研究经验,融合传统人口数据、手机信令与互联网位置服务数据等多种人口大数据,设计并实现了多空间尺度与多分析角度的人口评估大数据模型,以辅助国土空间规划编制业务。

01

数据支撑与技术路线

 1.1 

数据支撑

手机信令数据

       手机信令数据是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录同一用户信令轨迹所产生,最后经过脱密、脱敏、扩样等处理后可用于居民行为偏好、移动轨迹分析、城镇空间布局等研究。手机信令数据具有样本量大、时空连续性、更新速度快、与自然人关联等优点,是用于研究城市居民行为与空间分布较好的数据源。

手机信令数据捕获方式

互联网位置服务数据

       互联网位置服务数据主要来源于百度、高德、腾讯等地图开放平台,基于GPS、基站和WiFi共现信息实时获取用户海量时空定位大数据,具有精度高、覆盖广、更新快的特点,是研究人口画像、人口流动、职住关系、交通流动的较好数据源。

互联网位置服务数据采集模式

数据对比

       综合分析手机信令、互联网位置服务数据与统计年鉴的数据特点,从指标种类、数据精度。空间范围、数据准确性、更新频率、数据可视化六个维度进行对比分析。其中手机信令数据从定位精度、数据范围、准确性与更新频率表现更佳,互联网地图厂商从指标种类与数据可视化能力更加突出。

数据对比分析

 1.2 

技术路线

       基于手机信令数据、互联网位置服务数据、统计年鉴的多源人口大数据,在经过脱密脱敏、坐标转换、格式转换等数据预处理后,针对不同类型人口专题模型分析的需要,结合特征识别、时间序列分析等大数据分析模型进行计算,最后得到人群画像、人口结构等多种视角的分析结果,将结果进行对比分析,为区域、城市空间布局与发展战略提供决策依据。

技术路线图


02

多源人口大数据模型的设计

 2.1 

特征识别

       基于手机信令的大样本数据,运用Hadoop分布式集群构建海量数据特征提取算法,识别出手机用户在一定范围内的驻留行为,结合驻留行为发生的时间,筛选出用户的职住地、休闲地或兴趣区域。

手机信令特征识别核心内容

 2.2 

时间序列分析

       基于一段时间的人口动态数据应具备一定的平稳时序变化规律,例如一天周期内的商务集中区应在工作时间达到人口数量峰值,在下班休息时间达到人口数量低谷,形成以日为周期的潮汐现象。针对不同区域构成多组时间序列样本,通过建立ARMA模型(自移动平均回归模型),并计算自相关系数(ACF)与偏自相关系数(PACF),可用于预测短期且平稳的区域人口变化情况。

时间序列分析流程图

 2.3 

聚合分析

       人口分布与人口流动目的地的空间位置一般具有一定的集聚分布或随机分布规律,在数据量巨大而且不进行抽稀、去项等操作的情况下,难以得出比较直观的分析结果。采用大数据点聚合分析方法,在分析区域内进行大量点要素的聚合分析,得到区域内聚合中心及其属性的总和、最小最大值、方差、标准差、平均值等统计数据。

人口分布聚合分析示意图


03

多源人口大数据模型的实现

       基于多源人口大数据模型中的基本算法与人口评估的具体需求,以下对城市的人口规模、人口结构、职住平衡、人口潮汐、人口流动、旅游分析、产业分析、公共服务分析八个方面进行了模型实现与分析。

 3.1 

人口规模

       根据人口标签的基本定义和手机信令特征识别方法,识别工作日工作时间频繁出现在某一地点的工作人口,识别晚上休息时间长时间在某一地点驻留的居住人口,识别包括常住人口和3天以上、半年以下短期驻留人口总和为实际服务人口。本研究基于手机信令构建人口规模评估大数据模型,汇总统计了多个城市的工作人口、居住人口和实际服务人口规模(如下图所示)。

工作人口

居住人口

实际服务人口

 3.2 

人口结构

       人口结构主要包括人口性别、人口年龄、人口学历、人口就业、人口收入等方面,不同人口结构的模型构建思路基本一致,本研究选取某市的人口年龄结构为研究对象,分析结果如下图所示。综合分析各区域人口年龄结构发现,该城市19-24岁人口占比最大,属于比较年轻化的城市,而60岁以上人口超过区域总人口10%的区域占11/14,根据国际标准来判定具有一定的老龄化风险。

人口年龄结构(单位:%)

 3.3 

职住平衡

       城市内部普遍存在一定的职住分离现象,在识别手机用户工作地与居住地归属的基础上,统计城市内部各镇街间的发生职住通勤OD人口数量,分析职住分离规律。以某市为例,根据行政区性质将城市分为8个区域,从人口密度来看位于城市中心的B、C区域人口分布最密集,而在城东西两侧A、E、H区域与市中心区域的职住联系度最高,并在核心区形成了比较明显的人口集聚现象。

       利用职住比模型测量区域职住关系,其计算公式如下:

       Pe是研究单元就业人口数,∑Pt是研究区总就业人数,Le是研究单元居住人口数,∑Lt是研究区总居住人数。一般认为,职住比指数JHR在0.8-1.2的地区属于人口居住-就业平衡区;JHR大于1.2说明该地区就业岗位数大于区域需就业人口数,属于就业导入型;JHR小于0.8说明该地区就业岗位数小于区域需就业人口数,属于就业导出型。

       本研究综合手机信令和互联网位置服务数据,从镇街空间尺度展开分析,该研究区仅有3个镇属于就业导入型,11个镇为就业导出型,其余为就业平衡型,因此可基本判断研究区职住情况偏向于就业导出型。

 3.4 

人口潮汐

       基于手机信令的人口分布数据,以小时为时间变量,以一天为分析周期,并在网格尺度聚合采集的信令点数量,分析区域内人口潮汐变化规律,形成统计分析结果。

城市人口分布

       选择城市五个典型区域进行时间序列分析,其中B区域与D区域出现了一定程度的工作时间“涨潮”现象,即9:00-18:00出现信令数量增长,早晚两极出现信令数量回落现象,而该区域是商务办公区比较集中的城区,是工作人口相对集中区域,而其余三个区域则表现比较平稳,推断出A、C、E区域是职住分布相对比较平衡的区域。

 3.5 

人口流动

       统计各市之间一个月跨市出行的人流量,并根据以下公式得出各城市对外日均人流联系量:

       上式中:Ni 表示 i 城市对外日均人流联系量(万人次/天)的指标结果值,Oi 表示以 i 城市为出发地的OD记录,j 表示第j 条OD记录,T表示统计天数。

       从研究区分析结果可知,城市间人口流通量最高的五条城际OD线路中,有四条线路是A市及其相邻的四个城市,还有一个OD是G市与H市之间形成,说明A市的吸引力较高,在研究区的人口辐射能力较强。

 3.6 

旅游分析

       以地级市为基本统计单元,提取手机用户号码归属地不属于本市的用户,将用户的信令数据的驻留行为(在某个基站范围停留超过30分钟)与出行行为(在某个基站范围停留不超过30分钟)结合,形成连续的人口流动OD,分析十一黄金周八天假ABCD四个热门旅游城市的流入人口分布地及流入数量。

A市                                                B市

C市                                               D市

黄金周旅游人口流入量

      通过汇总统计分析四个城市的游客来源地发现,国庆黄金周到达四个城市的流入地Top10城市分布以相邻的东侧城市为主,总流入量均超过20万人次,其次为北侧距离较远的几个城市,而旅游地以A市与B市最受欢迎,日均游客访问量都超过30万人次。

(Oi代表游客来源地,A-D代表目的地)

 3.7 

产业分析

       为了分析各类产业就业状况,对工商企业进行地址解析后,叠加手机信令数据提取的工作人口空间分布与区域内各类企业数量,计算各类产业就业人口。

 3.8 

公共服务分析

       以手机信令和POI数据为核心数据,分文教体卫四种公共服务设施展开分析。各类设施分析方法类似,以教育设施的小学为例,根据我国《城市公共服务设施规划标准》,当千人学位数为60-80个,小学的规模为36个班时,每所小学的服务人口为27000人。统计各个镇街行政区现有某类教育设施数量,计算现有某类教育设施的服务人口,将某类教育设施的服务人口与根据手机信令数据提取得到镇街行政区实际服务人口之差,即为某类教育设施供需缺口。


04

系统应用集成

       结合多源大数据在人口评估的各项应用,集成到国土空间规划“一张图”实施监督信息系统中对动态监测、及时预警和定期评估的分析模型中,并实现指标模型管理和灵活配置,为国土空间规划编制、实施、监测、评估、预警等提供模型计算支撑。

系统应用集成


05

结论与展望

       在城市精细化治理与空间大数据应用的背景下,包括运营商、互联网公司、APP采集商、定位服务应用等反映人口行为特征的多源大数据未来将与空间规划、城市管理、消费购物等领域深度融合,以数据+算力+算法+可视化展示构建各种行业应用。除了运营商与互联网平台的人口大数据以外,包括POI数据、移动APP数据、旅游平台数据等基于位置的多源大数据也可在旅游客源标签分析、综合交通体系运行、城市功能区识别等应用方向发挥作用,而在2020年春节爆发的新冠病毒疫情防控中,手机信令、互联网实时大数据等方法也可应用于人口活动轨迹、重点人群流向实时、快速、精准的监测。

  The end








您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存