城市数据实践:基于百度热力图的成都市中心城区人群活动分布特征分析
前言:本期数据实践栏目,来自城市数据研习社社员彭胤的实践案例,学号A507。作者参加了由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,以下为其参与数城工作营(点击查看)的工作成果。
基于百度热力图的成都市中心城区
人群活动分布特征分析
大家好,我叫彭胤,来自自贡市城市规划设计研究院,是一名热衷于把玩数据的城市规划师。因缘际会,于2016年12月报名加入城市数据研习社“千人计划”,觅得这个难得的学习机会。此次经历让我对数据及数据分析有了更深的认识。
近几年,大数据这个词一直萦绕耳旁。且当下中国处在向新型城镇化转型、增量发展向存量挖潜转型的关键时期;也是城市公共服务供给不足、城市运行效率低下、城市社会空间割裂等城市问题集中爆发的时期。通过对城市数据的采集和深入挖掘,规划师可以更清晰的观察和了解人的行为活动以及人的行为倾向,使得这一原本在研究中“黑箱”的过程变得透明、可观、可控,促使传统基于“空间和场所”的城市研究转向基于“人、活动与空间及其关系”的研究。
1、 百度热力图数据
百度热力图是百度在2011年新推出的一款大数据可视化产品,该产品以LBS平台手机用户地理位置数据为基础,基于智能手机使用者访问百度产品 ( 如搜索、地图、天气和音乐等 ) 时所携带的位置信息,按照位置聚类,计算各个地区内聚类的人群密度和人流速度。计算结果用不同的颜色和亮度反映人流量的空间差异(如图1所示);同时该数据具有时效性,每15min会进行一次更新。该款产品在面世之初便因其能够提供节假日景区拥挤程度,帮助用户出游决策而受到追捧;此外,作为一个基于亿级手机用户地理位置的大数据新应用,百度热力图在不同专业领域内的研究价值也在被持续地挖掘和开发。在城市规划领域,百度热力图在城市居民出行规律和城市空间使用效率等论题的研究中都可以发挥巨大作用。
图1 百度地图热力图样例
2、 研究思路
本次研究主要分为五步:
第一步:确定研究范围、研究时间,采集研究数据并按研究需求进行清理,为后续研究做好准备;
第二步:研究2016年12月25日(周日)人群活动的时间变化和空间变化规律;
第三步:研究2016年12月26日(周一)人群活动的时间变化和空间变化规律;
第四步:研究2016年12月25日和26日两天城市人口重心和高聚集度区域人口重心的分布规律;
第五步:对比分析201 39 38888 39 15232 0 0 4724 0 0:00:08 0:00:03 0:00:05 47236年12月25日和26日两日的人群活动规律,得出研究结论。
3、 研究对象及目的
3.1 研究对象
将成都市中心城区作为研究对象,主要包含金牛区、青羊区、武侯区、锦江区、成华区、高新区(包含高新西区)六个区,总面积约500km²;以2016年12月25日(周日)至12月26日(周一)两天为研究时间。
图2 研究范围示意图
3.2 研究目的
基于百度热力图带有的实时人口空间分布数据,通过对比不同时段不同区域的人口聚集情况,分析成都市中心城区的人群活动分布规律与特征。
4、 数据采集及清理
4.1 数据采集
本次研究采用的数据包括:
(1)研习社提供的12月25日与12月26日两天共50张热力图(从7点到24点以40-60分钟为采集频率);
(2)与百度地图热力图同时下载的成都市中心城区百度地图;
(3)利用LSV软件下载的成都市中心城区卫星影像图数据(WGS_1984坐标系)。
4.2 数据清理
首先,对成都市中心城区影像图进行坐标投影,将其带有的WGS_1984地理坐标转换为WGS_1984_UTM_Zone_48N投影坐标;接着,将百度地图与投影后的影像图进行地理配准,使百度地图(原坐标:百度坐标)变换到正确位置(坐标:WGS_1984_UTM_Zone_48N),并保存配准链接文件;进而,利用ArcGIS相关工具,基于配准链接文件,将所有热力图进行批量配准,得到WGS_1984_UTM_Zone_48N投影坐标系的百度热力图;最后,利用GIS的Modelbuilder模块对所有热力图进行中心城区范围裁剪、提取第四波段并重分类等操作;经过筛选得到研究分析所需要的36张热力图(如图3和图4所示)。数据清理流程(如图5所示)。
图3 周日热力图
图4 周一热力图
图5 数据清理流程图
5、 周末人群活动分布特征分析
5.1 周末人群活动的时间变化规律
基于百度热力图热力值的高低,采用自然间断点分级法,将热力值分为五类,从低到高依次为无聚集区、少聚集区、一般聚集区、轻微聚集区、聚集区。其中,轻微聚集区和聚集区在一定程度上分别代表了城市内人群较为集中的区域和高度集中的区域,它们的面积越大反映城市人群的集聚度越高,面积越小则城市人群的离散度越高。
图6 清理后的百度地图热力图数据(12/25 10时)
从面积变化堆积图(见图7)可以看出,周日人群聚集面积随时间变化大体呈现上午上升、下午至晚上平稳的趋势;在11时达到全天的峰值,13时和21时出现下午的两个峰值;24时聚集面积远大于7时。
图7 周日聚集面积变化堆积图
由此推测:7时-11时,平安夜狂欢后的成都人开始起床;11时—14时,是周末的外出出行时段,人们前往下午的“战场”(休闲娱乐目的地);14时—20时,好(hào)耍的成都人开始了新一轮的“战斗”;20时-24时,部分市民会选择回家,而会玩的城里人则转换战场开始第二轮“战斗”,并持续到深夜。
5.2 周末人群活动的空间变化规律
为了准确描述人群空间分布的特征,利用ArcGIS相关工具分别计算12月25日全天中心城区范围内的聚集度平均值和标准差。
热力图平均值能反映城市每个点的聚集程度。平均值越大,聚集的人越多,即聚集效应就越强;反之,平均值越小,聚集的人越少。
图8 12.25日热力值平均值图及高平均值区域
图9 12.25日高热力平均值区域
热力图标准差等反映每个点的聚集程度变化。在周末标准差越大,说明不同时间的人口变化较大,即点的聚集效应具有时效性;标准差越小,说明点的人流量变化较为平稳,则该点的功能相对复合。
图10 12.25日热力值标准差图及高标准差区域
图11 12.25日高热力标准差区域
结合成都现有商圈布局,综合分析发现平均值较大的区域为城市中心或各区县的区域中心,如春熙路、火车北站、西环广场等;标准差较大的区域多为专业市场、交通枢纽,如荷花池市场、火车东站片区等。
为进一步了解各时段人群活动的特点,依据前文周日人群活动时间变化规律的分析,周日人群活动时间段可以划分为07:00-11:00、11:00-14:00、 14:00-20:00、 20:00-00:00四个时间段,利用GIS工具分别计算各时间段的热力平均值,判定各时间段的人群空间分布变化。
(1)12.25日07:00-11:00时间段
图12 12.25日07:00-11:00热力平均值
人群活动主要分布的区域为西部集贸市场之首--荷花池市场,巨大的人流和物流量,导致在该区域人群聚集度较大;富人聚集区--双楠,难道真的是早起的鸟儿有虫吃吗?特色商业街--春熙路,由于该区域汇集了大量的服务行业,就业人口较多,该时间段多为服务行业从业人口聚集形成;高校聚集区--川师片区,区域内多为高校校园,区域东南侧与三圣花乡相邻,区域人群活力较强。
(2)12.25日11:00-14:00时间段
图13 12.25日11:00-14:00热力平均值
该时间段人群开始向各地区商业中心聚集,因此在前往商业中心的主要城市干道人群聚集较大。
这一时间段人群聚集点主要分布在城市主干道路周边,在荷花池、春熙路、红牌楼、西环广场、锦江万达、万年场、万象城等地区聚集人口最多;城市东部的人群聚集核多于城市西部,最大的人群聚集核为春熙路片区。
(3)12.25日14:00-20:00时间段
这一时间段为周日休闲时段,人群主要聚集在春熙路,可以看出春熙路对于成都人的重要性,但也凸显出成都的单核心问题。
图14 12.25日14:00-20:00热力平均值
(4)12.25日20:00-00:00时间段
这一时间段为夜生活开始的时段,人群主要聚集在一品天下片区、春熙路及九眼桥片区、川师片区,即市民夜生活及夜宵场地。
图15 12.25日20:00-00:00热力平均值
6、 工作日数据分析
6.1 周一人群活动的时间变化规律
从面积变化堆积图中可以看出,周一轻微聚集、聚集区域面积在7:00-8:00和10:-11:00期间的增长很快,8:00-10:00间变化相对平稳,反映出大多数人群上班起床时间在7:00-8:00之间,花费1-2小时在上班途中,9:00左右的轻微聚集和聚集区域多为城市商务办公区域。 10:00-11:00大家开始开小差(基于个人经历和观察),畅聊周末的经历,期间使用手机频率增加,聚集面积增加达到一天的峰值。
图16 周一聚集面积变化堆积图
同时在19:00-21:00间出现了一天(8:00-24:00)的低值,反映出人群大多是在19:00离开办公室并在21:00左右到家,然后在21:00-23:00洗漱准备休息。即在23:00左右的轻微聚集和聚集区域多为城市居住区。
图17 清理后的百度地图热力图数据(12/26 09时)
图18 清理后的百度地图热力图数据(12/26 23时)
6.2 周一人群活动的时间变化规律
结合前文分析,9:00左右聚集度高的区域为商务办公区,通过对热力图的识别聚集度高的区域有天府广场及春熙路片区、北站片区、省医院及光华片区、西环广场、红牌楼、桐梓林片区、孵化园片区,沿人民北路-人民南路-天府大道和蜀都大道-迎晖路形成横纵两条城市轴线。
图19 城市商务办公区空间结构图
对周一的平均值和标准差对比分析,平均值最大的区域集中在春熙路及天府广场片区,其次在孵化园片区和西环广场等地区平均值也较大,符合成都市总体规划要求的规划结构有单中心向多中心转变;标准差较大的区域主要沿城市纵轴分布,由于不同行业的上下班时间和业态布局区别,推测城市纵轴主要以IT、金融等行业为主导,城市横轴主要以传统商贸行业为主。
图20 12.26日热力值平均值图
图21 12.26日热力值标准差图
7、 人口重心变化分析
人口重心旨在借助力学概念来简明、概括地描述某地区人口的分布情况,一段时间内的人口重心移动轨迹也常被用来描述某地区人口分布随时间变化的情况。百度地图热力图的数据能够较好地展示人口疏密的空间相对关系,理论上用百度地图热力图数据计算所得的“热力重心”可以近似地替代人口重心。研究在百度地图热力图数据的基础上,借助GIS工具,绘制每天的人口重心变化情况;为判断聚集人群的流动方向,提取每个时间段的高聚集度区域(轻微聚集和聚集区域),进行人口重心计算。
图22 人口重心计算Modelbuilder模型
7.1 周末数据分析
从12.25日整体人口重心变化图可以看出,周末9:00时人口重心文化公园东门,从整日的人口重心移动来看,没有明显的规律,但总体呈现先向北移动,再向东南移动的趋势,23:00时人口重心位置到达四川省人才交流中心附近,为一天中的最南点。高聚集度人口重心变化方向则与整体人口相反,总体呈现向北移动的趋势,其中8:00-12:00和14:00-21:00的人口重心移动较小。
图23 12.25整体人口重心变化图
图24 12.25日高聚集度人口重心变化图
7.2 工作日数据分析
从12.26日整体人口重心变化图可以看出,工作日人口重心移动相对较小。7:00-9:00整体人口重心先向西北移动到最北端(四川省纺织科学研究院)后反向(东南)移动到四川省人才交流中心,为一天中的最东点。
高聚集度人口重心移动呈现先西南次东南后西北的移动趋势,其中在工作时间 (09:00-18:00)整体呈现东南移动。
图25 12.26整体人口重心变化图
图26 12.26日高聚集度人口重心变化图
8、 总结与展望
8.1 研究总结
通过将上述周末和工作日时间的数据分析结果进行比较可以发现,周末和工作日成都中心城区的人群分布和空间使用具有以下特点:
(1)无论是周末还是工作日,城市人群的分布在晚上(凌晨)远大于早上(7:00),结合高聚集度的分布区域分析,反映出成都人的夜生活是从晚上凌晨开始的(大家都有“老子明天不上班”的幻觉),也从一方面印证了成都是休闲之都,是你来了就不想走的城市。
(2)基于百度地图热力图的采集原理,被采集的手机数量在周末和工作日差别不会太大。但是工作日人群的大多聚集在“点状”区域(写字楼),单位面积的人口密度也就越大,面积也就越小;反之周末人群大多聚集在“线状”(街道)区域、“面状”(公园)区域,单位面积的人口密度越小,聚集面积也就越大。即工作日的城市聚集区域面积小于周末。
图27 城市聚集面积对比图
(3)对周末及周一的轻微聚集和聚集面积归一化处理,判断高水准聚集度的分布时段。工作日和周末聚集的最高值和最低值都分别出现在11:00和07:00。工作日人群集聚度在较高水准的时段要长于周末,周一主要集中在9:00-19:00间;周末主要集中在10:00-13:00间和21:00之后。
图28 各时刻高水准聚集度分布图
(4)将工作日与周末的人口重心移动情况进行比较,可以发现,无论是工作日还是周末,早上和晚上的人口重心位置都是比较接近的,人口重心均位于文化公园东门周边1km的范围内。由于早上大部分人都在家中,因此这个范围大致代表了成都中心城区的静态人口重心范围。随着一天中时间的推移,可以发现工作日人口重心从这个范围开始向东南移动,而周末时则正好相反,呈现向西北移动的特点,由此可以推测,成都中心城区就业岗位的分布重心比居住区分布重心更偏东南一些,而商业休闲设施的分布重心则更偏西北一些。
8.2 研究展望:
(1)研究不足之处
本次采用的周末数据为12月25日圣诞节数据,且周末和工作日只采用了一天的数据,数据的普遍性可能不高;
研究只是采用了聚集度单一因子来分析,结果可能会与实际情况不符;
(2)研究展望:
结合百度路况和poi数据综合分析人群活动特征,进而寻求方法解决局部地方周期性交通拥堵的情况;
结合研究地区的用地布局、建筑容积率、历史文化景观资源等条件分析人群活动特征,进而更加合理的规划公共服务设施;
融合PM2.5、天气数据,研究不同天气环境下人群活动特征,完善基础设施规划布局。
9、 工作营总结
非常感谢大鹏老师和小智老师课后的耐心指导和解答,以及在群里的热烈讨论,让我这个数据小白这次做了一份让自己比较满意的作业。
尽管本次成果在研究方法和对大数据的处理上存在诸多不成熟之处,但是作为自己初次运用大数据尝试进行的城市分析和探索,在完成整个成果的过程中,加深了自己对数据运用的进一步理解;通过实际运用,更助于对GIS软件及分析过程的逻辑思维养成。
希望通过不断的学习和各种尝试,在大数据技术方面收获更多,走的更远,成为一名真正的数据达人。
彭胤,已参加由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,具备城市数据综合分析能力,特此颁发认证,以资鼓励。
证书查询网址:www.caup.net/cert
往期回顾:
【优秀学员丨郭 翰】北京主城区人口聚集与街道拥堵分析
【优秀学员丨梁家俊】基于百度热力中山市中心城区结构分析
城市数据研习社是国匠城、城市数据团共同举办的持续性学习组织,社员将享受到持续更新的数据课程,免费使用的数据插件,以及社群内的交流答疑。
目前,城市数据研习社开启了“千人计划”,希望能够从规划师中首先招募1000人,作为社群的中坚力量,助推规划师个人发展。
城市数据研习社咨询群:413942566
长按识别二维码,腾讯课堂
报名加入城市数据研习社