城市数据实践:北京市主城区人口聚集与街道拥堵分析研究
前言:本期数据实践栏目,来自城市数据研习社社员郭翰的实践案例,学号A161。作者参加了由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,以下为其参与数城工作营(点击查看)的研究成果。
北京市主城区人口聚集与街道拥堵
分析研究
大家好,我是郭翰,来自北京大学。从几年前开始,一直能在杂志书刊上看到城市规划与大数据结合的相关案例,但是苦于不知道从哪方面作为切入点学习。直至九月的某一天,我成了城市数据研习社的一份子,通过研习社通俗易懂的课程和老师们的辛勤指导,让我这个数据门外汉对于GIS与数据的使用有深刻的认识,并在小智老师与大鹏老师的指导下有了此篇研究成果。本次研究主要注重分析技术的运用,分析思路方面还有很多不够严密的地方,希望各位读者不吝指教!
1. 研究目的及研究思路
1.1 研究目的
基于百度热力图与实时路况图能提取道路拥堵程度与人口聚集程度的特征,以北京市主城区为研究对象,以2016年12月23日至12月27日四天为研究时间,研究北京市不同区域与不同时间段人口聚集与街道拥堵的变化,并进一步探讨两者之间的相关关系。
2. 研究思路
本次研究主要分为六步:
第一步:确定研究范围与研究时间,进行相关数据采集与数据清理,为后序研究做好准备;
第二步:研究2016年12月23日至12月26日早上7:00至晚上24:00点北京市主城区不同时间点的街道拥堵变化,分析哪天的街道拥堵情况比较严重,并分析一天中哪些区域与哪些时段容易发生拥堵;
第三步:研究北京市主城区连续时间段的街道拥堵值的时序变化,引入时序街道拥堵指数,以12月23日为例,探讨哪个时间段是最为拥堵;
第四步:研究2016年12月23日至12月26日早上7:00至晚上24:00点北京市主城区连续时间段的人口聚集变化,按人口聚集程度分为五类并计算其面积,观察人口聚集的分布区域;
第五步:探讨人口聚集与POI数据空间分布的相关关系,观察哪类性质的POI在人口聚集区域分布最多;
第六步:对于街道拥堵情况与人口聚集情况进行比较分析,发现两者之间的规律。
2. 研究范围与研究时间
2.1 研究范围
选择北京市主城区六个行政区作为研究范围,包括东城区、西城区、朝阳区、海淀区、丰台区、石景山区。
2.2 研究时间
取2016年12月23日至12月27日四天为研究时间样本,包含12月23日(星期五)、24日与25日(圣诞节+周末)以及12月26日(星期一)。在一天中,从7点至24点,以40-50分钟为时间间隔采集百度热力图和百度路况图。
3. 街道拥堵分析
3.1 街道时间断面数据分析
3.1.1 概念解析
街道时间断面数据是指街道某一时间点的街道路况。百度路况图以颜色来表示道路的拥堵程度,颜色越红,拥堵越严重。本次研究以三种颜色(绿色、橙色、红色)来区分通畅、稍微拥堵、拥堵三种路况,并相应赋值1、3、6,以便后续研究。本次采集到路况数据的道路总长度为3251.5公里。
3.1.2 12月23日(周五)街道拥堵分析
全天拥堵街道平均公里数:1038.96
最拥堵时间:17点41分
17点41分总拥堵公里数:1481.07
17点41分拥堵公里数:774.47
17点41分稍微拥堵公里数:707.6
下班时段比上班时段更为拥堵
3.1.3 12月24日(周六)街道拥堵分析
全天拥堵街道平均公里数:931.61
拥堵高峰期时间从15点开始
最拥堵时间:17点29分
17点29分总拥堵公里数:1294.44
17点29分拥堵公里数:763.69
17点29分稍微拥堵公里数:530.75
3.1.4 12月25日街道拥堵分析
全天拥堵街道平均公里数:798.48
最拥堵时间:17点29分
17点40分 37 40593 37 15231 0 0 3597 0 0:00:11 0:00:04 0:00:07 3597总拥堵公里数:1085.823
17点40分拥堵公里数:693.40
17点40分稍微拥堵公里数: 392.42
3.1.5 12月26日街道拥堵分析
全天拥堵街道平均公里数:842.58
最拥堵时间:17点43分
17点43分总拥堵公里数:1159.07
17点43分拥堵公里数:729.88
17点43分稍微拥堵公里数:429.19
上下班颠峰时间拥堵公里数相差不大
3.1.6 四日街道拥堵路况对比分析
把四天的街道拥堵路况结果迭加到一张图上,以时段为X轴,公里数为Y轴进行分析,分析四天街道拥堵情况的相同与相异之处,如下图:
并有以下结论
整体观察,12月23日周五拥堵街道公里数最长,代表多路段拥堵;
上班巅峰时间不管是12月23日周五或是12月26日周一,拥堵情况差不多,12月26日周一在07:00-09:00时段平均总拥堵公里数甚至略高12.23日周五,符合忧郁星期一的传统概念,周一早上更堵车;
12.23日下午拥堵明显比12月26日高,能反映12.23日周五下午或许大家比较归心似箭或是出去游玩的心情,更愿意开车;
17:00-18:00时段通常是一天的堵车巅峰期,过了此巅峰期拥堵公里数就逐渐下降,不论是平常日或假日;
虽然圣诞节是12月25日,但是从图中观察,12月24日比12月25日更为拥堵,能假设比起过圣诞节,大家更喜欢过平安夜,抑或街道拥堵(尤以17:00-18:00时段)更受是否隔天放假来决定,从12月23日周五以及12月24日周六拥堵更活跃可观察之;
12月25日和12月26日从19:00之后斜率趋势大致相同,能假设受到隔天上班影响,大家顶多在外吃完饭或是下班就直接回家了;
上一点延伸,能假设受到隔日上班影响,下午巅峰时间街道拥堵公里基本数是1000公里左右,隔日不用上班出去游玩所造成拥堵数是300公里(1300-1000),周五下班开车回家又会增加其100公里拥堵左右;
到了周末,大家习惯下午出门;
白天一整天街道最为通畅时间是中午12点时段,能假设此时是吃饭时间,大家更愿意在公司周遭或住家周遭以步行能到的距离用餐。
3.2 “时序街道拥堵指数”分析
3.2.1 定义与计算方法
时序街道拥堵指数是时间断面数据的延伸。依据“通畅”、“轻微拥堵”以及“拥堵”的栅格赋值(1、3、6),以时间断面为单位进行计算以观察街道拥堵的变化。下图为12月23日 8点25分街道时间断面数据减去9点07分的变化,图中显示红色的街道代表的是从8点25分街道“通畅”变成9点07分街道“拥堵”的路段。
详细计算是8点25分的街道时间断面数据减去9点07分的数据,可能得到0,-2,-5,2,-3, 6, 3 七种值。例如-5就是1-6=-5的值,代表街道路况从畅通转为拥堵。时序街道拥堵指数利用上述计算特性,提取值为-5(1-6=-5) ,-3(3-6=-5)以及值为0 (6-6=0)的栅格,三者相加之后作为时序街道拥堵指数。
3.2.2 以12月23日为例进行分析
下图是12月23日每段时间街道路况从畅通转变为拥堵的示意图(数值为1-6=-5的栅格),从图中可以发现,17:41至18:15是街道路况最为拥堵的时段。
为了更了解每段时间拥堵的差异,引用时序街道拥堵指数计算并观察下图,可以得到结论:
12月23日17:05至17:41是街道变为拥堵的巅峰期(7.0486),符合街道拥堵公里数研究,17:00-18:00是最为拥堵时段。
时序街道拥堵指数12月23日一天的平均值是6,高峰值出现在下午时段。
拥堵变化占比是指在两街道时间断面数据进行计算之后,值为-5、-3、6-6=0的栅格数占总数的百分比,如图观察,可以发现12月23日一天的时序拥堵栅格数占比约为19.3%(也可称作变拥堵率为19.3%)。
3.3 依行政区划进行街道拥堵分析
以12月23日为例,首先按区级行政边界进行分析,发现街道最拥堵的行政区是西城区与东城区(下图中的第二张图);若是再深入探讨,以街道办事处为单位(第三张图),能观察到最拥堵的街道办事处是位于朝阳的双井街道办事处(图中橙色圆框框起之处),此街道办事处正是北京CBD所在位置。
4. 人口聚集分析
4.1 人口聚集时间断面数据
4.1.1 研究思路
人口聚集时间断面数据是指某一时间点的人口聚集情况。依据自然断裂法把人口聚集程度分为5类(无聚集、少聚集、普通、轻微聚集、聚集)。以2016年12月23号为例,下图是一天内“无聚集”、“少聚集”、“普通”、“轻微聚集”与“聚集”区域的分布情况(下图1)。提取“轻微聚集”与“聚集”地区,计算其面积平均分别为41.91和20.97平方公里(下图2)。从图中可观察到12月23日一天“轻微聚集”与“聚集” (橙色和红色)的区域,主要是沿着二环与三环,并且在CBD地区与中关村地区具有大量人口聚集。
图1: 北京市人口聚集区域分布图
图2: 北京市“轻微聚集”与“聚集”区域分布图
为了更深入了解人口聚集程度最高的“聚集”区域的人口情况,在“聚集”区域中继续提取 “严重聚集区域”和“极严重聚集区域”两个级别,以便后续和POI数据进行相关性分析。下图是严重聚集与极严重聚集区域分布,其面积分别是10.38和2.19平方公里。得到极严重人口聚集区域后,与百度地图相匹配,能发现国贸、五道口、中关村、西单商圈等区域是12月23日一天中极严重人口聚集区域。
4.1.2 人口聚集的面积
接下来,以时间断面为X轴,平方公里为Y轴,探讨 12月23日至12月27日每天北京主城区人口轻微聚集、聚集两种情况聚集面积的变化。
(1)12月23日人口聚集面积
从图中可以得到以下三点小结:
高峰值都是在上班时间,并集中在办公区域(例如国贸CBD);
中午为一低峰期,14:00点之后人口聚集面积逐渐下降(是否是因为下班原因,有待后续研究查证),直至晚餐时间开始上升;
有趣的是,到20:53-21:33,人口聚集面积又逐渐上升,认为可能是隔日是周末,有夜间娱乐活动,此时人口聚集地区也多是娱乐性质较多区域(三里屯与工体附近)。
(2)12月24日人口聚集面积
经过下图对12月24日人口聚集面积分析,能有2点小结:
从中午吃饭时间之后,人口聚集面积呈现逐渐缓降趋势;
21点46分是一天中人口聚集面积最低点,之后又呈现小幅上涨之势(但涨幅不大),与12月23日相同,这时大家都聚集在娱乐性质较高的区域开始夜生活。
(3)12月25日人口聚集面积
经过分析,可以得到四点小结:
11时33分是一天的最低点,可以解读人们早上出门之后,11时回家休息小憩一下,又出去吃饭;
16时41分如同11时33分,分别是早上与下午人口聚集面积的最低点,但明显能观察到人们更愿意在下午活动;
晚上在外吃完饭之后,就回家休息,准备明天上班;
当然,些许夜间活动也是有的,但低于12月23日与24日。
(4)12月26日人口聚集面积
一天的高峰期在早上10点,符合星期一是一周上班第一天的概念,大家努力在工作上;
下午人口聚集面积呈现锯齿状走势,其原因需要在更深入研究,整体而言,下午人口聚集面积是缓慢上升,直至17时57分的高峰期。
(5)四天的人口聚集面积比较
得到每日依不同时间段变化的人口聚集面积后,为了更直观的了解四天人口聚集面积的不同之处,整理如下图,并得到下列结论:
整体而言,12月23日白天时间呈现人口最聚集
12月26日在下午2点有一个明显低点,需要更深入研究
16:00之后,12月24日的人口聚集面积是比较高的
在20:00时,12月24日面积明显高于其他3日,解读是其他3日在外吃完晚餐后,就选择回家休息,而1224日是平安夜,更多人选择在外约会。
同样是隔日不上班,12月23日夜生活时间早12月24日夜生活时间约一小时左右,可以解读是12月23日是周五,大家更愿意以及精力出门放松与庆祝周末;12月24日的夜生活时间从21点左右开始,且聚集面积明显低于12月23日,也许是因为是平安夜,大家更愿意在家庆祝或是进行情侣之间互动。
5.2 人口聚集与POI数据空间相关性分析
5.2.1 12月23日人口严重聚集区域与POI数据分析
为了了解是什么原因造成某些区域会有极严重人口聚集,选择POI数据作为影响因素,探讨POI与极严重人口聚集区域的关系。首先,采集北京市主城区依不同性质分类的POI数据,并与12月23日极严重人口聚集区域做空间连接,可以得到下图:
发现在极严重人口聚集区域之中,以美食与生活的POI个数最多,符合商业性质。金融保险性质的POI个数占原性质POI个数(北京主城区)最高,其次是公司企业,分别是12.98%与10.97%,可以判断12月23日是上班日,大家都在公司上班以及在银行与保险等金融业办公,从区域角度切入,也符合一般认知,国贸、大望路、中关村等区域是极严重人口聚集区域。发现在人口严重与极严重聚集区域中,以美食与生活的POI个数最多,最低占比是休闲体育设施,休闲体育设施通常处在近郊区,上班日当然人口聚集程度较低。
其次,计算在严重人口聚集区域内,多少平方米会有此性质的POI,从下图观察,在12月23日极严重人口聚集区域内,美食与生活性质的POI最多,分别只要1,169平方米与1,157平方米就会有美食性质与生活性质的POI,符合人口越聚集之处,商机越大的道理。
5.2.2 以国贸为例进行详细分析
了解12月23日POI与人口聚集的关系之后,更进一步以国贸为例,探讨在国贸极严重人口聚集区域内(0.2231平方公里),不同性质POI的统计与比较。
下图中,生活与美食类POI占比最高,分别是464个与377个;且美食POI里,以中式料理、小吃与快餐占比前三,中式料理占比最高的原因可能是符合国人吃饭的习惯。而小吃与快餐类,认为可能因素是在符合人群上班的节奏,以快速、方便为主,因此占比前二;也能反映出在极严重人口聚集区域内,餐厅在开店选址时的考虑。
5.3 街道拥堵与人口聚集比较研究
经由上述分别对街道拥堵与人口聚集分析之后,接下来对于两者进行12月23日至12月27日逐日比较,观察北京主城区内两者的关系。
从上图可以发现12月23日街道拥挤和人口聚集呈现错峰,人口聚积面积高峰是在下午15:00之前,之后逐渐下缓,而拥堵道路则是在15:00之后逐渐上涨,两者之间呈现反比,可能是人们下班后开车回家或出去游玩导致此现象产生。12月26日与12月23日一样,街道拥挤和人口聚集符合上班日规律,呈现错峰。
与12月23日平常日上班不同的是,12月25日街道拥挤与人口聚集没有呈现明显错峰,反而是整体趋势一致,反映出在假日时,无法如同12月23日上班得知人们上下班的作息规律,仅能了解到人们习惯在假日时下午出行或游玩,在晚餐时间之后拥堵道路公里数和人口聚集面积数缓和下降,19:00和20:00之后,下缓的速率逐渐趋近为0。
6. 结论
6.1 街道拥堵分析
地域上,东城区与西城区的最为拥堵,若是从街道办事处为单位观察,能发现双井街道办事处的街道平均而论最为拥堵,与其具有多商业中心与CBD所在之处具有很大关联性;
从时间角度切入,比较12月23日-12月27日,可以发现北京主城区的街道拥堵时间段为17:00-18:00时段左右,此时段是下班巅峰时段以及外出用餐时段;
上班巅峰时段12月26日星期一比12月23日周五更为拥堵,符合星期一上班街道更拥堵的认知;
圣诞节对于街道拥堵并无很大关联性。
6.2 人口聚集分析
人口聚集受隔日是否要上班影响较大,人口聚集面积较高的两日是12.23日周五以及12.24日周六,在16:00之后,人口聚集面积最高的是12.24日,可能因素有二,一是受到平安夜影响,二是因为隔日不用上班;
地域上,以12.23日为例,可以发现生活与美食性质POI在极严重人口聚集区域最多,符合商业性质;
街道拥堵与人口聚集比较;
两者之间在上班日呈现时间错峰,可以得到人们的作息规律,假日两者之间在时间上是正比关系,且人们在假日时更倾向下午出门;
除了以假日与上班日区分外,若是从隔日是否上班作为研究切入点,更能凸显人口聚集与街道拥堵的变化。
6.3 不足之处
12月24日上午的数据有所缺失;
人口聚集区域与POI的关系,此研究只有以POI性质与极严重人口聚集作分析,更后续可以进行更深入研究,例如小区房价与人口聚集关系,餐厅均价与人口聚集关系等研究;
此研究主要是以日期为间隔,分析不同天不同时段北京主城区街道拥堵与人口聚集得变化,对于哪个地域人口聚集或街道拥堵甚少着墨,后续可以深入研究;
现在有的只是人口相对聚集与不聚集,盼之后研究能与百度合作,了解百度区分聚集的标准依据,得知绝对的人口聚集值。
作品成果(37 PAGES)
认证证书:
郭翰,已参加由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》,具备城市数据综合分析能力,特此颁发认证,以资鼓励。
证书查询网址:www.caup.net/cert
往期回顾:
城市数据研习社是国匠城、城市数据团共同举办的持续性学习组织,社员将享受到持续更新的数据课程,免费使用的数据插件,以及社群内的交流答疑。
目前,城市数据研习社开启了“千人计划”,希望能够从规划师中首先招募1000人,作为社群的中坚力量,助推规划师个人发展。
城市数据研习社咨询群:413942566
长按识别二维码,腾讯课堂
报名加入城市数据研习社