城市数据实践：基于实时交通出行数据的武汉主城区居民生活便利性评价

2017-04-22 城市数据团 & 国匠城

基于实时交通出行数据的居民生活便利性评价

——以武汉市主城区为例

大家好，我叫张晓宇，目前就读于华中师范大学城市与环境科学学院，专业为人文地理与城乡规划。近几年，大数据逐渐走近规划师的视野，大数据与地理学及规划学的结合日益紧密，我也逐渐对它产生了兴趣。学界多位前辈做了很多关于大数据应用的探索，通过这些研究，我得以领略数据的神奇和巨大的优越性。然而，先前对于大数据的接触，都只停留在“观摩”阶段，这次城市数据研习社推出“学期计划”，让我第一次真正有机会探索大数据的实际应用。

1. 研究概述

本研究的主要目的为评价武汉市主城区的生活便利度状况。

1.1 研究区域简介

武汉市地处华中地区，是国家级中心城市，战略位置重要。 “两江三镇”的城市结构使武汉市相比于一般城市，城市空间较为破碎。由于目前针对中部地区城市宜居性、生活便利性的研究均较为有限，因此本研究在一定程度上弥补这方面的空白。本研究的空间范围为武汉市主城区。武汉市主城区包括江岸区、江汉区、硚口区、汉阳区、武昌区、青山区和洪山区共7个区级单位，研究区域面积约965平方千米（图1）。

图1：武汉市行政区划图

1.2 如何定义和衡量居民生活便利性？

居民生活便利性是指居民使用各类日常公共服务设施的方便程度，也就是居民在其日常活动范围内能使用的设施的种类和数量。

本文通过评估各类日常公共服务设施对于居民生活便利性的影响程度，结合相关文献，将日常公共服务设施分为7个大类作为一级评价因子，分别是日常购物、餐饮、便民服务、交通、教育、医疗和休闲娱乐，每一个大类包括若干具体设施（总计25种具体设施）作为二级评价因子。借助层次分析法（AHP），以居民生活便利度作为决策目标，以评价居民生活便利度的一级因子和二级因子作为中间层要素，确定各一级因子和二级因子的权重，构建了居民生活便利度评价体系。具体每类设施的权重指标如表1所示。

单因子生活便利度计算方法：

式中，表示某一级因子的便利度，j表示二级因子的种类，n表示该i类一级因子中二级因子的数量，表示该二级因子的权重，N表示该二级因子的数量。

综合生活便利度计算方法：

式中，表示总生活便利度，i表示一级因子，n表示一级因子的数量，表示某一级因子的便利度。

表1：居民生活便利性评价权重

此外，对于一个居民而言，超出其日常活动范围的设施点不能被纳入其生活便利性的衡量，因此确定居民的日常活动范围十分重要。本文以从各居民点步行半小时到达的范围作为其日常生活圈，研究时只考虑该范围内的设施点状况。

1.3 主要研究方向

归结来说，本文着重回答三个问题：①武汉市居民生活便利性状况的整体状况如何？②生活便利性高的居民点集中分布于哪些区域？③是否存在一个区域的居民点生活明显不便利？

2. 数据处理

本研究的数据处理主要有四个步骤：①居民点数据处理②创建每个居民点的半小时出行圈；③设施点数据处理；④叠加出行圈和设施点数据

2.1 居民点数据处理

基于城市数据研习社提供的17450个居住区的POI数据，借助ArcGIS中的平均中心工具，将所有居民点聚类成为569个出行点，并利用核密度分析法构建武汉市主城区的居住区密度分析图（图2）。

图2：武汉市主城区的居住区密度分析图

2.2 创 40 37696 40 15232 0 0 1546 0 0:00:24 0:00:09 0:00:15 3003每个居民点的半小时出行圈

创建武汉市主城区2000*2000的渔网，并擦除水系，得到194个出行采样点。

以居民点作为起点，以出行采样点作为终点，采集从各个出行点到各目标点的实时步行出行时间，共采集到110192条居民出行数据（569*194）。

借助反距离权重法对数据进行插值分析，并从中提取不同出行点的半小时步行圈（共569个）。

图3：某出行点的等时圈实例图

2.3 设施点数据处理

对研习社提供的数据进行清洗，共得到198858条各类设施点数据。其中，购物设施数据共109236条，餐饮设施数据共50929条，生活服务设施共20229条，教育设施共1536条，休闲设施数据共7755条，医疗设施共5413条，交通设施共2060条。

图4：所有设施的空间分布密度图

2.4 叠加出行圈和设施点数据

使用相交工具叠加出行圈和设施点数据，得到不同出行圈内设施点的种类和数量。在此基础上，基于评价体系计算不同居民点的单因子生活便利度和综合生活便利度。

图5：武汉市主城区居民生活便利性空间分异图

3. 数据分析

该部分利用ArcGIS平台的空间统计工具对数据进行分析，主要是空间自相关分析（Global Moran's I）、高/低值聚类分析(Getis-Ord General G)、热点分析（Getis-Ord Gi*）和聚类与异常值分析(Anselin Local Moran's I)。本部分可以归结为对以下五个问题的回答：①数据是否有分析的价值，即数据是否可以拒绝零假设？——空间自相关分析；②数据是否具有聚类特征？——空间自相关分析；③数据主要是呈现高值聚类还是低值聚类？——高/低值聚类分析；④聚类发生在哪些位置？——热点分析；⑤是否存在显著的低值区域，即该区域设施显著不足？——聚类与异常值分析。

3.1 检验数据是否能够拒绝零假设&全局数据是否具有聚类特征

数据可以拒绝零假设即数据在一定的置信度水平下，不是随机分布的，有分析价值的。验证数据是否能够拒绝零假设需要计算p值和Z得分，这两个指标可以用空间自相关工具（Global Moran's I）得出。

空间自相关是检验某一要素的属性值是否显著地与其相邻空间点上的属性值相关联的重要指标，常用Moran I 指数来衡量。若Moran's I >0，表示空间呈正相关性，其值越大，空间相关性越明显；若Moran's I <0，表示空间呈负相关性，其值越小，空间差异越大；若Moran's I = 0，则空间呈随机性。运行这一工具会同时得到p值和Z得分。

因此，这一步骤可以首先检验数据是否能够拒绝零假设，然后可以进一步检验数据是否具有聚类特征。

利用GIS中的空间自相关工具，得出本研究的全局Moran I指数如表2所示：

表2：全局Moran I指数汇总表

表3显示了不同置信度下未经校正的临界 p 值和临界 z 得分。

表3：不同置信度下未经校正的临界 p 值和临界 z 得分

由上二表，可以发现：①所有项目的p值均小于0.01，所以本数据是随机生成的概率只有1%（99%的置信度），也就是拒绝了零假设；②所有项目的莫兰指数是正数，而且处于0.55~0.80之间，表示这份数据具有空间正相关性；③所有项目的z得分均大于2.58，说明这份数据呈现了明显的聚类特征。

3.2 判断整体上的高值聚类和低值聚类

上文分析得到，武汉市主城区居民总生活便利度以及各方面的生活便利度都呈现出明显的聚类特征。这一部分中继续研究，这种聚类是高值聚类还是低值聚类。

此处采用高/低聚类(Getis-Ord General G)工具。运行这个工具会生成General G观测值、General G期望值、P值和Z得分四个参数。一般而言，如果Z得分为正，表明观察General G指数大于期望GeneralG指数，则数据在高值区域聚类；如果Z得分为负，表明期望General G指数大于观察GeneralG指数，则数据在低值区域聚类。

利用高/低聚类(Getis-Ord General G)工具，得出本研究的全局General G指数汇总如表4所示：

表4：全局General G指数汇总

所有项目的General G 观测值均大于General G 期望值，故整体而言，武汉市主城区居民生活便利度呈现出高值显著集聚，低值较为分散的状况。

3.3 判断高值聚类的具体空间位置

本研究采用热点分析工具（Getis-Ord Gi*）方法进一步确定武汉市主城区主要居民点的生活便利度的高值聚类具体出现在哪些位置。

热点分析工具可对数据集中的每一个要素计算 Getis-Ord Gi* 统计，即z 得分。对于具有显著统计学意义的正的 z 得分，z 得分越高，高值（热点）的聚类就越紧密；对于统计学上的显著性负 z 得分，z 得分越低，低值（冷点）的聚类就越紧密。通过得到的 z 得分和 p 值，可以知道高值或低值要素在空间上发生聚类的位置。

由于武汉市主城区居民生活便利度的热点与上文中武汉市主城区居民生活便利度空间分异图基本一致，下面给出对武汉市主城区居民生活便利度热点插值图，通过聚合所有点数据研究便利度的空间格局。（图6）

图6：武汉市主城区居民生活便利性分布结构图

3.4 寻找可能的低值区域

本研究运用聚类和异常值分析(Anselin Local Moran's I)工具来检测数据中是否存在显著的低值点聚集区，即该区域严重缺少某一种或几种设施，同时也构成了该区域在提升居民生活便利度方面需要重点提升的方面，因此具有一定的现实意义。

聚类和异常值分析(Anselin Local Moran's I)方法与空间自相关工具（Global Moran's I）相都计算P值和Z得分，但是会对每一个要素给出其Moran's I值，同时能够识别出异常的高值和低值。

通过对每一种类型进行聚类和异常值分析，发现除了交通设施外，其他类型均不存在明显的低值点（图7）。

图7：交通因子聚类与异常值分析图

4. 结论分析

4.1 综合生活便利度分析

结合上文中对样本数据进行的空间自相关分析和高/低值聚类分析，发现武汉市主城区的总体居民生活便利性和各个类型的居民生活便利性均呈现高值显著集聚，低值较为分散的状况（图8），即生活便利度较高的居民点在空间上明显倾向于集中，而生活便利度较低的居民点则分布地比较分散。

图8：高/低值聚类分析结果图

由图11可以发现，武汉市主城区总体居民生活便利度较高的居民点主要集中于三级共八个高值区域：第一级区域（即生活便利度最高的区域）包括江汉路、中山公园及附近地区；第二级区域包括：①昙华林、黄鹤楼及片区②王家湾、十里铺片区③光谷广场；第三级包括①徐东群星城片区②和平公园片区③双墩地铁站附近片区④古琴台片区。

上述区域均是武汉市经济较为发达的地区，开发程度较高，基础设施相对较为完善。其中，高值集聚最为明显的江汉路片区，是武汉最早的经济中心，历史悠久，各项设施完备。可见，武汉市主城区居民生活便利性与片区经济发展水平有明显的一致性。

而由图6可见，武汉市主城区居民生活便利性的空间分异呈现同心圆分布特征，从内到外明显的三层结构，第一层的边界基本与武汉市二环线相吻合，但是在青山区和江汉区，向北扩展到三环线，第二层的边界基本与武汉市三环线相吻合，但是在青山区，向北扩展到天兴洲中部，第三层的为武汉市中心城区剩余区域。

虽然武汉市是独特的“两江三镇”城市结构，市内湖泊众多，城市土地并不连续。但是从生活便利度的角度来看，武汉市仍然接近单中心的同心圆结构的城市，并未发展处明显的城市次中心。

图9：武汉市主城区居民生活便利性空间分异图

4.2 单因子便利度指数分析

根据对不同一级评价因子进行聚类和异常值分析（图10），可以发现，不同类型的生活便利性状况差异不大，基本都表现出明显的高值聚类趋势。其中，餐饮设施和休闲娱乐的高值聚类特征最为明显，交通设施的高值聚类特征最不明显，其原因可能在于交通设施的分布通常呈点状，除重要节点外分布较为均匀。

就高值区发生的空间位置而言，各类型生活便利度的高值区域在空间分布上呈现出显著的一致性，基本上所有类型的高值聚类均分布于江汉路片区、王家湾片区、黄鹤楼片区、徐东片区和光谷广场片区。可见，经济发展水平对于基础设施的完善作用是全面的，经济水平的发展通常会全方位带动基础设施的完善。

图10：武汉市主城区居民生活便利性聚类与异常值分析图

通过对交通因子作聚类和异常值分析（图11），可以发现交通设施存在较明显的低值聚类，聚类位置位于洪山区汤逊湖北岸地区。武汉市主城区内河湖众多，陆地界面相对较为破碎，该片区位于汤逊湖和南湖之间的狭窄地带，这是自然环境对居民生活便利度产生的影响。加之该片区本身地理位置相对比较偏僻，受到周围的经济辐射较弱，因而经济区位不优越，故缺乏交通设施的覆盖。

对其他一级因子作的聚类和异常值分析的结果表明，其他方面的居民生活便利度并不存在显著的低值聚类的区域。

图11：交通因子聚类与异常值分析图

5. 个人感想

5.1 对GIS分析操作的思考

借助此次机会，我进行了高强度的GIS训练，对于GIS的理解加深了不少，操作也熟练了很多。感触最深的是大样本下Model Builder的巨大优势，这个工具帮助我大大减轻了工作量，尤其是使得本研究的核心步骤——汇总近600个样本点的数据，成为可能。而最后的成果竟然很符合自己的日常经验，表明没有出现大的偏差，我也非常的欣慰。

另一个感想是，有一些问题表达出来十分浅显易懂，但如果想在GIS上实现，则会对一个人的逻辑和耐心提出很大的挑战。本次研究中，其实最难的一个部分是提取不同出行点的出行圈数据。这个问题听上去简单，但是真正要实现却不容易。为了解决这个问题，我花了大概一个星期的时间，不断地调试Model Builder，不断地试错，才探索到了一个比较完善的方法。所以说这次的学期计划，让我再一次体会到了科学研究的过程，是仰之弥高，钻之弥坚的求索之路。

5.2 对大数据方法的冷思考

尽管大数据方法相对于传统的问卷调查法具有明显的优势，但是就单个数据而言，其深度是不足的，只是获得了位置信息、名称信息和类型信息，这是远远不够的。目前为止，大数据方法还不能将不同个体的主观属性纳入考虑，还是需要传统的问卷访谈方法来补充，在这一点上，大数据方法似乎暴露了其不足，这可能也是其未来的重点发展方向吧。

衷心感谢城市数据研习社在技术和数据方面提供的帮助！

注：本研究所应用的GIS分析，主要参考了ArcGIS帮助10.1[K]以及CSDN博客（http://blog.csdn.net/allenlu2008/article/category/2543135）

张晓宇，已参加由国匠城和城市数据团共同举办的《面向规划实践的数据能力增强计划》，具备城市数据综合分析能力，特此颁发认证，以资鼓励。

证书查询网址：www.caup.net/cert

往期回顾（点击查看证书与优秀学员奖励细则）

【优秀学员 | 王娟】武汉对外交通门户市内公交通达度

【优秀学员 | 胡晓亮】城市实时交通出行商业服务区浅析

【优秀学员 | 徐凯恒】基于时空圈测度的京津冀城市群分析

【优秀学员 | 李小溪】基于多源数据南京市老城南活力解读

【优秀学员 | 彭胤】基于百度热力成都市中心城区人群分析

【优秀学员 | 王梦】基于百度热力武汉市主城空间结构研究

【优秀学员丨郭翰】北京主城区人口聚集与街道拥堵分析
 【优秀学员丨梁家俊】基于百度热力中山市中心城区结构分析

【优秀学员丨林鉴宇】基于城市POI静态数据的城市功能识别

【优秀学员丨郑梦雷】苏州市城市POI数据综合运用研究

【优秀学员丨周捷】贵阳公共服务功能集聚分析及规划对比

【优秀学员丨魏小帅】出租车数据的处理与可视化展示

【优秀学员丨满令意】看POI数据玩转商业街区的各种方式

【优秀学员丨王卓】ArcGis山地控规生态适宜性评价

【优秀学员丨欧光坤】徐州城市功能区识别与休闲活力评价

【优秀学员丨庄楚天】城市公交数据获取的历史与今天

城市数据研习社

2016年8月，由国匠城与城市数据团联合成立的城市数据研习社，发起了面向城市规划行业的“千人计划”。希望能够从规划师中首先招募1000人，组建城市数据学习社群，增强规划师的数据应用能力，提升整个行业的数据应用水平。在半年左右的时间内已有900多位规划师加入研习社。研习社学员已覆盖国内外132所高校，114所设计院和103家其它企事业单位。

城市数据研习社咨询群：413942566

城市数据研习社：2017“学期计划”

长按识别二维码，腾讯课堂

报名加入城市数据研习社

薄公子低调成台湾女婿 23日已在台举办婚礼

警察殴打打人学生，舆论撕裂的背后

你手放哪呢，出生啊

故宫蛇年限定款藏书票，错过再等12年！

“湿冷魔法”攻击！鸟家三合一冲锋衣、羽绒服、软壳裤帮你抵挡