2.1 城市发展现状分析
对城市发展现状的分析,现有编制思路主要是利用统计年鉴或资料数据对城市社会经济基本概况进行描述性统计,并结合对政府访谈和实地调查来总结城市发展所存在的社会、经济及生态等较为宏观的问题。但是,现有手段较难准确把握城市居民日常生活、企业生产亟须解决的问题或需求。需要借助手机信令、微信热力、微博签到与文本、百度POI、专题网站( 大众点评、淘宝、58同城、搜房网、招聘网等)等大数据,全面分析城市在空间布局、公共服务效率、社会空间分异、生态环境保护、产业发展、交通出行等方面所存在的区域共性或城市特有的问题。
例如, 在雾霾问题上, 我们通过对长三角微博文本进行词频分析可以发现,南京雾霾问题的严重性在长三角地区仅次于上海、杭州及宁波(图1)。同时,还可以将带有空间坐标信息的关键词(微博文本数据)进行GIS空间可视化,找出某一问题经常在特定城市发生的空间位置。例如,利用南京微博文本数据, 以“堵”为关键词搜索研究南京市交通状况,可以发现某个时间点龙蟠路为南京最为拥堵的道路(图2)。可以看出,通过对文本词频的分析有助于从区域和城市内部两个尺度对具体问题进行把握,对城市总体规划中的现状概况描述、SWOT分析、战略定位、空间布局及专项规划都具有一定的支撑或补充作用。
图1 长三角城市雾霾污染词频等级
图2 南京交通拥堵空间分布
2.2 城市战略定位
城市战略定位中大数据应用关键在于对城市网络联系的分析,传统关于城市联系研究大部分利用GDP 、企业总部与分支机构数量等统计数据,结合重力模型进行城市间相对势能或影响力的分析,但是受数据限制较难对区域城市间真实动态联系进行把握。大数据的出现,可以通过车辆GPS定位、抓取携程网交通客运时刻表、获取手机信令等方式掌握城市间交通或人流情况,利用百度等搜索引擎居民搜索指数或微博用户相互关注度来获取城市间的信息联系,利用实时银行网络支付方式来了解城市间资本流动等等,进而通过社会网络分析方法模拟城市间交通、信息、资本联系网络,并与城市经济流、金融流等传统方法计算结果进行聚类、分层及赋值叠加,找出城市在区域综合联系中的地位、新政策导向下城市在区域发展中存在的问题,进而提出提升城市网络地位的战略(图3)。
图3 基于要素流数据的城市区域联系分析方法框架
例如,常州市在最新一轮《长江三角洲城市群规划》和《扬子江城市群规划》中的地位都作为区域中心城市,但是我们通过对常州市对外要素综合联系(经济流、交通流、信息流)分析发现,常州具有明显的与上海、苏州及无锡密切联系的东向联系轴,与省会南京、浙江及江北地区(扬州、泰州与盐城)的联系都较弱。这就需要常州在新的一轮总体规划中,一方面着力打造杭州都市圈和杨一泰一盐地区南北向中枢地位;另一方面加强西向联系,发挥苏锡常城市群对接南京都市圈(扬子江城市群核心城市)的门户城市作用(图4)。
图4 常州市区域综合联系
2.3 城市发展边界划定
区别于传统综合指标体系、等时交通圈、断裂点、反磁力模型等界定方法,基于大数据的城市发展边界划定重点关注中心城市与周边区域的活动联系。首先,获取手机信令、微博签到、微信热力及公交刷卡等反映居民活动位置及活动轨迹的大数据;其次,利用强度公式(活动总量与建成区面积的比值)分别计算中心城区与周边居民活动强度及等级,利用核密度分析工具判别中心城区与周边区域居民活动的邻近性(活动越邻近,越有机会进行同城化发展),利用社会网络分析方法可视化中心城区与周边区域的居民活动联系,找出联系最为紧密区域;最后,利用聚类法分别将三种活动指标值进行分层并赋权重,重新打分,在各城市综合得分基础上进一步聚类分层,进而得到与中心城市整合发展区域的具体范围(图5)。
图5 基于活动位置大数据的城市发展边界划定方法框架
2.4 城市规模预测
城市规模包括人口规模和用地规模,也是城市总体规划编制的重点和难点。在人口规模预测方面,从数据源来讲,精确定位到每一位居民的手机信令数据应该是人口规模预测的最佳选择。在采集某一城市多时间段(不同年、月、周进行抽样)手机信令数据并清洗基础上,利用统计分析方法把握城市居民活动的时间模式,利用时空棱柱等空间分析手段摸清居民的活动空间轨迹,并设立包括职住活动识别、城市枢纽区域(火车站等城市对外联系区域)基站监测、边界区域基站监测三个方面的人流监控机制,一方面判别城市常住人口分布及多时段变化,另一方面分别找出城市短期流动人口和中长期流动人口的分布及多时段变化。再者,在人口识别和多时间段人流变化基础之上,总结城市不同类型人口流动变化参数,并在全国最新人口普査数据支撑下,利用人口增长模型对城市规划期末人口进行估算,并与自然增长法、产业集聚、区位法、环境容量法等传统方法预测结果进行对比修正(图6)。
图6 基于手机信令数据的城市人口规划预测方法框架
城市用地规模预测方面,在获取手机信令等位置大数据基础上,利用社会网络分析模拟城市现状各组团的居民活动联系,利用核密度分析方法找出城市空间活动集聚程度,并与城市现状建成区和城市各组团人口现状规模数据进行叠合分析,找出城市各组团实际利用边界和实际人口密度。通过多年份的数据分析,可以提取城市各组团边界范围与人口密度变化参数,结合基于大数据的城市人口规模预测结果、城市未来重点建设项目或政策机遇,利用城市空间增长模型预测规划期末可能的增长边界,并通过基于活动大数据的上轮城市增长边界评估结果和对主体功能区规划、十三五规划、国土规划、城乡规划、生态环境保护规划等“ 多规合一”划定边界来综合修正城市用地规模预测结果(图7)。
图7 基于活动位置大数据的城市用地规模预测方法框架
2.5 城市空间结构规划
对城市空间结构,过去往往基于城市现状空间发展体系、上位和上轮规划、城市政府发展意愿、新的发展条件或机遇等因素进行经验性的判断,缺乏对城市内部居民活动和需求进行深入数据分析,即利用手机信令、微信热力、微博签到、出租车GPS、公交刷卡等掌握城市居民日常流动网络、活动的时空分布及多年份历史变化规律,利用微博、论坛网站文本或照片数据挖掘居民对城市中心体系的认知,并以此为基础进行未来城市空间体系的综合安排。在南京市城市空间结构分析中,利用微博签到数据一方面可以分析南京市居民活动空间分布格局, 另一方面可以找出南京市各组团之间的活动联系网络;利用微博文本数据可以发现南京市居民意向中心体系,进而可以综合判断南京市“一心多点”的现状空间格局(图8)。
图8 基于微博签到与文本大数据的南京中心城区空间结构判断
2.6 城市功能分区
城市功能分区大数据应用需要重点考虑两个方面的内容:居民活动类型的识别和不同类型居民活动范围的界定。关于居民活动类型的识别,可以利用手机信令、微博签到数据、微信热力、出租车GPS等位置数据, 通过对居民不同类型活动时间模式的把握进行判别(例如,工作活动一般为工作日早9:00~12:00,居住活动为晚10:00~次日6:00);也可以利用微博签到与文本数据,通过文本语义挖掘或关键词提取来判别活动微博签到点的具体活动类型;还可以利用百度POI数据,直接分析不同类型POI位置分布及集聚情况。关于活动范围的界定,需要在不同活动类型判别基础上,利用聚类(K-means等)、泰森多边形等方法对同一类型活动进行聚类、划界。然后,按照城市居民日常活动类型,将城市空间划分为若干个功能区,包括就业活动区、居住活动区、休闲活动区、混合活动区等等。并与城市现状功能区进行叠合优化分析,确定最终的城市现状功能分区类型及范围。此外,还需要通过多年份居民活动类型与范围变化规律分析,结合基于居民活动的城市规划期末空间结构,进一步界定城市未来的功能分区。
2.7 城市土地利用规划
目前,利用大数据对城市土地利用研究总体不多, 集中在利用手机信令数据和居民时间活动模式对城市用地类型、地块大小进行识别,利用百度POI数据、频数密度公式、类型比例公式等方法来识别各格网内用地类型,并没有体系化提出基于大数据的城市土地利用规划方法框架。具体来讲,一方面获取城市人口、地块、POI及相关统计数据,通过空间统计分析方法测算出城市每一块用地的现状范围、类型及容积率;另一方面获取手机信令、微信热力、微博签到与文本等数据,利用核密度分析和强度公式对居民活动密度、强度分布进行判断,利用时间活动模式或文本挖掘方法对居民活动类型进行判断,利用聚类和泰森多边形方法划定不同类型活动集聚范围(或利用频数密度和类型比例公式来测算单位格网内的主体活动类型)。再者,将基于居民活动界定的城市用地与城市现状用地进行叠合分析(主要包括类型、范围及强度三方面指标),结合城市用地计划或政策、重点建设项目等对城市现状用地进行优化,并找出各类用地指标与居民活动指标之间的比例关系,进而指导城市新开发地块的用地布局(图9)。
图9 基于活动位置与文本大数据的城市土地利用规划方法框架