期刊精粹 | 【抢先版】新数据环境下定量城市研究的四个变革
【编者按】为了更好地推广学者的研究成果,我们将不定期地推送一些尚未见刊的稿件的精华观点,以飨读者。作品的发布已取得作者授权。欢迎读者指正、讨论。
近年来,随着信息通信技术与物联网技术的发展,有别于传统调研和统计数据的新数据环境(new data environment)正在形成。与传统数据相比,新数据环境主要呈现出精度高(以单个的人或设施为基本单元)、覆盖广(不受行政区域限制)、更新快(每月、每日、甚至每分钟更新)等特点。新数据环境的出现与成熟带来了城市研究领域关注内容和研究方法的较大变化,促使城市规划与其他相关学科的进一步融合,以及在研究范式、研究方法与内容上的革新。在这样的背景下,我们观察到当前我国定量城市研究主要出现了四个方面的变革。
1 空间尺度上由小范围高精度、大范围低精度到大范围高精度的变革
在传统数据环境下,受数据收集方法的限制,城市和区域研究在研究覆盖范围和精细度上往往很难做到两者兼顾——大范围的研究通常以牺牲精细度为代价,而精细度高的研究往往覆盖范围较小。而新数据环境为在较大空间范围内收集高精度数据提供了可能,如社交网络和各类商业网站数据往往覆盖全国,且以人、车、商户等个体为基本单位,可充分满足精细化的分析需求,而对某些传统数据的有效整合也有利于拓展数据的广度与精度。
研究案例:覆盖全国所有城市的地块尺度城市增长模型MVP-CA
利用海量矢量地块元胞自动机(MVP-CA:Mega-Vector-Parcels Cellular Automata Model)对全国654个城市的用地扩张过程进行地块尺度的模拟,可用于预测每个城市未来五年内在不同政策情景下的城市扩张情况(图1)。
2 时间尺度上由静态截面到动态连续的变革
新数据环境所提供的另一重要突破是体现了不同时间尺度上的城市动态。传统城市研究的数据来源多为政府部门统计年鉴或抽样调查,以静态数据为主,只能反映某一时刻或一段时间内城市所处的状态(如年鉴对应一年、出行调查多对应一日),且由于数据取样的局限性,只能覆盖有限的空间范围。而包括公交刷卡、出租车轨迹、信用卡交易记录、在线点评以及位置微博和照片等在内的新数据环境则可以反映个人乃至整个城市短至每秒、长至多年的动态变化,且具有连续性高、覆盖面广、信息全面等优势。
研究案例:利用一周公交刷卡记录评价北京通勤形态
龙瀛等利用2008年公交刷卡数据(854万持卡人连续一周共7797万次出行),对北京市通勤出行进行了识别,得到22万余人的居住地、就业地和通勤出行,进而对通勤形态的时空分布进行了评价,并对典型居住区和就业地的通勤出行进行了重点分析(图2),发现CBD的通勤辐射范围远超上地和金融街,通州居民每日平均通勤时间超过一小时等。需要说明的是,利用一日刷卡数据可以对公交系统的运行进行可视化,但难以可靠推测持卡人的居住地和就业地以及通勤出行,而通过利用一周数据所包含的持卡人的周期性活动,则有望解决这个问题。
3 研究粒度上由“以地为本”到“以人为本”的变革
同时,新数据环境所提供的并非仅是扩大的数据量,还包括数据所反映的城市居民的行为特征与规律,以及人对建成环境的感觉、情感、经验、体验、信仰、价值判断等,这些以前难以量化的因素在新数据环境中都可以得到有效的表达与数理分析。
研究案例:基于乡镇街道办事处尺度人口数据的中国收缩城市研究
以往的中国范围的人口研究多为县市尺度,龙瀛等基于五普(2000年)和六普(2010年)的乡镇和街道办事处尺度的人口数据,发现中国180个城市发生了人口总量和密度的下降,即存在着180个收缩城市(图3)。中国收缩城市可以根据原因分为四个类型:资源型城市在工业化进程中出现的局部收缩、传统工业城市工业衰落导致的局部收缩、欠发达地区人口迁移引发的局部收缩、行政区划调整导致的局部收缩。这一研究发现意味着城市规划中“人口增长”的基本假设应有所调整,特别是180个收缩城市的规划,亟须从城市规模扩张转向关注居民生活质量。此外,研究也在一定程度上提示规划师和决策者,人口向大城市的聚集是城市发展的客观规律,中小城市的发展促进政策是否适合需要因地制宜地客观评价,而非盲目推进。
图3 2000—2010年中国收缩城市分布
4 研究方法上由单一团队到开源众包的变革
众包(crowd sourcing)则是互联网带来的新的生产组织形式,即利用互联网将原先单一机构内的工作任务以自由自愿的形式分配给机构外的志愿人员(通常为个人)完成,这一组织方式可以充分利用志愿者的创意和技能,以更低的成本、更高的效率完成任务。虽然开源、众包等概念听来与城市研究和城市规划领域相距甚远,但近两年来随着数据的开放和北京城市实验室(BCL)等开放研究平台的成熟,众包模式也在逐渐融入定量城市研究和相关数据平台构建中(如搜集数据、学术合作、验证研究成果),并体现出优势。
研究案例:基于开放数据建立城市用地现状图并模拟城市扩张
众所周知,用地现状图数据在我国被严格控制,外资事务所、大学、规划机构等都难以获得完备的用地现状图数据,龙瀛和刘行健利用开放数据如开放街道地图(OSM: Open Street Map)道路网络和兴趣点数据,生成了中国297个城市的用地现状图,包括功能布局、密度和混合使用程度等方面。研究成果的GIS数据通过网络完全共享,并通过志愿者征集,获得了十余个城市的真实用地现状图,进而验证了利用开放数据推导用地现状图的可行性。
在此研究基础上,龙瀛等基于大量的道路网和兴趣点数据,利用约束性元胞自动机方法,建立了覆盖全国654个城市,包括76万个城市地块的城市增长模拟模型(MVP-CA,图4),对不同政策下每个城市的城市空间发展模式进行了模拟。模拟结果采用在线交互地图的形式共享在BCL网站上,通过微博进行宣传,得到了诸多用户的反馈,一些具有当地知识的用户对所熟悉的城市的模拟结果进行了评价,指出了模拟结果的可靠与不可靠之处,这对优化模型构建具有较大的促进意义。
5 目前的主要问题
虽然相关研究在过去一段时间内取得了大量进展,但我们也注意到以下几点现象,需要在日后研究中进一步讨论并提升。
(1)数据有偏性问题
新数据的有偏性广为学界讨论,这与大部分新数据的互联网属性直接相关——新数据大量来自于互联网的积极使用者,导致了数据在人群和地域代表性方面的偏差。例如利用位置微博数据进行的城市幸福感研究,面临着多个层面的偏差,包括微博用户的口是心非、自然语言处理的能力约束、发微博人群的代表性、新浪提供微博API的黑箱。
(2)与规划实践的对接问题
虽然定量城市研究在学术领域迅速发展,但相关方法在规划实践中的应用仍非常有限,尚需要大量探索。这涉及当前研究的两方面问题:首先,现有研究大多采用短期数据记录,多现状分析、少远景判断,部分研究仅处于可视化层次,而少有利用覆盖多年的数据进行远景判断;其次,现有研究多客观认识、少规划启示,以针对城市系统的现状评价和问题识别为主,而较少可以用于直接指导规划实践。
(3)与规划学科发展的互动问题
可以看到,定量城市研究、特别是新数据环境下的相关研究所要求的研究者知识背景与传统规划知识体系存在明显差异,这也涉及当前研究与规划学科原有体系如何相辅相成的两方面问题。首先,定量城市研究在采用创新性数据与方法的同时如何为规划学科核心理论发展作出贡献,如何利用新数据揭示出更多传统数据和方法难以应对的城市运行内在规律,是相关研究应关注的问题。第二,未来规划院校的学科专业设置、课程设置、人才培养是否需要有所转变,以应对学科发展出现的新现象和新趋势,也是学界需关注与讨论的问题。
作者:龙瀛,博士,北京市城市规划设计研究院,高级工程师;刘伦,剑桥大学土地经济系,博士研究生
本文为本订阅号原创
欢迎在朋友圈转发,转载请联系upi@vip.163.com