论文推荐 | 朱婷婷:利用地理标签数据感知城市活力
《测绘学报》
利用地理标签数据感知城市活力
朱婷婷1,2,3
1. 深圳大学建筑与城市规划学院城市空间信息工程系, 广东 深圳 518060;
2. 人工智能与数字经济广东省实验室(深圳), 广东 深圳 518060;
3. 广东省城市空间信息工程重点实验室, 广东 深圳 518060;
4. 武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉 430079;
5. 伦敦大学国王学院地理学院, 英国 伦敦
收稿日期:2019-01-31;修回日期:2019-10-24
基金项目:国家自然科学基金(71961137003);深圳市科技创新委员会基础研究项目(JCYJ20180305125113883)
第一作者简介:朱婷婷(1994—), 女, 硕士生, 研究方向为城市时空大数据分析。E-mail:zhutingting2017@email.szu.edu.cn
通信作者:涂伟, E-mail:tuwei@szu.edu.cn
摘要:高度活跃的城市是社会稳定发展的基础。基于地理标签感知的城市活力能够量化城市发展现状,探索城市活力的影响机制,为精细化城市治理提供技术支撑。传统城市活力研究依赖于街区的活力调查,时间长,费用高。本文研究利用兴趣点和社交媒体签到等地理标签数据,提出了城市活力度量指标,探索性分析城市活力的分布模式。基于土地利用、道路和建筑物等数据计算建成环境指标,构建城市活力和建成环境之间的普通线性回归与空间自回归模型,揭示了影响城市活力的建成环境因素。基于深圳市的试验结果表明:兴趣点和社交媒体签到数据能够较好地指示城市活力。深圳市的城市活力主要受商业用地、工业用地、土地混合利用以及路网密度、地铁站点密度的影响。住宅用地和建筑物占地密度对基于POI的城市活力具有显著影响。
关键词:城市活力 POI 位置签到数据 空间自回归
Sensing urban vibrancy using geo-tagged data
ZHU Tingting1,2,3
1. Department of Urban Informatics, School of Architecture and Urban Planning, Shenzhen University, Shenzhen 518060, China;
2. Guangdong Laboratory of Artificial Intelligence and Digital Economy(SZ), Shenzhen University, Shenzhen 518060, China;
3. Guangdong Key Laboratory of Urban Informatics, Shenzhen University, Shenzhen 518060, China;
4. State Key Laboratory of Information Engineering in Surveying, Mapping, and Remote Sensing, Wuhan University, Wuhan 430079, China;
5. Department of Geography, King's College London, London WC2R 2LS, UK
Foundation support: The National Natural Science Foundation of China (No. 71961137003); The Basic Research Projects of Shenzhen Technology Innovation Commission (No. JCYJ20180305125113883)
First author: ZHU Tingting (1994—), female, postgraduate, majors in urban spatial-temporal big data analysis.E-mail:zhutingting2017@email.szu.edu.cn.
Corresponding author: TU Wei, E-mail:tuwei@szu.edu.cn.
Abstract: Promoting neighborhood vibrancy is vital for urban development. Recently, geotagged data provide unprecedented opportunities for discovering urban vibrancy patterns and their affecting mechanism. However, traditional urban vibrancy studies rely on fields survey therefore are time-consuming and highly-cost. This study constructs two urban vibrancy indices using point-of-interest and social media check in data. The spatial patterns of urban vibrancy are explored with spatial auto-regression analytic. Ordinary regression models (OLS) and spatial autoregression models (SAM) are established for revealing the influences of built environment on urban vibrancy by using geospatial data such as land use, roads and buildings. An empirical study in Shenzhen was implemented. The results show that:commercial land, industry land, mixed land use, the road density, and metro stations are five main factors highly influencing Shenzhen vibrancy. Residential land use and building footprints only have significant effects on vibrancy exhibited by POI. These exploratory findings demonstrate that urban vibrancy should be assessed and improved for different consideration.
Key words: urban vibrancy POI geotagged check in data spatial auto-regression
城市是人口、空间基础设施高度聚集且具有良好建成环境的地区[1]。截止到2018年, 我国的城镇化率已经达到59.8%。具有高度活力的城市是能够满足人群的衣食住行等各种需求, 提供丰富的工作机会, 支撑更加美好生活的城市。感知城市活力是监测城市空间发展现状, 辅助进行数据驱动城市发展规划, 实现城市可持续发展的重要基础。文献[2]认为人与人活动及生活场所交互的过程, 以及城市生活的多样性, 让城市获得了活力。文献[3]则认为具有活力的地区应该是拥有多样人群活动的开放空间, 支撑不同人群的交互。因此, 城市活力可以通过城市人类活动及其与空间的交互来表征。
测量城市活力一直是相关研究的重点。传统研究多使用调查方式研究城市活力[4]。通过居民佩戴的GPS设备, 文献[5]记录了研究单元内活动人群量, 从而测量社区活力。这种调查方式虽然能够提供详细的街区活力画像, 但耗时耗力, 难以覆盖较大区域。作为人类活动的结果, 土地利用也被广泛用于定量描述城市活力[6]。然而土地利用数据更新较慢, 适用于长时间尺度的活力评价。
近年来, 信息技术和定位技术持续集成, 已经能够获得大规模的带有地理位置标签的数据, 如手机信令数据、兴趣点(point of interest, POI)、社交媒体数据、GPS定位记录、街景影像等[7-9]。这些数据隐含了丰富的人类活动信息, 为感知城市物理与社会空间提供了新手段[10-12], 也为城市活力测度提供了新途径。因覆盖范围广, 更新快等优点, 手机信令数据常被用于表征城市活力。将手机数据作为人类活动的代理, 文献[10]利用手机基站信令数据总量表征活力, 构建了街道活力评价的指标体系[10]。然而, 手机数据涉及隐私, 其获取受到限制且购买成本较大。兴趣点数据具有语义丰富、分布广泛, 容易获得等特点, 广泛应用于城市研究中[13-14]。一方面, 这种数据包括休闲娱乐、酒店、购物等服务类别, 能够有效表达城市活力[15]。另一方面, 基于街区尺度, 小型餐饮类POI能够衡量街区商业活力[16]。与兴趣点数据相比, 社交媒体签到数据包括了不同城市群体对活动地点和活动类型的偏好, 能够更加精准地反映城市活力[17]。文献[18]利用微博签到数据, 揭示了城市活力的时变模型, 表达了其表征城市活力的可行性。综上所述, 兴趣点和社交媒体签到等地理标签数据能够较好地测度城市活力。然而, 多源地理标签数据产生了多个城市活力景象, 需要探索性分析不同数据表征下城市活力空间模式的异同, 为可靠的城市活力测度提供了基础。
揭示城市活力影响机制是另一个研究热点。人类日常活动的地点、时长和体验与周边环境紧密相关。环境是影响城市活力的和城市活力的重要因素。建成环境(built environment)指的是城市中满足居民日常生活、工作和再生产需求的人造空间, 一般包括土地利用、城市交通、城市建筑物等[19-20]。大量文献表明:城市活力与建成环境之间具有紧密的联系。土地利用配置是激发城市空间活力的重要条件[21]。不同类别土地利用对活力的影响也存在差异[18]。混合土地利用能够显著促进城市活力。文献[22]发现公共空间、街道设施、人行道宽度、树荫、街道连接性、街道人流量、建筑特征、个性化商店橱窗、景观密度和种类等建成环境因素对街道活力具有不可忽视影响。建筑物也是营造城市活力的关键。文献[16]发现了基于建筑物密度构建的建筑物占地空间指标、建筑物楼层空间指标对城市活力的促进作用。因此, 本文将结合土地利用、交通网络和建筑物等空间大数据, 揭示土地利用、交通网络以及建筑物等城市建成环境指标对城市活力的影响机制, 并探索不同城市活力测度下的影响机制稳定性。
本文利用兴趣点和社交媒体签到数据测度城市活力, 并探索性分析其空间模式。顾及土地利用、城市交通及建筑物等建成环境因素, 构建了线性回归模型和空间自回归模型, 揭示建成环境对城市活力的影响机制, 并探索这种影响机制的稳定性。研究结果表明, 不同地理标签数据指示的城市活力具有相似的空间模式, 但在局部空间上存在差异。城市活力主要受商业用地、工业用地、土地混合利用以及路网密度、地铁站点密度的影响。本文研究成果能够精准评估城市活力现状, 监测城市空间发展态势, 揭示城市活力影响机制, 为城市活力提升政策制定提供支撑, 促进城市可持续发展。
1 方法1.1 城市活力测度
测量城市活力是城市空间精准监测的重要内容。为了精准感知区域活力分布, 本文以交通分析小区(traffic analysis zones, TAZ)为基础研究单元, 构建活力指标。交通小区是由政府或交通规划部门根据相关交通数据描绘的特殊区域, 通常包括社会经济较为相似的空间单元。TAZ常被用于城市及交通研究中, 如:交通出行、城市活力[21]等。因此, 本文采用TAZ作为基础研究单元。本文利用POI和社交媒体签到两类地理标签数据, 计算两类空间密度指示城市活力, 并分析其空间分布模式。
1.1.1 基于POI的城市活力指标
兴趣点是人群活动产生的主要场所。POI数据具有良好的空间尺度自适应特征。城市设施POI蕴含了广覆盖的城市人群与周围环境的交互信息[23]。本文中融合大众点评和高德地图的POI数据, 计算交通小区内的POI密度, 表征城市活力。公式如下
式中, PTAZ表示TAZ内所有POI数量; STAZ表示TAZ面积。
1.1.2 基于社交媒体签到的城市活力指标
社交媒体签到数据能够表达人群对于活动类型和活动地点的偏好, 捕捉了人群日常生活轨迹[24]。本文中利用新浪微博签到数据, 计算交通小区内的社交媒体签到密度, 表征城市活力如下
式中, CTAZ表示TAZ内签到次数; STAZ表示TAZ面积。
1.1.3 Moran’s I
本文采用Moran’s I分析城市活力的空间自相关性, 揭示城市空间活力的分布模式。公式如下
式中, Zi是要素i的属性与其平均值(
1.2 建成环境
建成环境包括人为建设或改造的城市建筑物和场所。建成环境是激发或抑制城市活力的重要因素。本文中的建成环境指的是土地利用, 交通网络与建筑物。
1.2.1 土地利用
本文基于土地利用空间数据, 计算了商业用地比、住宅用地比、政府用地比、工业用地比等指标。土地混合利用是营造城市活力的重要因素。本文采用香农熵表征土地利用混合程度, 如式(3)所示。熵值越大, 土地混合利用程度越高。熵值越小, 混合利用程度越低。
式中, pi表示TAZ内某一土地利用类型的面积占所有土地利用类型面积的百分比; n表示土地利用类型分类数。
1.2.2 交通网络
交通网络如道路、地铁等的空间覆盖对城市活力具有显著作用。利用交通网络数据, 本文计算了路网密度、路网节点密度、地铁/公交站点密度等指标。其中路网密度指的是单位面积的道路总长度。路网节点密度指的是单位面积内的道路节点数量。地铁/公交站点密度分别以单位面积内的地铁站点或公交站点数量表示。
1.2.3 建筑物
建筑物空间配置也是营造城市活力的关键因素。本文引入两种建筑物密度指标, 即容积率(floor space index, FSI)和占地密度(ground space index, GSI)[16]。其中, 建筑物容积率表征建筑物楼层空间密度, 如式(4)所示; 占地密度表征TAZ中建筑物占地面空间的比例, 如式(5)所示
式中, Fi表示某一TAZ内所有建筑物的楼层面积(m2); Bi表示某一TAZ内建筑物占地面积总和(m2); Ai表示该TAZ的面积(m2)。
综上所述, 本文选择商业用地比、住宅用地比、工业用地比、政府用地比、土地利用熵、路网密度、路网结点密度、地铁/公交站点密度、建筑物容积率和建筑物占地密度等共11类因素测度建成环境, 见表 1。
表 1 建成环境指标Tab. 1 Description of independent variables
建成环境 | 指标 | 个案数 | 范围 | 平均值 | 标准差 | 方差 |
土地利用 | 商业用地比 | 473 | 0~0.739 | 0.061 | 0.092 | 0.009 |
住宅用地比 | 473 | 0~0.835 | 0.243 | 0.210 | 0.044 | |
政府用地比 | 473 | 0~0.813 | 0.077 | 0.093 | 0.009 | |
工业用地比 | 473 | 0~0.819 | 0.173 | 0.204 | 0.042 | |
土地混合利用 | 473 | 0.003~0.90 | 0.581 | 0.174 | 0.031 | |
交通网络 | 路网密度 | 473 | 0.31~30.78 | 11.188 | 6.400 | 40.961 |
路网结点密度 | 473 | 0~33.734 | 3.924 | 4.358 | 18.992 | |
地铁站点密度 | 473 | 0~2.597 | 0.165 | 0.429 | 0.184 | |
公交站点密度 | 473 | 0~265.36 | 46.312 | 46.003 | 2 116.279 | |
建筑物 | 建筑物容积率 | 473 | 0~2.222 | 0.612 | 0.437 | 0.191 |
建筑物占地密度 | 473 | 0~0.350 | 0.137 | 0.085 | 0.007 |
表选项
1.3 线性回归模型
本文首先采用多元线性回归方法分析建成环境对城市活力的影响。线性回归又称最小二乘回归, 能够简单有效地揭示对象间的线性关系, 是回归分析中最常用的模型之一[25]。其公式为
式中, y表示因变量; xj表示自变量; βj是相应自变量回归系数; m表示共有m个参与回归的自变量; β0为初始回归系数; ε为误差项。
本文针对POI和社交签到数据分别构建线性回归模型, 即因变量分别是POI密度(表 3模型1)和社交媒体签到密度(表 3模型2)表征的城市活力。考虑到两种城市活力之间的数值差异, 本文将其归一化作为因变量。线性回归模型揭示了建成环境对活力的影响机制。
表 3 线性回归分析结果Tab. 3 Estimation results for linear regression
项目 | 模型1:POI密度 | 模型2:社交媒体签到密度 | ||||||||||||||||||||||||||||||||
系数 | t统计 | 标准差 | 偏相关性 | 系数 | t统计 | 标准差 | 偏相关性 | |||||||||||||||||||||||||||
常量 | -0.008 | 0.014 | 0.000 | 0.013 | ||||||||||||||||||||||||||||||
商业用地比 | 0.370 | 7.364* | 0.050 | 0.323 | 0.331 | 7.432* | 0.045 | 0.325 | ||||||||||||||||||||||||||
住宅用地比 | 0.123 | 4.173* | 0.030 | 0.190 | - | - | - | - | ||||||||||||||||||||||||||
工业用地比 | -0.089 | -3.638* | 0.025 | -0.166 | -0.069 | -3.751* | 0.018 | -0.170 | ||||||||||||||||||||||||||
土地混合利用 | -0.127 | -5.116* | 0.025 | -0.231 | -0.078 | -3.601* | 0.022 | -0.164 | ||||||||||||||||||||||||||
路网密度 | 0.010 | 11.355* | 0.001 | 0.466 | 0.008 | 12.390* | 0.001 | 0.497 | ||||||||||||||||||||||||||
地铁站点 | 0.041 | 3.997* | 0.010 | 0.182 | 0.054 | 5.898* | 0.009 | 0.263 | ||||||||||||||||||||||||||
建筑物占地密度 | 0.210 | 3.265* | 0.064 | 0.150 | - | - | - | - | ||||||||||||||||||||||||||
R2 | 0.678 | 0.542 | ||||||||||||||||||||||||||||||||
调整后R2 | 0.674 | 0.538 | ||||||||||||||||||||||||||||||||
AIC | -996.712 | -1 082.640 | ||||||||||||||||||||||||||||||||
SC | -963.439 | -1 057.690 | ||||||||||||||||||||||||||||||||
注:*表示0.001置信水平。 | ||||||||||||||||||||||||||||||||||
表选项
1.4 空间自回归
线性回归分析没有考虑活力的空间自相关性, 也没有考虑建成环境因子的空间分布, 难以进一步揭示建成环境对城市活力的空间影响, 因此, 本文利用空间自回归模型, 进一步揭示建成环境对城市活力的空间作用。其公式为
式中, y是因变量; ρ为空间滞后项的W1y系数; X为自变量; β为自变量的回归系数; μ为随机误差项; ε为服从均值为0、方差为δ2的随机误差; W1和W2分别为因变量和残差空间趋势的权重矩阵; λ为空间误差项的回归系数。
根据式(7)中参数设置不同, 可以产生3种空间自回归模型, 包括空间滞后回归模型、空间误差模型和空间杜宾模型[26]。
(1) 当ρ≠0, λ=0时, 即为空间滞后回归模型(spatial lag model, SLM)。空间滞后回归模型考虑因变量的空间相关性。在本文中含义为:TAZ内的活力不仅受到相关驱动因子的影响, 还受到其周围TAZ活力的影响。即考虑了活力的空间自相关性。
(2) 当ρ=0, λ≠0时, 即为空间误差模型(spatial error model, SEM)。空间误差模型考虑拟合误差的空间相关性。在本文中其含义为:TAZ活力不仅受到相关驱动因子的影响, 还受到周围TAZ活力拟合误差的影响。
(3) 当ρ≠0, λ≠0时, 即为空间杜宾模型(spatial durbin model, SDM)。空间杜宾模型不仅考虑因变量和误差的空间自相关性, 还将自变量的空间趋势效应纳入模型。公式为
式中参数与式(7)中一致, W3为自变量空间趋势的权重矩阵; β2为该项回归系数。
根据应用情况, 空间自回归模型的选择不同。考虑到因变量的空间自相关性, 本文对两种活力指标进行Moran’s I检验, 见表 2。结果表明, 两种活力指标具有显著的空间自相关性。除此之外, 利用GeoDa软件计算得出POI密度、签到密度的空间回归残差的Moran’s I值分别为0.071和0.096, 并通过0.1%的显著性检验。该结果表明两种空间回归残差的空间自相关性并不显著。因此, 本文选择空间滞后回归模型对两种活力指标与建成环境因子的关系进行分析。空间自回归分析中同样构建了两个模型, 因变量仍是归一化的POI密度(表 4模型3)和签到密度(表 4模型4)。空间自回归中自变量的选择以线性回归结果为参考, 即由上述经逐步多元线性回归剔除后的变量。
表 2 莫兰指数检验结果Tab. 2 Results for the Moran's I test
活力指标 | 莫兰指数值 | Z值 | P值 |
POI密度 | 0.3491 | 18.36 | 0.001 |
签到密度 | 0.3761 | 20.99 | 0.001 |
表选项
表 4 空间自回归分析结果Tab. 4 Estimation results for spatial autocorrelation regression models
项目 | 模型3:POI密度活力 | 模型4:社交媒体签到密度活力 | |||||||
系数 | z值 | p值 | 标准差 | 系数 | z值 | p值 | 标准差 | ||
空间滞后项 | 0.187 | 3.473 | 0.000 | 0.053 | 0.370 | 6.623 | 0.000 | 0.055 | |
常量 | -0.022 | -1.560 | 0.118 | 0.014 | -0.015 | -1.178 | 0.238 | 0.012 | |
商业用地 | 0.374 | 7.592 | 0.000 | 0.049 | 0.332 | 7.808 | 0.000 | 0.042 | |
住宅用地 | 0.126 | 4.339 | 0.000 | 0.028 | - | - | - | - | |
工业用地 | -0.072 | -2.954 | 0.003 | 0.024 | -0.038 | -2.056 | 0.039 | 0.018 | |
土地混合利用 | -0.118 | -4.825 | 0.000 | 0.024 | -0.057 | -2.716 | 0.000 | 0.020 | |
路网密度 | 0.009 | 8.491 | 0.000 | 0.001 | 0.006 | 8.064 | 0.000 | 0.000 | |
地铁站点 | 0.035 | 3.390 | 0.000 | 0.010 | 0.043 | 4.827 | 0.000 | 0.008 | |
建筑物占地密度 | 0.236 | 3.743 | 0.000 | 0.063 | - | - | - | - | |
R2 | 0.687 | 0.579 | |||||||
AIC | -1 005.520 | -1 113.690 | |||||||
SC | -968.088 | -1 084.580 |
表选项
2 试验与结果分析2.1 研究区域与试验数据
本文试验区域位于深圳市。深圳市下辖8个行政区(图 1), 总面积达1996 km2, 其中, 罗湖和福田是最早发展的中心城区, 与南山和盐田共同组成了早期的经济特区。2010年之后深圳经济特区不断扩大到现有辖区。深圳经济社会发展水平存在较大差异, 原特区(罗湖, 福田, 南山)是科技、金融和教育发展的中心, 人口集中分布; 而其他行政区则是工业、制造业较为发达, 人口分布较为稀疏。
图 1 深圳市行政区划Fig. 1 Districts of Shenzhen |
图选项 |
本文采用了地理标签数据包括POI数据和社交媒体签到数据, 均覆盖深圳全市。POI数据来自大众点评和高德地图, 共计168 775条POI, 截止时间为2015年。POI类别包含了餐饮、公司、购物、居民、服务、学校、娱乐等。每条POI数据包含经纬度、名称、地址、类别等字段。社交媒体签到数据是通过新浪微博API进行抓取, 覆盖时段为2014年1—12月。签到数据经过预处理, 最终试验所得微博签到量为798 789条。尽管POI数据和社交媒体数据具有1年的时间差, 由于深圳自2010年后进入了稳定发展期, 城市空间发展变化较小, 因此, 数据的时间差是可以接受的。相关土地利用数据和建筑物数据来源于深圳市规划和国土资源管理委员会。路网数据来源于OpenStreetMap(OSM)地图。深圳市被划分为491个TAZ, 由于部分TAZ由山体、湖泊等覆盖, 缺乏研究意义。经剔除后试验最终保留了473个TAZ。
2.2 深圳市活力分布模式
基于POI数据和社交媒体签到数据的深圳市活力空间分布模式分别如图 2(a)和(b)所示。图 2(c)和(d)表示了活力的热点分布。0表示聚类不显著的TAZ, 1、2、3分别代表了0.1、0.05和0.01置信水平下的空间高值聚类。试验结果表明:深圳市活力空间分布整体上呈现“南强北弱, 西强东弱”规律。POI数据指示的城市活力在空间上的高值分布较为连续, 从深圳南部逐渐向北部扩散。图 2(a)表明POI数据指示的城市空间活力在南山、福田、罗湖以及宝安、龙华和龙岗等地出现了多个高活力值聚集中心。其中, 罗湖区拥有最多高活力值区域, 包含7个POI密度值超过1 129.6的交通小区。福田、南山以及宝安分别拥有2个、2个和1个。高POI密度值也零散分布在龙岗、龙华等地区。上述活力中心与深圳市城市总体规划(2010—2020年)描述一致, 即规划确定福田-罗湖中心, 前海中心以及龙华、龙岗副中心。由图 2(c)进一步可知, POI密度表现的活力在罗湖、福田、南山以及宝安呈现“高-高”分布模式, 即高值相互围绕; 龙华和龙岗出现“高-低”分布模式, 即高值被低值围绕。
图 2 城市活力分布Fig. 2 Distribution of urban vibrancy in Shenzhen |
图选项 |
图 2(b)表达了社交媒体签到数据表征的城市活力, 结果表明:罗湖、福田仍出现高活力值聚集中心。罗湖区拥有最多高活力值区域, 3个TAZ的活力值超过10 236.9。福田区则拥有2个高活力TAZ, 南山区则拥有2个较高活力值区域。其他地区并无显著活力值出现。由签到密度发现的城市活力中心区仍然符合深圳市城市总体规划(2010—2020)。图 2(d)进一步表明在罗湖、福田以及南山地区, 由签到密度表征的城市活力呈现高度聚集现象, 存在“高-高”分布模式。因此, POI密度和社交媒体签到密度能够有效揭示城市活力。
两种地理标签数据表征的城市活力分布也存在空间差异。社交媒体签到数据揭示的城市活力在空间上的分布具有明显的“活力断层”现象。即多数高活力值TAZ出现在经济发展中心区, 而其他地区活力值呈低迷状态。POI揭示的活力在空间上“连续”分布, 经济发展中心区和郊区都出现高活力值区域。两种活力的空间聚集也存在差异。在POI密度活力中, 该现象发生在罗湖、福田和南山以及部分郊区。在签到密度活力中, 该现象只发生在罗湖、福田和南山。
进一步地, 表 2则给出了两种城市活力的莫兰指数。基于POI和社交媒体签到数据的城市活力的莫兰指数值分别为0.349 1和0.376 1。两种城市活力均具有显著空间自相关性。Z值检验和P值表明两种城市活力指标的空间自相关性特征具有统计学上的显著性。因此, 采用空间自回归模型分析建成环境对城市活力的影响是合理的。
2.3 线性回归分析
考虑到自变量之间的相关性, 本文首先进行共线性分析, 剔除高度相关的自变量, 最终保留的变量分别为:商业用地比、住宅用地比、政府用地比、工业用地比、土地利用熵、路网密度、地铁站点密度和建筑物占地密度。
表 3为多元线性回归结果, 给出自变量系数, t统计检验和R2等。结果表明:对城市活力具有显著影响的建成环境因素共有7个, 即商业用地、住宅用地、工业用地、土地混合利用、道路网络覆盖、地铁站点和建筑物占地密度。调整后R2表明建成环境因素对基于POI和签到数据的城市活力的解释率分别为67.4%和53.8%。建成环境对签到数据表征的城市活力解释率较低。t统计量绝对值最小为3.265, 置信水平达95%。AIC(Akaike information criterion, Akaike信息准则)和SC(Schwarz criterion, 施瓦茨准则)值较小也表明多元线性回归模型的有效性。
观察试验结果发现, 建成环境对两类城市活力的影响存在共性特征。其中, 均具有显著性作用的建成环境因素共有5个, 即商业用地、工业用地、土地混合利用、路网密度以及地铁站点密度。商业用地、路网密度和地铁站点的影响系数为正值, 表明这3种因素对城市活力具有积极促进作用。该结果与相关学者的研究结论相一致[15, 18, 20]。未来城市建设中投入更多的商业用地、更大的路网密度、较多的地铁站点能够提升城市活力。其中路网密度的偏相关系数最大, 修建更多的道路对改善城市活力的作用最为显著。与之相反, 工业用地和土地混合利用对两种活力的影响系数为负值, 即提高工业用地比例、增加土地混合利用程度会导致城市活力下降。当工业用地增加, 居民多生活在工厂附近从而使社会活动减少进一步导致活力下降。而土地混合利用对活力的负面影响可能与其量化方式有关。以香农熵形式表征的土地混合利用在文献[21]的研究中也表现出了消极作用。
然而, 研究结果表明建成环境对不同数据指示下城市活力的影响存在差异。其中, 住宅用地对基于POI的城市活力具有显著促进作用, 但是对基于签到数据的城市活力无作用效应。常见城市基础设施往往围绕住宅小区分布。因此住宅用地的增加会吸引大量POI入驻, 从而使POI表征的城市活力上升。而签到数据偏向娱乐、购物、运动等社会性活动, 受到住宅用地的影响较小。建筑物占地密度对两类城市活力的作用也具有相似的特征。文献[2]认为高密度环境与活力的维系高度相关。本文结果进一步表明建筑物密度与POI数据指示下的活力高度相关, 而对签到密度表征的活力无影响。增加建筑物能够吸纳更多的城市人口, 导致对城市服务的需求提升, 产生更多的POI。但是签到密度往往与建筑物的功能有关, 受建筑物密度的影响不大。
2.4 空间自回归
经逐步线性回归得到活力的主要影响因子, 进而表 4给出了空间滞后回归模型分析结果。两种空间滞后回归模型的R2分别为68.7%和57.9%, 说明了空间滞后回归模型的有效性。模型解释率较线性回归模型分别提高了2.0%和7.6%。空间滞后回归分析结果中, AIC和SC值越小则表明回归模型的拟合效果越好[13]。AIC和SC值较线性回归结果分别降低了0.9%、2.9%和0.5%、2.5%, 说明空间滞后回归模型优于线性回归模型。因此, 空间滞后回归模型能够更好地揭示建成环境对城市活力的影响机制。
空间滞后回归项系数表达了城市活力受其空间依赖性影响的程度。在模型3和模型4中, 空间滞后回归项系数分别为0.187和0.370, 显著性水平为p=0.000, 这表明区域活力受到邻近区域活力的影响程度较大, 且均为正向作用。基于签到数据的城市活力的空间滞后回归项系数显著大于POI, 表明其空间自相关性对签到密度指示下的城市活力的影响程度较大。
空间滞后回归结果中各因子对活力的影响正负无变化。再次说明了线性回归结果的可靠性。同时表明建成环境因子对城市活力的正负影响具有恒定性。商业用地、路网密度、地铁站点始终与活力正相关, 工业用地、土地混合利用始终对活力具有消极影响。
与多元线性回归模型相比, 空间滞后回归模型中商业用地的作用系数值分别上升了0.004和0.001。考虑到邻域活力的作用, 商业用地每增加一个单位, 基于POI的城市活力增加到0.374倍, 基于签到密度的活力增加到0.332倍。商业用地的积极作用效应进一步强化。类似地, 住宅用地对基于POI的城市活力的促进作用也明显增强。相反, 工业用地对两种活力的作用程度降低。工业用地增加, 基于POI的活力受其减弱程度由0.089倍降低至0.072倍, 基于签到密度的活力减弱程度由0.069倍降至0.038。因此, 不考虑活力空间自相关性会放大工业用地对活力的负面效应, 影响政府决策。同时, 工业用地对签到密度活力的作用受到活力空间自相关性的影响较大。从线性回归到空间滞后回归, 工业用地对两种活力的作用系数分别波动了0.017和0.031, 对签到密度活力的影响波动约为POI密度活力的一倍。土地混合利用对活力的作用特征与工业用地相似。空间滞后回归中, 土地混合利用的作用系数发生了降低。而对签到密度活力的作用系数波动仍然大于POI密度。
路网密度对两种活力的作用系数值降低, 但并不显著, 表明路网密度对城市活力的影响具有稳定性。但地铁站点的作用系数明显降低, 对签到密度活力的作用波动是POI密度的0.83倍。建筑物占地密度对POI密度活力的作用系数值比线性回归模型中增大了0.026, 表明建筑物占地密度对POI密度活力的显著作用力。再次契合了Jacobs的结论。综上, 空间滞后回归分析结果表明:线性回归分析在剖析环境因子对活力的正负影响方面具有可靠性, 而因子作用强度分析结果却存在非准确性, 若不考虑活力的空间自相关性可能会导致高估或低估因子作用强度从而造成结果偏差。
3 结论与讨论
城市发展不平衡会带来各种问题, 如公共设施分配不公平、人群分布离散而造成空城或拥挤。因此, 掌握城市发展现状, 解决空间发展失衡所带来的城市活力下降问题至关重要。从城市空间感知角度, 本文利用兴趣点(POI)和社交媒体签到数据构建了活力的两种指标和11种建成环境指标, 进而通过线性回归模型(OLS)和空间自回归模型分析建成环境对城市活力的影响特征。
试验结论如下:不同数据表征的城市活力存在空间分布相似性和差异性。深圳活力空间分布呈现“南强北弱, 西强东弱”规律, 表现出明显的空间非平衡性。POI表征的活力在空间上连续分布, 从原经济特区到郊区都出现了高活力中心位置。而社交媒体签到数据表征的活力两级分化明显。高活力中心只出现在发达的原经济特区。
深圳市活力主要受到土地利用和城市交通影响。其中, 商业用地、路网密度和地铁站点对活力具有显著促进作用。工业用地和土地混合利用则表现出消极作用效应。针对工业发达地区活力改善问题, 如龙华, 龙岗等, 应着重考虑增加商业用地, 路网布设以及地铁站点增密; 针对商业、交通发达地区, 如原经济特区, 可以通过减少工业用地的比重和土地利用的混合度提高活力。一些建成环境因素只对某种活力指标有影响。住宅用地和建筑物密度只对POI密度活力具有积极作用而对社交媒体签到密度无影响。城市规划中针对不同方面的活力应制定不同的改善策略。
本文研究精准感知城市活力现状, 协助制定稳健的城市活力提升政策。本文的对比分析框架还可适用于其他数据, 如手机信令数据等。目前, 本文只采用了POI数据和社交媒体签到数据来感知城市活力。在今后的研究中将利用更多的城市数据来感知城市活力, 并揭示多维城市活力与社会经济因素之间的关系, 实现综合性的深度城市活力理解。同时, 城市规模和功能定位对城市活力空间分布有重要影响。需要进一步将本文研究拓展至其他城市, 验证城市活力分布规律及其影响机制的普适性。最后, 尺度是空间分析的重要因素。城市活力感知中的可塑性面积单元问题也有待研究。
【引文格式】朱婷婷, 涂伟, 乐阳, 等. 利用地理标签数据感知城市活力. 测绘学报,2020,49(3):365-374. DOI: 10.11947/j.AGCS.2020.20190051
精
彩
回
顾
精
彩
回
顾
姚宜斌 l《测绘学报(英文版)》(JGGS)精选论文
论文推荐 | 施闯:北斗广域高精度时间服务原型系统
PPT | 刘先林院士:新时代 新测绘
资讯 | 工程硕博培养模式将迎新变化,工程博士被特别关注
SCI论文经典词和常用句型
重温经典 | 宁津生:基于卫星加速度恢复地球重力场的去相关滤波法
权威 | 专业 | 学术 | 前沿
微信投稿邮箱 | song_qi_fan@163.com
微信公众号中搜索「测绘学报」,关注我们,长按上图二维码,关注学术前沿动态。
欢迎加入《测绘学报》作者QQ群: 751717395
进群请备注:姓名+单位+稿件编号
权威 | 专业 | 学术 | 前沿
微信投稿邮箱 | song_qi_fan@163.com
微信公众号中搜索「测绘学报」,关注我们,长按上图二维码,关注学术前沿动态。
欢迎加入《测绘学报》作者QQ群: 751717395
进群请备注:姓名+单位+稿件编号