0
1
文章导读
人员流动是我们社会的基础:它促进社会、经济和文化交流,塑造城市,造成交通拥堵和污染,并助长了传播。传染病。对于所有这些方面,重要的是不仅要了解有多少人从一个地方移动到另一个地方,还要了解他们这样做的频率。事实上,由于地方因工作、购物或娱乐等多种原因吸引个人,流动性通量跨越了广泛的时间和空间尺度,从同一社区的日常访问到需要穿越的千载难逢的访问大陆。正是这种旅行的异质性决定了来自世界不同社区、地区或部分的个人共享同一空间并可能相互互动的速度。
然而,尽管如此重要,我们对个人流向地点的理解仍然令人惊讶地不完整。现有的大规模流动性研究和最先进的模型——例如重力定律、辐射模型和相关方法——关注人口流动的空间依赖性(例如,在两个地点之间旅行的总人数),不考虑与不同访问频率相关的反复流动;也就是说,一个地点的访客数量如何取决于他们的访问频率的问题在很大程度上仍未得到解答。与此同时,细粒度的型号为个人的移动行为-如勘探和优惠回报(EPR)模型或最近提出的容器模型——再现单个人访问不同地点的频率。然而,这种微观行为与整个种群产生的循环流动通量的时间谱之间的联系缺失。这种对流动时间谱的无知可能导致对个人空间混合的误解,从而可能对减缓流行病传播、城市规划、基础设施设计和许多其他应用产生深远的实际影响。
在这里,我们解决了这个差距,并将个人流量分解为旅行距离和访问频率的潜在分布,使我们能够同时考虑移动通量的空间和时间谱。我们找到了一个强大的缩放定律,该定律根据他们旅行的距离和访问的频率来控制任何位置的访客数量。微观模型表明,所发现的标度律与个体流动的 EPR 机制非常吻合,在个体层面的周期性运动与由此产生的人口层面的流动之间建立了联系。访问法为准确预测地点之间的流量开辟了前所未有的可能性,并且它为人文地理学中已经建立但大部分未经检验的猜想(即中心地理论(CPT)和韦伯的涌现最优理论)提供了大规模的实证支持。我们的研究结果是基于对全球高度多样化城市地区数百万匿名手机用户的移动数据分析得出的:美国大波士顿(北美)、里斯本、葡萄牙(欧洲)的波尔图和布拉加、新加坡(亚洲)、塞内加尔的达喀尔(非洲)和科特迪瓦(非洲)的阿比让。
0
2
文章摘要
人口流动性影响一个城市的许多方面,从它的空间结构到其响应于流行性。这也是最终关键的社会交往,创新,和生产效率。然而,我们对个人总体运动的定量理解仍然不完整。现有模型——例如重力定律或辐射模型专注于流动性的纯粹空间依赖性,不捕捉反复访问同一地点的不同频率。在这里,我们揭示了一个简单而强大的缩放定律,它根据来自全球不同城市的大规模流动数据来捕捉人口流动的时空谱。根据这个定律,任何地点的游客人数都随着他们的访问频率和旅行距离的乘积的平方的反比而减少。我们进一步表明,流向不同位置的时空流会产生突出的空间集群,其面积分布遵循齐夫定律。最后,我们建立了一个基于探索和优先回报的个体移动模型,为发现的尺度规律和新兴的空间结构提供了机械解释。我们的发现证实了人文地理学中长期存在的猜想(例如中心地理论和韦伯的紧急最优理论,并允许预测循环流动,为城市规划、交通工程和减轻流行病的应用提供基础。
0
3
研究问题
人类流动的普遍访问规律是怎样的?
0
4
研究方法
过往对人类出行规律的研究
预测人们在城市内和城市间的移动模式、出行规律,对于交通设计、城市规划和流行病建模等各研究领域都非常重要。物理学家、圣塔菲研究所前任所长Geoffrey West认为,我们面临的所有问题,特别是气候变化,都是在城市里产生的,因为那里有人。因此,了解城市以及人们是如何在城市中活动,对于这个星球上生命的未来有着根本性的影响。
给定两个地点,如何预测两地间会有多少人出行?对于这个问题,科学界早有关注。早在1885年,地理学家 Ernst Ravenstein 就凭经验指出,有两个关键因素可以解释两地之间往来的个体数量:两地间的距离、来源地和目的地的社会经济属性。例如,出行者的数量往往随着距离的增加而减少,而人口密集(更有社会经济活力)的地方吸引了更多的人前往。
这一经验此后被归纳为人类出行的“引力模型”(gravity law),其表达式类似于万有引力公式,即两个城市之间旅行者数量与两个城市的人口数的乘积成正比,与两地之间的距离的平方(或其他幂律以及指数函数形式)成反比。此后在引力模型的基础上,还发展出了介入机会模型(intervening opportunities model)、辐射模型(radiation model)、矢量场模型(field model)等。
近年来随着大数据的积累,数据的空间和时间分辨率变得越来越精细,通过手机GPS可以收集到实时的出行轨迹数据,为我们研究出行规律提供了数据基础。与此同时,利用人口移动数据支持流行病防控和城市基础设施规划等方面的需求也在不断提高。在上述背景下,人类出行规律的研究一直是过去十多年的研究热点,在新冠疫情期间更为明显。
频谱人口流动的距离-频率标度
为了探索经常性人口流动的空间和时间分量,我们将每个地理区域划分为一个高分辨率方形网格(根据数据集的粒度,我们对大波士顿和新加坡使用了 500 m × 500 m 的单元格,对于大波士顿和新加坡使用了 1 km ×所有其他区域的 1 km 小区)并估计每个手机用户的家庭位置,被定义为用户在夜间度过大部分时间的网格小区。然后,我们为每个位置i确定了访问相应小区的唯一用户集,并根据其家乡位置的距离r将它们分组(使用等长 δ r = 1 km 的距离箱,图1a)并根据他们的访问频率f。最后,为了排除面积大小的影响,因为我们基本上将给定距离的总人口流分解为其基础频谱。我们现在证明ρ i ( r , f ) 不分别依赖于r和f ,而是依赖于单个重新缩放的变量rf。
图 1:人口流动的普遍距离-频率分布。
a,对于每个位置,我们计算居住在 [ r , r + δ r ) 距离且以f频率访问的访客数量。地图颜色表示从移动电话数据(每个网格单元的用户数)得出的人口密度。b , 对于固定频率f,特定位置的访客流量ρ_i ( r , f ) 随着距离r 的增加而减少。c , 当保持距离r固定时,流量同样随着频率f 的增加而减少。d, 重新调整后的值折叠在一条曲线上,使流量仅依赖于单个变量rf。整个距离-频率分布可以通过幂律很好地描述,其中指数η ≈ 2η是最佳拟合线的斜率最小二乘法;括号中的标准误差)。电子,重新调整所有研究区域的流量,表明相同的比例关系适用于全球完全不同的城市区域。符号是每个地区所有位置的平均值。为了直观地比较不同的世界区域,通过对每个单独位置的距离-频率分布进行归一化来叠加显示的曲线。
作为发现的访问定律的直接结果,我们期望每个访问者在一段时间内到达给定目的地 i 的有效距离⟨d⟩i 不依赖于该位置的吸引力 μi。更准确地说,图 2 证实了在跨空间统计上是不变的,因此每个访客和时间单位的有效行进距离构成了一个守恒量。这种不变性可能令人惊讶,因为这意味着更具吸引力的地方仅在接待的访客数量更多方面有所不同。然而,正如人们所期望的那样,它们并没有增加每位游客的有效旅行距离。
图 2:每位游客的恒定有效旅行距离。
a – f,平均有效距离,个人随着时间的推移访问给定位置i在很大程度上是跨空间不变的,并且与该位置的吸引力无关(就游客人数而言)大波士顿 ( a )、新加坡 ( b )、达喀尔 ( c )、阿比让 ( d ) 和里斯本 ( e )。如散点图 ( f )所示,访客数量与每位访客平均距离之间的R^2非常小(大波士顿,R^2 = 0.0115;新加坡,R^2 = 0.0298;达喀尔,R^2< 0.001;阿比让,R^2< 0.001;里斯本,R^2= 0.001)。请注意,有一些“异常”位置与较大的有效行驶距离相关。在大多数情况下,这些地点与港口(例如新加坡和达喀尔)或旅游景点(里斯本)相对应,因此具有吸引特别远的游客的内在原因。
吸引力的空间分布
位置相关吸引力μ i的空间分布,通过等式(1)的对数转换值的线性回归从数据中获得,描绘在大波士顿的图3a中。我们观察到突出的空间集群,其中具有较高μ i值的较大集群(例如波士顿市)往往被具有较低μ i值的较小集群包围。这种中心和次中心的形成与有关城市结构的文献以及先前城市流动性的实证研究,很大程度上是由城市的集聚效应(即企业和设施的集群趋势)来解释的。为了根据其面积来表征这些集群的大小分布,我们应用了城市聚类算法 (CCA) 。首先,所有小于最小值μ * 的吸引力值都设置为零。其次,在空间上连续的具有非零值的位置被递归地合并,直到具有非零值的所有位置都属于一个特定的簇。我们确定的阈值μ *由最大的簇的区域的比率密谋形成为不同的所有集群的面积的总和μ *(图3b中),提供一个临界值μ *,其中比率最小。该值标志着单个巨型星团出现的开始,因此可以作为μ *的自然选择。然后我们按它们的面积对集群进行排名,因此 Rank = 3 代表第三大集群,并发现面积分布很好地近似于 Size ∝ Rank ζ,秩大小指数ζ = -1.17(图3d) . 这表明集群的面积分布遵循齐普夫定律(指数约为 -1),这是城市科学中的一个基本规律,通常适用于城市的人口和面积分布。
图 3:特定地点吸引力的空间结构。
a,大波士顿地区吸引力值μ i 的地理分布。b,最大空间群集的所有空间聚类与最小阈值吸引力面积率μ作为通过CCA衍生。对于非常小的μ *值,整个地理区域合并为一个集群(导致面积比约为 1)。相反,对于非常大的μ *值,将只存在一个集群(波士顿市中心)(再次导致比率约为 1)。c , 在μ * ≈ 10^ 0.5临界值处检测到的簇,其中最大簇的面积比最小化(b 中的垂直虚线)。不同的簇用不同的颜色表示。d,μ *临界值处的等级大小分布。与齐普夫定律一致,数据很好地近似于指数ζ = -1.17 的幂律。
光谱人口流动的微观模型
我们的实证分析表明 (1) 流向地点的时空人口流动遵循高度可重复的缩放规律,以及 (2) 尽管这些流动的大小在不同地点之间差异很大,但它们显示出系统的空间聚类。我们现在提出一个模型,该模型根据个人的移动行为预测这两个关键观察结果。为了捕捉个人移动的主要机制,我们使用众所周知的 EPR 模型作为起点。在每个时间步,个体以一定的概率选择探索一个新的、以前未访问过的位置,或者以互补的概率返回到先前访问过的位置之一(偏好那些位置主体访问更频繁)。如果智能体决定探索一个新位置,这种位移的径向距离 Δ r来自重尾跳跃大小分布P (Δ r ) ~ |Δ r | −1− α位移指数α ≈ 0.55,而方向(角度)θ是从均匀分布P ( θ ) ~ (2π) 中得出的−1,其中 ~ 表示“分布为”。规则方形网格上的一组主体的数值模拟表明,EPR 模型确实生成了到各个位置的流量的距离 - 频率缩放,缩放指数为η ≈ 2,这与经验观察。然而,由于主体相互独立地选择他们的位置,EPR 模型无法重现位置吸引力及其系统空间聚类的异质性。实际上,个体的轨迹不是独立的,而是通过共同的吸引力点在空间上耦合的41:人们倾向于去其他人经常光顾的热门场所(例如,购物区)。因此,通过忽略主体运动的这种耦合,EPR 模型生成的吸引力值μ i在空间中相当均匀和均匀,与经验观察(图3a)存在系统冲突。
为了解决这种差异,我们在模型中耦合了主体的运动,以便在探索新位置时,他们优先被吸引到经常光顾的区域。为此,径向跳跃距离 Δr 仍然从与原始 EPR 模型相同的分布中采样,但方向 θ 不再随机均匀绘制。相反,优先选择朝向高访问区域的方向如下。对于给定的单元格 i,d~i(θ;R) 是所有主体行进到距离 R 内以及角度 θ 和 θ + dθ 之间的所有单元格的有效距离(因此量 d~i 测量了每个方向上的单元格(就主体的旅行努力而言))。然后从单元 i 开始的主体从分布 P(θ;R,ν)∼d∼i(θ;R)ν 中采样 θ,参数 ν ≥ 0(图 4a)。我们将 EPR 模型的这种修改称为优先勘探和优先回报 (PEPR) 模型(Pappalardo 等人提出了一种优先勘探的替代机制。然而,它强加了引力定律,因此假定聚合行为,基于主体的运动)。模拟(图 4b-f)表明 PEPR 模型不仅生成具有正确缩放指数的频谱流的距离-频率缩放,而且导致形成遵循区域分布的清晰空间集群,该区域分布在数量上与数据。请注意,模型集群的确切空间布局与经验数据不同,因为当前的模型设置忽略了许多可能影响人类住区发展的复杂性,例如自然资源、河流和地形。但是,这些因素可以集成到未来的模型扩展中。
图 4:光谱人口流动的微观模型
a,PEPR模型示意图。在每个时间步,个体决定以概率P new探索以前未访问过的位置。此位移的径向距离 Δ r和方向θ来自随机分布,这些分布捕捉了人类轨迹的特征跳跃大小分布和探索流行区域的倾向。主体以概率 1 - P new返回到先前访问过的位置。b – f,在规则方形网格上n a = 10^5 个主体的结果(参数α = 0.55,σ = 0.6 和γ = 0.21 根据现有测量和R = 10 和ν = 4 实验确定)。面板b、c显示了通过模型的数值模拟获得的谱流,并在所有分析的网格单元上取平均值,展示了经验观察到的人口流的缩放特性;也就是说,它们服从等式(1),并且尺度为旅行距离和访问频率的平方反比。与经验结果一致,该模型产生了那些吸引大量个体的细胞的空间聚类(d),而每个主体和时间单位的有效旅行距离在空间上保持不变 ( e )。空间集群的面积分布遵循 Zipf 定律(通过将阈值μ * = 10的 CCA 应用到总共 50 个模型实现中,导致幂律缩放,指数ζ = -1.14 ± 0.13 (sd) ),这再次与数据 ( f ) 一致。
预测起点-终点流量
等式(1)意味着流向任何位置的整个距离-频谱的大小原则上可以通过知道通用标度曲线上的一个点来获得。这种简化为预测每对位置之间的各种流量开辟了广泛的可能性。一旦确定了μ j的值,就可以直接计算来自任何来源位置的旅行次数或唯一访问者的数量。这些预测与数据非常吻合(图5)。除了人口密度之外,其他输入量(例如简单的交通计数)也同样适用。
图 5:预测各个位置之间的流量。
a,与基于rf缩放框架的预测相比,根据重力定律和辐射模型得出的观察到的波士顿 Back Bay West 旅行的预测。符号是每个 bin 的平均值,线是 0.1–0.9 分位数。虚线对应于观测值和预测之间的完美一致性,清楚地表明rf缩放框架系统地优于现有模型。每个模型的性能基于 SSI 进一步量化,如果存在完美匹配,则 SSI = 1,如果根本没有匹配,则 SSI = 0。b , 独立访客数。重力定律的拟合参数由行程次数(a) 不允许预测个体数量。辐射模型也不提供对访客数量的预测,因为它只为每个人分配一个目的地位置。因此无法明确考虑一个人可能访问多个不同地点的事实。c、高频访客数。d,对所研究的世界区域中所有考虑位置的旅行次数 ( t )、游客数量 ( v )、高频游客数量( h ) 和低频游客数量 ( l ) 进行系统比较。重力模型(针对t校准)和辐射模型无法预测v , h或l。该RF缩放克服了这一限制。
为了将这些预测与现有方法的准确性联系起来,我们将它们与重力模型和辐射模型的预测进行了比较,它们是目前最广泛使用的总体人口流动流动模型。这些已建立的方法没有考虑流量的频率分量。因此,重力模型需要针对每个特定流量进行单独的参数校准,因此了解行程次数并不能推断出随着时间的推移实际有多少独特的个体正在访问一个位置,反之亦然。类似地,由于每个人可能会多次前往多个地点,因此辐射模型可以预测旅行次数,但不能预测随着时间的推移访问某个地点的独特个人的数量。这种对频谱的无知可能导致关于人的空间混合的有偏见的结论,具有潜在的深远影响,例如,对于了解传染病的传播。我们的框架解决了这个限制。图 5a,再次使用波士顿的 Back Bay West 作为说明性示例),它允许同时预测整个频谱范围内的旅行次数和个人数量,而无需模型校准(图5b,c) . 这里考虑的所有世界区域的起点-终点流量预测凭经验证实了我们框架的增强性能(图5d)。
0
5
结论
鉴于关于城市运动和交通的大量文献和详细分析,令人惊讶的是,这里推导出的简单而强大的访问定律尚未被发现。它指出,任何位置的游客数量都与旅行距离和访问频率的平方成反比,从而通过流量频谱促进了我们对人类流动性的理解。我们已经证明,不同地域、文化和发展水平的尺度关系非常稳健,并且与我们对个人流动模式的最新理解是一致的。
这种关于人类流动性的新视角使人们有可能仔细审查人文地理学和空间经济学中长期存在的猜想。事实上,访问的距离-频率分布证实了众所周知的 CPT 背后的几个关键想法,到目前为止,这些想法难以测试。例如,我们的结果支持位置嵌套层次结构的存在(图1、图3),其中具有专业功能的高阶中心(例如购物中心和博物馆)——反映在较低的访问频率——也包含低阶中心的非专业功能(例如,杂货店和餐馆),反映在较高的访问频率。因此,更专业的功能不仅与较低的访问频率相关,而且与更大的服务半径相关(即人们走得更远)。我们的数据再次支持这一点,表明每次访问的平均旅行距离与访问频率成反比。
这里一个有趣的问题是,正如 CPT 和人文地理学中的其他理论所假设的那样,所揭示的访问模式与吸引地点的最有效空间配置的接近程度。为此,我们计算了空间经济中使用的 Fermat-Torricelli-Weber度量。该度量为每个吸引位置确定了当将位置移动到另一个地理位置时所有访客行进的有效距离的潜在减少。有趣的是,我们发现对于大多数地点来说,不可能显着降低游客的有效出行距离,这表明这些地点的当前空间配置在交通效率方面接近最佳。尽管博弈论表明集体人类行为通常是非理性的,并且与社会期望的结果相去甚远,但这一结果表明,当涉及到旅行努力时,人类能够实现最佳的群体行为。
从实践的角度来看,我们已经表明,发现的访问定律为准确预测不同频率的经常性人口流动开辟了新的可能性,为交通工程、城市规划和流行病控制提供了直接应用。在未来的工作中,这些预测可以通过在一个位置的特征和经常访问的频率之间建立详细的联系来进一步完善。
0
6
原文信息
原文题目:
The universal visitation law of human mobility
原文作者:
Schläpfer et al.
期刊名:
nature
发表时间:
2021/05
原文链接:
https://www.nature.com/articles/s41586-021-03480-9
编 辑:石海明
审 核:郭纳良
指导老师:吴 锋