查看原文
其他

学术成果|城市出租车的运营模式及交通供需关系探寻

未名时空 2021-09-20
内容导读

出租车在城市公共交通中扮演了重要角色。为了满足市内交通需求,出租车司机们形成了特有的运营模式,识别这些模式有助于理解和改善城市公共交通服务和发展规划。本期,我们将与康朝贵老师一同探寻出租车运营模式以及城市交通背后潜在的供求关系。       

康朝贵

武汉大学遥感信息工程学院地理信息工程系教师

研究方向:轨迹计算 | 城市信息学 | 人类移动性分析与建模 | 时空统计

个人主页:http://urbancolab.org

工作邮箱:cgkang@whu.edu.cn

康朝贵,武汉大学遥感信息工程学院地理信息工程系教师。本科毕业于南京大学地理信息科学系,2014年12月获北京大学遥感与地理信息系统研究所博士学位。2012年9月至2013年9月曾在麻省理工学院感知城市实验室访问一年;2017年7月至8月前往香港理工大学进行学术访问。在IJGIS、Physica A : Statistics and its Applications等国际知名学术期刊发表论文10余篇。曾获北京市/北京大学优秀博士毕业生、美国地理学家会GISciene奖学金、全国高校GIS新秀等荣誉与奖励。




数据准备



数据集是武汉市6023辆出租车2014.05.01-2014.05.31一个月的GPS轨迹数据,属性包括经纬度、时间、载客状态(空车/载客)、行驶方向、行驶速度。基于上车点和下车点得到了7,627,754条载客出行,接着把每次出行的起始点-目的点{(lon,lat)O,(lon.lat)D}匹配到划分的36个区域的对应区域。区域划分见图1和表1。


Fig 1. 武汉市36个区域划分图


区域划分考虑了行政性和功用性。由于人口聚集,在划分时,中心区域的空间范围要小于外围区域。


Tab 1. 36个区域的名称和编号



研究步骤


01
分割出租车需求区域

以区域为结点,区域间连接为边,区域间连接次数为权重,形成了一个网络(结点数|V|=36,边数|E|=1296),网络的结构图如图2a和2b。我们发现,一些结点(<2:“武昌”>,<5:“武珞”>,<8:“汉口”>,<11:“建设”>,<19:“钟家村”>,<32:“鲁巷”>)聚集了一大部分(约62.8%)出租车出行量。这一发现与汉口和武昌是武汉的两大商业和人口中心一致。进一步,我们用社区发现算法对出租车出行网络分析,探测到6个空间一致性区域,如表2。



Fig 2a. 出租车出行网络结构图


Fig 2b. 出租车出行网络结构一维表示


Tab 2. 出租车出行网络中的6个需求区


C1:整个汉阳区。这个现象有两个原因:(1)汉阳区的相对欠发达性。(2)两条河流将汉阳区与汉口和武昌分隔开来。


C2:东西湖区。此区域相对独立,是由于政策规定其内的出租车只能在区域内出行,因此位于东西湖内的出租车出行量要远远大于它同其他地方之间的出租车出行量。


C3:以<32:“鲁巷”>为中心的武汉东南部区域。在此区域内,“光谷”正在快速发展成为武昌区乃至武汉的子中心。


C4:包含了武汉最大的火车站——武昌火车站,一个重要的出租车出发集聚地。


C5:覆盖了武昌的历史文化区,其内的区域交互具有一致性,并沿着道路在西南方向分布。


C6:汉口中心区,其中<8:“汉口”>吸引了大量出行流量,是武汉市毗邻长江的一个重要商业区。


以上分析表明,出行需求在空间上呈现多中心分布,一个自然的疑问是:出租车如何在个体自组织的基础上,共同运行来满足多中心的需求呢??


为了回答上述问题,我们对出租车在区域间的访问序列进行了研究


02


探测出租车供应区

区域访问序列S:{districtt1,districtt2,...,districttn}可被视作接客点序列,由此可统计每辆出租车在各个区域的接客次数,得到一个6023*36的矩阵M|T|*|V|,6023是出租车数量,36是划分区域数量。用NMF算法(Non-negative matrix factorization)对矩阵做分解M|T|*|V| ≈W|T|*K*HK*|V| 。


相应的consensus.map如图3a,由蓝到红表示一对区域被分到同一聚类的概率增大,聚类出的6个地块D:{D1,D2,D3,D4,D5,D6}即是出租车供应区,同时也表明出租车的出行模式有6个聚类。对比聚类地块D:{D1,D2,D3,D4,D5,D6} 与社区发现得到的6个社区C:{C1,C2,C3,C4,C5,C6} ,有D∩C≈D≈C(见表3),表明出租车出行模式与需求相吻合


Fig 3a. Consensus analysis


Fig 3b. Eigenbehaviours


Fig 3c. Clusters of taxicabs


Tab 3. 出租车需求区与供应区对比


图3b和图3c分别是对字典矩阵H6*36和系数矩阵W6023*6的可视化。对字典矩阵H6*36,我们称6个空间模式的特征行为EB:{EB1,EB2,EB3,EB4,EB5,EB6},每个特征行为不仅量化了每个供应区域的被访问率,也表明出租车出行模式是多个供应区域的综合。相应地,我们把出租车分成6类T:{T1,T2,T3,T4,T5,T6},如图3c。   


Fig 4. 六种特征行为的空间分布


红色越亮的区域被访问频次(接客次数)越多。


特征行为被投射到空间上,称为特征空间,可视化如图4。6种特征行为在空间上的显著差异证明了NMF算法在出租车出行分析上的可靠性。另一发现是,一个区域的被访问频次(接客次数)与它到市中心的距离呈显著的负相关性。为了避免空间划分粒度较粗带来的偏差,我们又在更细尺度上将武汉市划分成4096个方格,如图5,实验结果与粗粒度划分的结论相一致



Fig 5. 基于格网划分的活动子区域识别结果(k=10,以东西湖、汉口、光谷、武昌为例)



结果分析


对6组出租车T:{T1,T2,T3,T4,T5,T6} 进一步细分,如图6。例如T1被分为两个子组{TF,TS},上标F指这一组出租车几乎只固定(fixed)一个特征行为,上标S表示出租车在几个特征行为之间转换(shift)。对其他组做类似的划分,得到10个子组T。


Fig 6. 各组出租车聚类树状图


颜色含义与图3c一致,是标准化后的各模式的系数。


为了更好理解各组行为,我们统计了每组的载客次数、总载客时长总载客距离,并与整体平均值对应比较,结果如表4。


Tab 4. 一个月内个组出租车的运营模式

箭头朝向表示子组统计值与整体平均值的关系:向右[子组统计值>整体平均值],向左[子组统计值<整体平均值],向中间[子组统计值更为集中],无箭头[子组统计值≈整体平均值]


由于篇幅所限,本文仅选取两组方案分析。


方案二


代表区域:汉阳、光谷区域

需求特征:需求较中心区低、交通更为通畅

运营模式:高车速换取载客频数增加


{T2F,T4F}指在汉阳区内和光谷附近运营的出租车。汉阳和光谷作为武汉的次中心,人口没有汉口和武昌两个中心区密集,这导致出租车需求较低,载客次数低于城市平均水平表明了此事实。另一方面,较少的出行意味着当地的交通较为通畅,出租车运行速度应当较高。从统计结果看,低于平均水平的载客时间和高于平均水平的载客路程的现象,说明汉阳和光谷附近的出租车采取了以高速度换取更多载客次数的策略提高效率。


方案五


代表区域:汉口和汉阳、武昌和光谷之间

需求特征:城市主中心和次中心之间大量的交通往返需求

运营模式:客源多、载客距离长、行驶速度慢


{T2S,T4S} 代表在城市主中心和次中心之间往返的出租车群体,T2S指在汉口和汉阳之间,T4S指在武昌和光谷之间。为实现资源分配最大化,各中心距离相对较远。同时,各中心人口密集,这也催生了各中心之间交通的大量需求,从{T2S,T4S} 高于城市平均水平的载客次数得到证实,再考虑到各中心间的长距离,载客路程自然高于平均水平。但由于从中心出发时和到达中心时相应路段交通拥堵,以及非常有限的可供选择路线,出租车运行时间要高于平均水平。这意味着为居民提供在中心之间出行服务的出租车占据了客源和载客距离的优势,但不得不忍受较低的行驶速度。




本文利用出租车轨迹数据,探测了出租车服务的需求区和供应区,发现两者在空间上高度重合,表明出租车司机群体对居民出行需求有良好的洞悉和反应。对于不同的需求区,出租车表现出特有的运营模式。受各种因素的限制,没有模式实现在多载客、长距离时最小化行驶时间的理想情况,绝大部分的模式在载客次数、载客时间和载客距离上求得平衡。上述结论表明了从出租车司机们的集体智慧中理解和改善城市公共交通服务的潜力。


参考文献

Chaogui Kang, Kun Qin. 2016. Understanding operation behaviors of taxicabs in cities by matrix factorization. Computers, Environment and Urban Systems, 60: 79-88


素材来源:康朝贵

材料整理:杨   柳

内容编辑:陈   磊


点击阅读原文查看更多



: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存