查看原文
其他

佳文赏析 | 《地球信息科学学报》:多模态地理大数据时空分析方法及研究方向

The following article is from 地球信息科学学报 Author 邓敏等

引用格式:

邓敏,蔡建南,杨文涛,等.多模态地理大数据时空分析方法[J].地球信息科学学报,2020,22(1):41-56. [ Deng M, Cai J N, Yang W T, et al. Spatio-temporal analysis methods for multi-modal geographic big data[J]. Journal of Geo-information Science, 2020,22(1):41-56. ] DOI:10.12082/dqxxkx.2020.190491

研究背景

空间分析是地理信息系统区别于一般管理信息系统的特有功能,旨在借助计算机与数学手段量化分析地理数据的空间关系与模式。20世纪80年代时态GIS的提出进一步推动了时空分析的研究,通过在空间分析中结合地理数据的时间属性,发现地理数据中潜在的、有价值的时空模式、关联关系及其随时间的演变趋势,对于理解复杂的地理学规律具有重要的科学价值。近年来,随着对地观测传感器技术以及人类活动感知手段日新月异的飞速发展,地理数据已经明显呈现出典型的大数据特征,使得人们能够更加精细、全面、多样、实时地刻画涵盖自然与人文地理要素的地球表层系统。新一代地理信息系统的时空分析与传统时空分析的典型区别在于其分析对象的多模态特点,即多粒度、多类型、多参考系、多元关联、多维动态和多能自主。由于地理大数据获取过程的有偏性和自发性,面向单模态小数据的传统采样与误差理论将难以在多模态地理大数据时空分析模型中对数据质量进行有效控制。面对这些机遇与挑战,如何扬长避短,合理利用地理大数据,对于提升多模态地理大数据时空分析方法的性能至关重要。


难点问题

新时期地理学的核心使命在于探究自然与人文要素的时空分异规律及其相互作用关系,进而预测地球表层系统的时间演变过程。为了全力完成新时期所赋予的核心使命,迫切需要4类时空分析的理论、技术与方法支撑,分别是:时空聚类分析、时空异常分析、时空关联分析与时空预测分析。为适应于地理大数据多粒度、多类型、多元关联和多维动态等多模态特点,地理数据时空分析现有研究仍存在一些亟需解决的难点问题,主要包括以下几个方面。

01

时空聚集模式的尺度依赖性

时空聚集模式通常具有显著的尺度依赖性,在不同尺度下,聚集模式具有不同的表现形式。现有时空聚类方法较少顾及尺度对挖掘结果的影响,能够挖掘数据中多尺度聚集模式的时空聚类方法研究还相对初步。

时空聚集模式的尺度依赖性


02

时空异常模式的多视角协同探测

现有的时空异常分析模型大多基于单模态特征探测时空异常模式,缺乏对地理时空数据多模态特征间关联关系的客观描述及异常表现形式的深刻认知,难以揭示多视角下时空异常模式的深刻内涵,进而可能导致异常探测结果的片面性,甚至出现错误。需要在时空异常分析模型中融入地理数据多模态特征间的关联关系,通过多视角协同探测,以克服现有单模态特征分析结果的片面性。

2种类型空间点事件的联合分布示例


03

时空关联模式的多特征可信挖掘

现有时空分析模型大多基于人为主观设置的频繁度阈值筛选频繁的时空关联模式,缺乏对地理数据多模态分布特征的深度认知,难以揭示地理数据内蕴特征下的客观关联关系,进而可能导致分析结果不可信。需要在时空关联分析模型中融入关于地理数据多模态分布特征的背景知识,以提升时空关联模式挖掘结果的可信度。

随机交互结构导致的虚假时空关联模式


04

融合时空数据多重特性的时空预测

时空数据往往不只表现为单一时空特性,可能同时存在时空依赖与时空非平稳等多重特性。因此,在时空预测分析中需要融合时空数据的多重特性,建立更为可靠的时空预测方法是当前亟需解决问题之一。


关键技术

下面提供多模态地理大数据时空分析的4项关键技术,包括:(1)尺度驱动的时空聚类分析;(2)融合多视角关联知识的时空异常分析;(3)顾及多模态分布特征的时空关联分析;(4)融合时空数据多重特性的时空预测分析。

01

尺度驱动的时空聚类分析

多尺度时空聚类分析涉及的尺度概念主要分为2类:(1)数据尺度(或称为观测尺度),表示地理空间数据的采样粒度,如不同分辨率传感器获取的遥感影像具有不同的数据尺度;(2)分析尺度,是指对地理空间数据进行后加工处理、分析、决策、推理时所采用的尺度,如确定某一地理实体的空间邻近实体时所采用的距离阈值。将地理空间数据的比例尺(数据尺度)与观察距离相关联,可以建立起多尺度聚集模式与数据尺度间的关联关系。在不同数据尺度下,通过人类视觉认知到的时空数据中存在的显著聚集模式会随着数据尺度的改变而发生变化,如下图所示。

时空聚集模式与数据尺度间关联关系


除了尺度依赖性建模这一关键问题外,还需要研究在一定数据尺度下,聚类模式最佳分析尺度的选择问题。最佳分析尺度的选择主要依赖于人类视觉对所观察到的对象聚集信号的响应强度,即聚集模式的显著性。为了从统计意义上对时空聚集模式的显著性进行推断,介绍一种顾及非空间专题属性的时空聚集模式统计挖掘方法。该方法首先以时空簇的可靠性或显著性的判别研究为切入点,在时空自相关显著性检验研究的基础上,通过时空随机重排检验的策略,构建适用于时空聚集模式显著性检验的统计判别方法,并与时空层次聚类算法相融合。如下图所示,采用该方法探测我国降水与气温时空分布模式,将有助于气象学研究领域分析我国降水与气温的时空分异性和变化规律。

时空聚类统计挖掘方法对气象监测数据的聚类分区结果


02

融合多视角关联知识的时空异常分析

针对单模态特征下时空异常分析结果的片面性问题,介绍一种融合多视角关联知识的时空对象交叉异常统计推断方法。相比于现有方法,该方法在异常分布模式分析过程中通过融合多模态关联知识,建立关联知识引导下的异常统计推断,实现对时空对象异常分布模式的多视角关联透视,克服了异常模式主观判别的难题。该方法将时空交叉异常解释为显著偏离主导分布格局的交叉关联关系的实体集合。如下图所示,包含了多类型的空间实体集合。以实体类型a为分析对象,通过分析其它不同类型实体与a类型实体之间的交叉关联关系来判别交叉异常模式。左图中的类型b实体频繁地出现在类型a实体的空间邻近范围内,事件a→b的交叉关联关系主导了该空间范围内分布格局的构成,因此,出现频率较低的事件识别为交叉异常,如小范围单独聚集出现的a类型实体集合(左图中区域-2所示)和事件a→c集合(左图中区域-3所示);进一步考虑主导事件a→b的交叉关联强度,其中交叉关联强度具有显著偏离的实体集合识别为交叉异常,如中间图中的区域-4所示;最后,剔除上述表现出交叉异常的类型a实体,剩下的a类型实体中呈现出局部异常聚集的实体集合识别为交叉异常,如右图中的区域-5所示。在此认知基础上,时空交叉异常探测可以建模为不同类型实体之间交叉关联关系强度的显著性检验问题。

多类实体→两类实体→单类实体的时空交叉异常分布示例


融合多视角关联知识的时空对象异常分布模式统计推断方法已成功应用于不同类型犯罪事件之间、城市金融设施与抢劫犯罪事件间的时空交叉异常分布模式探测,可以为进一步实现城市突发事件的联合预警提供技术支持。

03

顾及多模态分布特征的时空关联分析

针对时空关联分析结果有效性难以评价的问题,本文以时空同位模式为例,介绍一种地理实体时空关联模式的统计分析方法。相比于现有方法,该方法以地理实体多模态分布特征知识为引导,可以有效排除随机交互结构对结果的干扰,实现对多实体关联关系的客观认知。时空同位模式可解释为单类实体时空分布结构相互诱导的产物,如下图所示,若某类地理实体或潜在实体的分布结构(如空间聚集结构)会诱导其他多类地理实体在相近位置呈现相似分布结构,则这些地理实体会形成具有地理内涵的时空同位模式。在该认知基础之上,时空同位模式挖掘可以进一步建模为多类地理实体分布结构间诱导关系的显著性检验问题。

不同地理实体空间自相关结构间的诱导作用


针对不同应用问题,已发展了空间数据、时空数据和网络空间数据的全局或局部关联模式统计分析的具体方法,并成功运用于湿地植被物种共生关系分析、城市设施兴趣点空间集群结构提取以及犯罪案件诱发机制识别,可以为改善生态环境、优化城市结构、维护公共安全等智慧城市应用领域提供重要的决策支持。

04

融合时空数据多重特性的时空预测分析

时空数据的特性将对时空预测分析具有重要影响,也是时空预测建模需要考虑的主要因素。本文以空气污染物浓度预测应用为例,介绍一种兼顾时空依赖性与空间异质性的时空支持向量回归预测方法,该方法可以抽象为融合时空数据多重特性的时空预测分析通用框架,进而扩展到不同的应用领域。大气运动直接影响空气污染物扩散与迁移,该物理过程在空间的连续性决定了风向路径上越邻近位置污染物浓度具有越高的相关度,因此,为了描述污染浓度数据的时空依赖特征,采用高斯矢量函数构建时空自相关变量。如下图(a)所示,假设风向为东北(NE),则P0 位置的污染浓度变化与P1, P2, P3 以及P4 位置污染源有关,关系的强弱则取决于P0 与其它位置的空间关系,通常表现为随角度(θ)与距离(d)的增加而呈现衰减特征,据此可定义高斯矢量权重wij,并通过加权平均可构建P0 位置的污染浓度时空自相关变量。

兼顾时空依赖性与空间异质性的时空支持向量回归预测方法


污染源、地形地貌等因素的空间分异,导致不同区域中污染物浓度与关联因素/协变量的关系不尽相同,即表现出所谓的空间非平稳性或异质性。在地理时空数据分析中,空间异质可分为局部异质与分层异质,二者分别强调空间分异的位置与区域依赖。如上图(b)所示,针对污染物浓度与关联变量在较大尺度研究区中具有空间分层异质,利用空间聚类分析算法探测污染物浓度数据中的空间聚集模式,实现均质或近似均质区域的划分。进而,以不同区域为分析单元,构建参数随空间区域变化的局部支持向量回归模型,其中模型的输入包括协变量与相应的时空自相关变量,从而实现时空数据多特性表达的时空预测建模。由于时空数据的多重特性在不同的应用场景表现形式各异,如何探测与表达应用场景中时空特性具体形式,并将其与模型进行有效融合是时空预测分析中重点关注的内容。


未来展望

多模态地理大数据时空分析的研究仍任重而道远,未来需要重点开展以下几个方向的研究工作:
(1)地理大数据的多模态信息使得复杂时空对象的刻画更加精细,面向点线面实体的时空分析方法难以发挥多模态信息的价值,为此,需要研究融合多模态信息的复杂对象时空分析方法。(2)人类行为大数据多以数据流(如人口流动)的形式存在,不同于对地观测大数据所聚焦的位置数据,流数据能够表达不同地理位置或区域间的交互信息,需要进一步认知流数据空间内时空模式的新型表现形式与地理内涵,并发展相应的分析方法。(3)时空对象从诞生、发展、变化到消亡的全生命周期特征表达在地理大数据时代已成为可能,如何实现地理大数据多模态特征及其交互关系的全链建模将更加困难,建立面向全周期过程的动态时空分析模型将是未来值得关注的研究热点。(4)地理大数据的“5V”与“5度”特征对时空分析方法的计算性能提出了严峻挑战,如何在并行计算等高性能计算模型融入地理数据的特性(自相关性、异质性与尺度依赖性),开展面向地理大数据的实时或近实时的时空分析方法研究。

作者信息

邓敏  教授

中南大学二级教授,博士生导师。教育部长江学者特聘教授、科技部中青年科技创新领军人才。现任中南大学地球科学与信息物理学院副院长(主管科研工作),兼任中国GIS理论与方法专业委员会副主任委员、中国自然资源学会资源大数据委员会副主任委员。担任《Journal of Geovisualization and Spatial Analysis》、《地理与地理信息科学》等期刊编委。长期从事地学时空大数据挖掘与智能服务等方面的科研与教学工作。主持国家自然科学基金5项(其中重点项目1项)、国家863课题、国家军工高分专项课题等科研项目20余项。发表学术论文150余篇,其中以第一作者或通讯作者在IJGIS、CEUS、TGIS、CaGIS、GA等国际地理信息权威刊物发表SCI/SSCI论文40余篇,授权国家发明专利10余项,在科学出版社出版学术专著4部,获得国家科技进步二等奖1项,省部级科技奖励一等奖2项,二等奖3项。


击文末“阅读原文”可进入期刊官网下载该文,也可在中国知网下载全文。

转载自地球信息科学学报

经作者授权转载

文章仅代表作者观点,与本公众号无关,版权归原作者所有

原文标题:佳文推荐:多模态地理大数据时空分析方法及研究方向

图文编辑:王秋红

责任编辑:张英浩

审       编:鲁嘉颐

终审:颜子明   黄宗财   梁龙武

猜你喜欢

1.地学招聘 | 临沂大学农业规划团队科研助理招聘启事

2.干货分享 | 规划用地变化分析技术分享

3.名家观点 | 国际数据共享及三极数据编目介绍

4.佳文赏析 | 《中国名城》:行政区划视角下伴生城镇的特征、形成机制与整合路径  ——以德阳市孝泉镇、孝德镇为例

扫描二维码,关注我们

都看到这里了,点个【在看】再走呗~

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存