学术交流 | 浙江大学André Python博士报告回顾
2021年3月26日下午,浙江大学 “百人计划”研究员André Python博士应邀在北京大学做学术报告,题目为“Quantifying uncertainty in spatial modelling”。姜超博士主持了本次报告。
Python博士首先从若干实例出发,介绍了空间统计学(spatial statistics)在空间建模中的重要作用。以空间聚类场景为例,很多自然和社会现象的空间分布呈现集聚特征,如地震、疟疾病例、恐怖事件等。如果简单地采用平滑、插值等方法识别聚簇(cluster),分析的结果常常取决于平滑程度等参数;甚至对于完全随机产生的点集,也能得到若干虚假的“聚簇”。相比之下,空间统计方法可以实现真实聚簇与虚假聚簇的区分。空间统计学的目的在于理解产生空间数据的地理过程。Tobler的地理学第一定律揭示了大量地理现象的空间自相关特征,这意味着经典统计学中的变量独立性假设被破坏;此外地理数据的可变面状单元问题(Modifiable Areal Unit Problem, MAUP)也会造成相同数据集分析结果的差异,这也是空间统计学需要探讨的问题。除区分真实聚簇和虚假聚簇外,空间统计模型还可以帮助我们建立观测数据与解释变量的关联关系,量化空间不确定性,实现支持决策的空间预测等。
图1 André Python博士在做报告
在报告的后半部分,Python博士着重介绍了贝叶斯地统计模型(Bayesian geostatistical model)的方法与应用。贝叶斯模型可用于实现降尺度(Downscaling),即根据聚合到多边形的属性数据估计精细尺度的像元数据,后者的空间模式由协变量(covariate)的空间分布和高斯随机场决定。超越概率(Exceedance probability)是贝叶斯统计的另一方法。在贝叶斯统计中,所有变量都被视为具有特定概率分布的随机变量,超越概率即为给定观测数据条件下,变量超过某一阈值的概率,也就是变量的后验概率密度函数在阈值以上部分的积分值。以疟疾发病率为例,取阈值为0.4,如果某一地区发病率的超越概率高达0.8,那么真实的发病率很可能超过0.4;反之,如果超越概率只有0.2,一种可能是真实发病率不足0.4;也可能是由于数据不足,无法得出较为可靠的结论。此种方法在得出空间变量估计的同时,能够定量地给出结论的置信度,这可以视为结论不确定性的一种度量。Python博士指出,对于辅助决策的空间分析而言,传递给决策者的不应只是分析结果本身,还应包括其不确定性的度量,这对做出合理决策是十分重要的。其间,Python博士还介绍了自己利用贝叶斯地统计模型开展的研究工作,如2010-2016年全球恐怖事件的时空建模等。
报告结束后,参会师生针对空间数据不确定性的表达方法、数据聚合尺度的选取等问题,与Python博士进行了热烈的讨论与交流。
图2 报告后的交流与讨论
素材来源:S3-Lab
材料整理:郭 浩
内容排版:胡俊杰