其他

论文推荐| 魏冠军:顾及不确定性影响的变形概率预报法

2017-06-01 魏冠军,党亚民等 测绘学报

《测绘学报》

构建与学术的桥梁        拉近与权威的距离

测绘地理信息与导航高端论坛 ——《测绘学报》创刊60周年学术研讨会通知(第一号)

顾及不确定性影响的变形概率预报法

魏冠军1, 党亚民2, 章传银2, 杨维芳1     

1. 兰州交通大学测绘与地理信息学院, 甘肃 兰州 730070; 
2. 中国测绘科学研究院, 北京 100830

收稿日期:2016-10-24; 修回日期:2017-03-16

基金项目:国家自然科学基金(41364001);甘肃省自然科学基金(1508RJEA065);兰州交通大学科技支撑计划(ZC2014002)

第一作者简介:魏冠军 (1976-), 男, 博士, 副教授, 主要从事测量数据处理的理论与算法研究

通信作者:党亚民

摘要:针对变形预报的不确定性,以MCMC算法和贝叶斯预测理论为基础,提出了变形概率预报方法,该方法以概率分布的形式描述变形预报的不确定性,通过概率规则实现预报的递推过程。利用宁杭高速路基沉降数据进行数值计算,定量分析了预报值及其可靠性区间等信息,并与最小二乘估计、免疫算法的预报结果进行比较,结果表明了该方法的有效性和可行性。

关键词:预报不确定性    测量误差    参数不确定性    Gibbs抽样    概率预报    

Method of Deformation Probability Prediction Considering the Influence of Uncertainty Factors

WEI Guanjun1, DANG Yamin2, ZHANG Chuanyin2, YANG Weifang1     

Abstract: A probabilistic prediction method of deformation is proposed based on the MCMC algorithm and the Bayesian Prediction Theory.This method describes the uncertainty of deformation prediction using probability distributions and implement the recursive process of prediction by probability rules. The settlement data from the Nanjing-Hangzhou high-speed roadbed is used to quantitatively analyze the forecast values, reliability intervals and so on, and then the results are compared with those obtained by the least squares estimation and the immune algorithm, and it has shown that the proposed method is effective and feasible.

Key words: prediction uncertainty     measurement error     parameter uncertainty     Gibbs sampling     probability predication    

建立有效的变形预报模型是分析变形监测资料、理解变形机理和检验工程设计理论的重要手段[],同时,变形预报成果为灾害预警和工程安全性评估提供了重要的决策依据。20世纪70年代初,国内外学者相继提出了变形预报的统计模型、确定性模型和混合模型[]。为考虑变形体在不同观测时刻的空间状态,并建立各个状态之间的联系,一些学者提出了变形的时间序列分析模型[]、卡尔曼滤波模型[]、贝叶斯动态模型[]等预报理论与方法。将变形体作为一个整体,综合考虑变形体多个监测点的空间相关性,提出了多点变形预测模型[-]。此外,由于变形过程受一些非线性、不确定性因素的影响,变形预报的灰色系统理论、突变理论、神经网络、小波分析等方法[]也得到广泛的应用。

变形预报结果存在一定程度的不确定性。这种不确定性的产生,一方面是由于自然环境因素、地质条件及各种荷载 (力) 等综合影响并且在动态变化之中,从而导致变形过程的不确定性;另一方面,由于监测数据存在误差,岩土体本构关系复杂,难以建立精确的数学模型。用不精确的模型来描述、模拟复杂的动态变形过程,这种不确定性也是显而易见的[-]。然而,已有的变形预报方法只给出一个确定的预报值,并不能较完整地定量化表征变形预报的不确定性;同时,单值的变形预报结果在一定程度上制约着灾害预警和工程安全性评估的可靠性。因此,变形预报的不确定性研究是一个亟待解决的问题。

目前,变形预报的不确定性研究相当有限[-]。概率作为表征水文预报、气象预报不确定性的一种方式已得到广泛的应用[-]。因此,本文针对变形预报的不确定性,拟采用MCMC (Markov Chain Monte Carlo,MCMC) 算法[]和贝叶斯预测理论[],综合考虑监测数据误差和反演模型参数不确定性的影响,提出了变形概率预报方法。该方法以概率分布的形式描述变形预报的不确定性,通过概率规则来实现预报的学习和推理过程,最大限度地利用了预报当前时刻的所有信息。对概率预测分布的Gibbs抽样计算,可求得预报量的均值、方差及置信区间等信息,定量地分析了变形预报的不确定性,同时,该方法提供了预报值的可靠性区间,对灾害预警和工程安全性评估具有重要的参考价值。

1 变形概率预报方法1.1 不确定性反演分析

不确定性反演分析是指运用随机过程、模糊数学、分形几何等不确定性数学工具来分析量测信息的不确定性及反演模型的非确定性。在工程领域,不确定性反演分析主要有极大似然估计、贝叶斯方法、卡尔曼滤波法等[], 贝叶斯反演分析是在贝叶斯理论的基础上,将参数的先验信息、量测信息的不确定性,按贝叶斯法则考虑在目标函数中,由似然函数递推待求参数的后验概率密度函数[]

对变形监测分析而言,若Y=(y1y2, …, yn) 为n期变形监测数据,φ(θ) 是以θ=(θ1θ2, …, θk) 为参数的变形分析模型,则变形监测数据Y与变形分析模型φ(θ) 之间的关系为[-]

 (1)

式中,ε为随机变量,且ε~N (0, τ-1);τ为未知的待定参数,表示监测数据误差和模型结构的不确定性。

若监测数据Y=(y1y2, …, yn) 服从正态分布

 (2)

则变形观测值的似然函数为

 (3)

根据贝叶斯理论,并顾及参数的先验分布π(θ),变形模型参数的后验概率分布为

 (4)

从式 (4) 可以看出,监测数据误差和模型结构的不确定性通过贝叶斯反演分析传递到参数的后验概率分布中来, 参数的后验概率分布π(θ|y1y2, …, yn) 描述了参数的不确定性。

1.2 概率预报递推算法

根据文献[]的研究,利用贝叶斯预测理论来推断未来时刻的观测值必须依靠预测分布。若将预测值 (ypre) 作为一个附加的未知参数,并与模型参数 (θ) 一起进行估计,利用联合后验概率分布p(ypreθ|yobs) 来推断未来观测值的边缘后验分布p(ypre|yobs)

 (5)

式 (5) 的概率预测分布p(ypre|yobs) 涵盖了参数后验分布π(θ|yobs) 和预测值的函数分布p(ypre|θ),以概率分布的形式描述了变形预报的不确定性。

在完全没有获得变形观测数据的情况下,利用参数的先验分布π(θ) 可求得未知且可观测的数据分布为

 (6)

在实际变形分析中,预测通常是在获得一定的观测数据之后进行。在不同的时间间隔获取的变形监测数据,利用贝叶斯递推算法推断出某一时刻变形的一步概率预测分布 (),过程如下:

图 1 变形概率预报的贝叶斯递推算法Fig. 1 Deformation probability forecasting of Bayesian recursive algorithm


(1) 当t1时刻变形监测数据y1获取以后,根据式 (4) 可推断出t1时刻参数的后验分布为

 (7)

根据式 (5),t1时刻的一步预测分布为

 (8)

(2) 随着t2时刻监测数据y2获取,将t1时刻参数的后验分布 (π(θ1|y1) 作为t2时刻参数的先验分布,结合新的监测数据y2来推断t2时刻参数的后验分布

 (9)

同理,t2时刻的一步预测分布为

 (10)

(3) 依次递推,当tn时刻监测数据y1y2、…、yn获取后,逐次递推的模型参数后验分布为

 (11)

同理,tn时刻的一步预测分布为

 (12)

随着观测数据的不断更新,并不断地对参数的先验信息进行更新与修正,使得参数的估计越来越准确,相应的预测分布也随之更新与修正, 实现了利用概率规则的学习和推理过程。

1.3 概率预测分布的数值计算

Gibbs抽样算法是应用最为广泛的MCMC算法之一[]。文献[]将Gibbs抽样应用到复杂、高维的后验概率分布计算,不仅求得未知参数的估计值,还获得参数的方差、置信区间及MC误差等信息。由于变形模型的参数后验概率分布 (式 (4)) 和变形的概率预测分布 (式 (5)) 的计算都涉及高维、非标准的分布,很难用传统的数值方法来计算。因此,本文采用Gibbs抽样算法进行概率分布的数值计算,具体的过程如下:

θ0=(θ10θ20, …, θk0) 为变形分析模型参数θ=(θ1θ2, …, θk) 的任一初值,然后逐一从下述满条件分布进行抽样:从参数满条件分布π(θ1|θ20θ30,…, θk0y1y2, …, yn) 中抽取θ11;然后依次从参数满条件分布π(θk|θ11θ21,…, θk-11y1y2, …, yn) 中抽取θk1;从预测满条件分布p(yn+1|θ11θ21,…, θk1y1y2, …, yn) 中抽取yn+11

从这样一个完整的抽样过程称之为一次迭代,并用η(1)=(θ1(1)θ2(1), …, θk(1)yn+1(1)) 来表示生成的向量。第二次迭代是以η(1)=(θ1(1)θ2(1), …, θk(1)yn+1(1)) 作为初值,重复上述迭代抽样过程。在足够的退火期 (burn-in period) 后,经过t次迭代产生Gibbs抽样序列η=η(1)η(2), …, η(t)可形成了一个Markov链,收敛到独立于初始值的平稳分布π(θ|y1y2, …, yn) 和p(yn+1|y1y2, …, yn)。此时,就可以利用采样数据的统计计算结果进行未来时刻的变形预测及不确定性分析。

2 工程实例分析

为了验证本文提出的变形概率预报方法的可行性及其精度,利用宁杭高速公路k95+520段地基沉降观测数据[]进行地基沉降泊松曲线模型拟合与预测,利用WinBUGS软件编程来实现本文的方法。

2.1 MCMC计算收敛性判断

采用MCMC方法构造的Markov链,再经过足够长的预热过程后达到稳定,即满足遍历性、归一性和平稳性条件的Markov过程,之后的各个状态采样值可视为来自目标分布。利用Gelman收敛准则可直观、准确地判断Markov链的收敛性,即后验分布的Gibbs采样轨迹图趋于一条直线,说明迭代采样过程是收敛的[]。通过对20期的一步预测分布的Gibbs采样轨迹图判断 (),Markov链在大约经过500次采样预热之后,采样轨迹图趋于一条直线,说明沉降变形预测分布的采样值收敛较快,且本次Gibbs抽样迭代计算是收敛的。

图 2 变形预测分布的采样轨迹Fig. 2 The sampling trajectory of deformation prediction distribution注:横坐标表示采样迭代次数;纵坐标表示预测分布的采样值,单位为cm。


2.2 概率分布曲线及不确定性分析

考虑到监测数据误差及模型参数反演等不确定性因素影响,以变形概率预测分布来代替传统的变形预报值 (一个常数)。Markov链收敛以后的采样值可视为来自变形概率预测分布的独立样本,利用采样值绘制变形的概率预报分布曲线 ()。当预测量概率分布曲线比较陡且拖尾较小时,相应的置信区间宽度变小,即预报的不确性小;当预测的概率分布曲线比较缓且拖尾较大时,相应的置信区间宽度变大,即预报的不确定性较大。

图 3 沉降量的概率预测分布曲线Fig. 3 The probability prediction distribution curve of settlement注:横坐标表示变形预测采样值,单位为cm;纵坐标表示概率密度。


2.3 预报值及可靠性区间计算

Markov链收敛以后的采样值可视为来自变形概率预测分布的独立样本,用于预测量的统计计算及可靠性分析。列出了20期地基沉降一步概率预测分布采样值的统计结果,预报量的均值、标准差、95%置信区间及MC误差等信息,较好地表征了变形预报的不确定性。

表 1 K95+520沉降观测值与不同方法计算的预测值Tab. 1 K95+520 settlement observed and predicted of different method

时间/d沉降观测值
/cm
Bayes概率方法免疫算法
/cm
最小二乘
拟合方法/cm
均值/cm标准差/cm95%置信区间/cmMC误差
50.510.9610.364 8[0.248,1.665]0.011 31.060.94
101.441.4450.384 8[0.673,2.206]0.013 51.541.41
202.712.9310.374 3[2.210,3.690]0.010 93.012.90
213.213.1040.384 7[2.318,3.846]0.011 63.203.09
253.573.9240.383 6[3.159,4.690]0.007 53.993.91
305.355.0270.360 9[4.302,5.722]0.005 45.065.01
345.885.9090.367 2[5.171,6.658]0.008 95.925.90
356.566.1100.374 3[5.391,6.869]0.007 96.136.12
407.487.0990.374 2[6.355,7.844]0.010 27.107.10
457.827.8970.364 2[7.135,8.632]0.009 97.927.91
488.058.2840.364 9[7.565,9.002]0.009 48.328.30
508.388.5010.369 1[7.755,9.226]0.008 48.568.52
558.598.9610.368 1[8.224,9.708]0.007 19.038.96
608.849.2520.363 8[8.514,9.965]0.006 09.379.27
629.019.3390.361 1[8.617,10.07]0.006 89.489.36
659.189.4640.361 3[8.744,10.17]0.007 19.619.47
709.819.5900.367 0[8.888,10.33]0.007 69.769.60
7510.049.6830.370 5[8.927,10.40]0.009 69.879.69
7610.069.7020.379 3[8.953,10.44]0.008 99.899.71
8010.119.7600.378 1[9.016,10.52]0.008 69.949.74
RMS拟合残差1.839 82.078 81.850 5


2.4 不同方法预报结果比较

为了验证本文的变形概率预测分布方法的有效性,与相同数据、同一模型的免疫算法、最小二乘算法的拟合预测结果进行比较 (),通过拟合残差对比,变形的概率预报方法不仅预测精度优于免疫算法和最小二乘方法,而且给了预测值的可靠性区间,从而突出了该方法的有效性及优势。

此外,从3种方法的预测误差序列图来看,预测误差的正负性均呈现出明显的一致,但概率预报方法的预测误差略小于其他两种方法 ()。在20期预测中,有12期免疫算法预测的预测误差大于其他两种方法,而最小二乘的预测误差虽与概率预报方法相当,但残差略大 ()。

图 4 3种方法的预测误差序列图Fig. 4 Three methods of prediction error sequence diagram


3 结论

针对变形过程的不确定性,本文提出了变形概率预报方法,通过概率规则实现预报的递推过程。主要结论如下:① 将参数的先验信息、监测信息的不确定性,按贝叶斯法则考虑在目标函数中,并利用其预测理论推断出下一时刻变形的一步概率预测分布;② 通过对一步概率预测分布的抽样计算,得出了预报量的均值、标准差、95%置信区间等信息,较好地表征了变形预报的不确定性;③ 结合工程实例,通过对比不同预测方法的结果表明,变形概率预报方法预测精度较高,表明了该方法的有效性,同时,本文方法给出了预测值的可靠性区间,对于工程灾害预警及安全性评估具有一定的实用性。

【引文格式】魏冠军,党亚民,章传银,等。 顾及不确定性影响的变形概率预报法[J]. 测绘学报,2017,46(4):526-532. DOI: 10.11947/j.AGCS.2017.20160531

更多精彩内容:

再不去把握这九大空间信息趋势, 等着被颠覆吧!


征稿| 2017测绘地理信息前沿技术论坛(无人机测绘技术及应用专场)征文通知


测绘地理信息领域至少30人有望新晋工程院院士


书讯| 张过教授:《线阵推扫式光学卫星几何高精度处理》


【3分钟读懂天舟一号】载货比超日欧:天舟快递,使命必达!


知识| 北斗的九大技术特点!


《人民的名义》里的地理信息高科技,你发现了吗?


专访| 单杰教授当选美国摄影测量与遥感学会(ASPRS)会士


招聘| 中国测绘宣传中心2017年招聘公告


政务| 国家测绘地理信息局第四批科技领军人才人选公示


图片| 太空俯瞰地球,卫星视角下的农田竟如此壮观!


武汉大学测绘学院“千人计划”桑吉章教授团队博士后招聘启事


招聘| 中国地图出版集团地理信息总公司招聘公告


通知| 关于开展中国测绘地理信息学会先进集体和先进个人评选工作的通知


《测绘学报》“地球剖分网格系统及空间大数据相关应用” 专辑出版


李德仁院士为“地球剖分网格系统及空间大数据相关应用” 专辑作序


高俊院士为“地球剖分网格系统及空间大数据相关应用” 专辑作序




权威 | 专业 | 学术 | 前沿

微信投稿邮箱 | song_qi_fan@163.com



微信公众号中搜索「测绘学报」,关注我们,长按上图二维码,关注学术前沿动态。

欢迎加入《测绘学报》作者QQ群: 297834524


进群请备注:姓名+单位+稿件编号





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存