查看原文
其他

小纳读书 | 布鞋院士谈病态反演

2016-11-22 小纳君 百纳知识

《小纳读书》介绍主编小纳君的书架上的那些书籍,小纳君最大的爱好之一就是买书。主编小纳君以后每周将读一本书,并将书的部分内容节选推送,向大家推荐一本科技类的经典作品。今天介绍《大师小文》这本书。




今天跟主编小纳君一起读一下这本不同寻常的院士博文集,书里收集的李小文院士139篇博文中,我们不仅看到了他对知识涉猎的广泛,对科学的深刻思考,也看到了他对这个国家的热爱,对科技界未来发展的殷殷期盼。

让我们走进“布鞋院士”李小文的世界,了解一下科研之外他的风趣和幽默。


小纳读书 | 李小文院士谈病态反演


 一谈病态反演——后简后后,奚我后? 

最近一位网友贴了陈寅恪先生的“清华大学王观堂先生纪念碑铭”。开门见山,“海甯王靜安先生自沉後二年,清華研究院同仁鹹懷思不能已”。我跟贴,建议“鹹应为咸”。理由为:鹹,咸均为繁体,意义不同。鹹简化为咸后,再翻回繁体,就容易出错。注意这里简化的过程是“多一变换”,要再从简体的咸翻回繁体,立刻就有问题,原文究竟是鹹、还是咸?没有上下文,是无法确定的,这就是说,多一变换的反演问题,是病态的。但根据上下文,这里简体的咸只能讲成“都”的意思,那么繁体只能是咸。




更常见类似错误如:后、後均为繁体,意义不同。後简化为后后,也出了不少乱子。比如“奚我后?后来其苏”,这句话,很多主张繁体字的歌星多半闹不清楚。我曾经遇到一位台湾老先生,看不懂这句话,怪大陆简化字搞乱了中华文化。我说,这里刚好“后”字没简化呀?他说,那不可能,没简化,这句话的意思成了“谁是我的爱啊,她来了我就酥了”,上古之人,会说这样新潮的话吗?我才告诉他,上古之人,王、后同义。把“后”当作“王”的爱人,是后来的事。这句话的意思是:“谁是我们称职的王啊,他来了,我们日子才能好过些”。所以要读懂这句话,不但要有“後、后”知识,而且需要“后”古义的知识。


我们搞定量遥感,病态反演是不可避免的问题,因为从复杂地表到我们遥感到的信号是一个多一变换。同物异谱,混合像元,。。。所以我们必须充分运用我们的先验知识,有关空间格局、时空过程、。。。

出个上联来结束本课:后简后后,奚我后?

再谈病态反演

——人有病,天知否?



上篇文章从“奚我后?后来其苏”,扯到病态反演,寥寥几句,语焉不详,就再罗嗦几句。

在中学的时候,大家都知道,“线性方程组解的存在与否”有三种情况:无解(超定,over-determined),唯一解,多解(欠定,underdetermined)。通过大量的作业,一般容易形成一个误会,就是有N个方程的线性方程组,就能解出N个未知数。


黄老邪当年刚到美国的时候,上Glen Wade教授的课,讲多角度断层成像。讲义中用来说明这个概念的例子是这样的:假定A11,A12,A21,A22,4个像元排成两行两列,水平投影过去,能得到A1=A11+A12;A2=A21+A22。换一个角度,垂直投影下来,能得到B1=A11+A21和B2=A12+A22。这样,用4个观测量A1、A2、B1、B2,就能解出A11等4个未知量。




Wade是权威老教授,4个方程解4个未知数,讲了几年,没人怀疑这个说法。黄老邪出剑快,当堂就剑指命门,曰:A1+A2-B1=B2;第四个观测不是独立的。三个独立方程解不出4个未知数。此话一出,满座俱惊。Wade教授毕竟一派宗师,略一沉吟,连曰:ill-posed, ill-posed。看我不懂这个单词,换个说法:underdetermined。Wade教授后来修改了他的讲义,到处致谢,跨系聘我作了他的RA。我毕业离校时,还专门设宴欢送。宴会上Wade教授致辞说,这次破例欢送李先生,是因为两件事他感触特深:一件就是那个欠定方程组,我不惧权威,能独立思考。另一件事就是我表现出对弱者的关怀。这件事大概是这样的,一位台湾公费生,研究做得不够好,到公费期满,论文还出不来,Wade教授以研究生经费已经花光了为由,拒绝给他资助,因此他无法在暑期继续完成论文。我觉得部分原因是我跨系抢了别人的机会,差几个月拿不到学位也够惨的。所以我找Wade教授开后门,把我的暑期全奖分一半给那位台湾同学。


Wade教授指出,“不惧权威”和“同情弱者”同为形成一个好的科研团队的必要条件,希望课题组所有的同学都学习李先生,所以才破例欢送,请大家搓一顿。

好汉不提当年勇,我一般避免在网上自吹自擂。这次破例不避嫌,一是Wade教授的大师风范,始终是我学习的榜样,我讲错了,从来欢迎同学拍砖;二是说明“病态”(ill-posed,ill-conditioned)这个词我怎么学会的,不是我的创新。

病态反演,指因种种原因观测信息量不足时的反演。如果大家实在不喜欢这个词,欢迎建议个更好的。


三谈病态反演 

贝叶斯方法与经验知识库



话说线性方程组解的三状态:无解、唯一解、和多解(欠定),中学里边,咱们只管唯一解。但实际工作中常常遇到观测数目多于未知数目的情况。这时信息量常有富余,反而“无解”,显然傻逼。所以高斯大侠自创一招“无中生有满天星”剑法,充分利用数据信息冗余(满天星),硬找出一个抗噪声的最优解(无中生有)。高大侠这一招风行天下二百余年,国内最早翻成“最小二乘法”,其实 “最小平方误法”,更容易理解,就是在满天星斗的数据点集中,拟合出模型有最小平方误的一套参数,作为最优解。


总之,“超定”问题的求解,算是高大侠解决了。恼火的是欠定。欠定有明、有暗。明欠定比如说有三个方程,解4个未知参数,这一眼就可看出。暗欠定,就是说,看起来方程数等于或大于未知参数,但彼此不独立、或观测之间有相关,导致最小平方误法中的A’A(见前博文网友欧阳克评论)的不满秩。应用又需要我们定量遥感解出这些参数。怎么办呢?


办法1。既然既没有唯一解,又没有高大侠的最优解。这就是“死反演”,想治病,就是骗国家的钱,咱们别干了。

办法2。加观测数据,加成数据海洋都不怕,反正计算机快。

办法3。加限制条件,(加方程):比如端元丰度均为正且和为1,又如加最大熵,。。。

办法3实际上已经在用先验知识注入来“治病”了,但没有从理论上强调先验知识的重要性和规范其用法。做到这一点的是贝叶斯贝大侠。


“贝叶斯提出了一种归纳推理的理论,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法.”——摘自《中国大百科全书》(数学卷)



贝叶斯(1702- 1763)是自学成才的英国数学家,长期担任地方教堂的牧师. 1742年,贝叶斯当选英国皇家学会会员. 1758年,贝叶斯发表《论概率问题的求解》中,提出了一种归纳推理的理论,其中的“贝叶斯定理(或贝叶斯公式)”给出了在得到新的观测后,对所有原因(未知参数)计算其后验概率的公式,以后发展为一种系统的统计推断方法,称为贝叶斯方法.贝叶斯方法在理论上的进展以及它在应用上的方便和效益,在200多年为许多人所了解,认为贝叶斯方法是唯一合理的统计推断方法,形成数理统计学中的贝叶斯学派。


顺便说一句,贝叶斯方法是科学简单性原则的另一光辉例证。他只是把全概率公式AB=CD,改成A=CD/B,但赋予“先验知识”,新的观测,“后验知识”的含义,描述了知识积累与更新的过程。这样每一次新的遥感观测,就都能对待求参数的理解作新的贡献,而不管待求参数有多少个,只是新观测的信息分配的问题。这对于要求A’A必须满秩(A’是矩阵A的转置),是革命性的。


我们将贝叶斯方法用于定量遥感,是在90年代中,发表在《中国科学》上,国际上影响有限。加上些进一步工作,2001年发表在JGR上,反响是令人满意的。但我最满意的一点是,把我们先哲的教训,用英文推向国际定量遥感界:

Our knowledge consists of two parts: what we know, and what we know we don’t know.




但是要将贝叶斯方法用于定量遥感,必须有“先验知识库”的支持。因此必须有一些基本建设。863支持了我们的想法,但要求我们做到“高科技含量,低应用门槛”,不准出现“波谱知识库”、“病态反演”这类字眼,避免有人在概念上来纠缠,用户难以理解。重点项目指南出来之后,果然没人在概念上纠缠。但项目指南叫了“波谱数据库”,谁家里有一台波谱仪,都觉得该是自己牵头申请的项目,搞成了一场恶斗,害我得罪人。真是有一利必有一弊啊。


为了说清楚知识库和数据库的差别,一位德高望重的学长打了个比方:数据库就像字典,知识库就像辞典。我这里再回到“奚我后”。要查字典,后字非唯一解,还是看不懂。要查辞典,就连上下文一起,作为一个空间模式来查,输入“奚我后”到百度:“《奚我后》是著名画家徐悲鸿的经典油画作品。 该画构思于1931年,1933年完成。名字《奚我后》来自《尚书·仲虺之诰》:'奚我后,后来其苏。'《尚书》中'奚我后'又作'奚予后','等待我们的君主之意。其背景是描写夏代末年...”

这就叫知识库。


四谈病态反演

——时间序列与过程知识


在前篇博文(往事如烟)答复网友评论时,我提到:

“我相信学识和人品有很强的正相关。我不会在这儿画图。想像X轴代表学识;Y代表人品。在x接近零的时候,人品的差别基本独立于学识。但随x增加,二者相关性逐步增强。所以散点图应该像一把扫帚,柄斜向上。但是能耐和人品的相关性就难说了。按李宗吾的理论,应该是负相关。但似乎不普适”。


网友们总的反映不错,觉得讲得还算清楚。那么,我就想要求我的学生都画两张这样的图,把你认识的,知道的人都作为一个个数据点,标上去(别标注谁谁谁!)。最后把自己也作为一个数据点,标上去,这次可以注明是自己,是什么时候注的。过段时间,再标注一次。三年五年以后,可以看看自己的轨迹(trajectory),自我评估一把--当然,不用给别人看。




数据点的轨迹,或者说时间序列,表现的就是过程。

还在遥感应用的早期,多时相遥感数据,就已经展现出强大的分类能力。因为不同作物有不同的季相变化,这大家很容易理解。但用于分类的时候,多数只是把多时相遥感数据当作额外增加的波段来用。有人也进一步提出用波谱空间中作物的轨迹来参与分类,但好像并没有什么优势。当时也没有讲清楚会有什么优势。


遥感应用发展到今天,就不得不考虑充分利用遥感时间序列了。比如农作物的估产,就需要时间序列的遥感数据,来监测作物的种植面积和长势。但是同时还需要这种作物从播种到收获的全过程的知识,历年风调雨顺状况的评估,才能估计今年的产量。所以这需要作物生长过程丰富的知识。就是说,光知道春种秋收是不够的。比如白居易就知道山中的物候和山下就不一样:

人间四月芳菲尽,山寺桃花始盛开。长恨春归无觅处,不知转入此中来。

从全国范围来说,纬度,气候带,等等也都会影响物候。没有丰富的知识积累,时间序列遥感也就玩不转。




又如,若干年前,辽河大水,遥感估算的受灾面积只有民政部门上报数的十分之一,中央采信了遥感估算面积。最近参加了环境减灾卫星(HJ)减灾地面系统的初步设计,才知道减灾委的同志迄今不服:

(1)按受灾面积发放的救灾款还是老标准,老百姓苦,都骂遥感“乱摇笔杆”(这不能怪遥感)。

(2)遥感图像是洪峰以后获取的,洪峰时过水面积更大,图像上反映不出来 (这怪遥感水平不够)…

如果有洪峰前后的多时相主被动遥感数据结合,加上数字高程模型、洪水的过程模型、地面水文数据,估算最大过水面积,淹没深度和淹没时间,就可以得到更准确的灾情评估信息,这就要求从瞬间到过程,从二维到四维。但我们搞遥感的,很少(?)能懂洪水的过程模型,这就要求多学科的交叉。


病态反演与文人的复杂化倾向 


不久前,提到陈寅恪,然后扯到病态反演。其实“恪”字该怎么念,ke、还是que,本身就是一个病态反演问题。多年前,一个文科牛人,纠正我念陈寅ke,错了。恪字通常念ke,但用于人名,应当念que,《辞海》上这么讲的。我说,名从主人,陈寅ke自己念ke,那就是ke。这位文科牛人露不屑置辩之色,没有继续谈下去。刚好不久后,《读书》杂志登了一篇文章,考证了应该念ke。我想,这下应该有共识了吧?


不料今天晚饭时,电视上凤凰台那个马鼎盛,主持一个介绍陈寅恪的专题,众口一辞,陈寅que、陈寅que的,听得我烦。查百度百科:

按照商务印书馆出版的《现代汉语词典》(2002年增补本),“恪”应读作“克”(拼音:Kè)。 但有资料表明,由于陈寅恪是客家人,而“恪”在客家话中有“quó”的,因普通话(时称“国语”)中无此音,于是到中国北方后,便被当然地称为“yínquè”了。因袭相承,并成为习惯。所以,有学者认为,“陈寅恪”应读作Chén Yínquè。




不过,在使用汉语的人中间,知道这一点的人显然为少数,包括陈寅恪本人也并不追究。因而,在使用普通话时,仍不妨将陈寅恪的“恪”读作“克”(Kè)。况且,陈寅恪本人在1940年5月致英国牛津大学的英文亲笔信的署名是“Tschen Yin Koh”。


这里,黄老邪还可以补充一句,我看过不少陈老先生的英文史学论文(题目),署名内都是用ke。所以念陈寅ke绝对没错。但问题是我们那些文科牛人们为什么偏要念陈寅que呢?不知道。可能跟孔乙己炫耀自己知道“回”字的4种写法差不多?奇怪的是电视里那些人众口一辞,难道马鼎盛事前拿着《辞海》培训过?


所以,我们在建立知识库的时候,仍然应坚持简单化的原则,拿着奥卡姆剃刀,刮、刮、刮。 


布鞋院士李小文简介:


李小文(1947年03月02日~2015年01月10日),四川自贡人。中国遥感地理学家,中国科学院院士。1968年毕业于成都电讯工程学院。1985年毕业于美国加利福尼亚大学,获地理学博士学位。

曾任北京师范大学遥感与GIS研究中心主任,地理学与遥感科学学院教授、博士生导师,北京师范大学地理学与遥感科学学院名誉院长,长江学者特聘教授,中科院遥感与数字地球研究所研究员。是 Li-Strahler 几何光学学派的创始人,成名作被列入国际光学工程协会“里程碑系列”,在国内外遥感界享有盛誉 。

2015年1月10日,因病在北京逝世,享年68岁。其追悼会将于2015年1月16日上午,在北京八宝山革命公墓举行。

2015年12月,入围“感动中国2015年度人物”候选人。


小编:千翻

欢迎个人转发到朋友圈

公众号、报刊等转载请联系授权

bainazhishi@163.com

▼点击查看相关文章

 高速飞行中的等离子体问题| 35位院士的55篇文章  | 回看100余位“教授院士领导” | 百纳图说科技绘图教程 | 科研必备的12个网站 | 中科院分区表出炉 | 复数生出的分形之美 | ACI等主编“出奇招"刷期刊影响因子 | 造假论文是明日的耻辱

百纳知识 一个让你拥有更多知识的地方
长按,识别二维码,加关注


《百纳知识》由清华、中科、上交、华科、同济、北航、中南、南大、西电等高校的老师博士硕士本科生四十余人组成的公益组织联合运营。科研是一场美丽的冒险,《百纳知识》愿意做大家冒险路程中最真诚的陪伴者。

点击“阅读原文”体验一次不一样的百纳知识,不用太久,不用太难,瞬间即可!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存