骆剑承:遥感智能计算与地理精准应用的思考与探索
The following article is from 赛杰奥 Author 骆剑承
这一段在家封闭写作的日子,是在一种比平日还忙碌的状态中悄然度过的,在反复思考和不断打磨中,终于把这本《遥感大数据智能计算》(骆剑承等著. 北京:科学出版社,2020.8)专著相对完整的一稿修改出来了。
这一天,是2020 年2月9 日,华夏大地上正经历着一场不见硝烟的“战争”,全国人民团结在一起与新冠病毒持续斗争,众志成城,共克时艰。写作的同时,我们一直关注着这场疫情蔓延和全民奋战的过程,看到各行各业包括我们遥感与GIS 的同仁们也在挺身而出,默默奉献着各自的力量。地图已成为社会公众了解疫情态势的最主要方式。通过将每天发生数据快速汇聚于地图之上的可视化展示与分析计算,直观地为社会各界呈现全国和周边疫情流行与消长的过程,并从中大致挖掘疫情在时空分布和路径传播上的一些规律,让公众紧密配合国家对疫情防控的决策与部署。
这是一个大数据与人工智能的时代,相关的数据与技术理应在此刻发挥关键的作用!于是就会想,此时遥感作为对地球观测最全面而真实的数据获取手段,能否担负起一定的作用呢?就在几天前,周成虎院士曾为此专门建了微信群,召集全国各地的遥感学者们一同思考:面对如此突发而面广的公共卫生事件,已经具备全球覆盖观测能力的遥感大数据究竟应担当起怎样的角色?如何快速地行动起来发挥遥感能行使的监测作用?而这其实算是拷问遥感很多年的“旧”问题了!
因此借撰写这本书的机会,也结合个人这些年的研究经历对这个问题作了些思考。这么多年来遥感长期难以真正“落地”的主要症结还是在于其提供的信息服务始终难以达到“精准”和“快速更新”的老病根!归纳起来主要有3 个方面的原因:
第一,面对地表这个超级复杂的巨系统,即使到了如今高分遥感时代也始终达不到精细而快速认清地表各类地物的解译水平,关键的国家级调查工程仍然靠的是“人海战役”,即遥感数据大规模获取与地理信息社会化应用之间的通道依旧为狭窄而落后的“独木桥”,通俗意义上讲就是地图更新“精”而“快”的问题始终未能通过遥感得以有效而智能地解决;
第二,主流遥感研究擅长于从遥感数据中通过模型反演获得表征地表环境变化的物理量或生物量,然而这些相对宏观或混合像元尺度上的“量化”结果又往往难以与真实地物对象匹配或关联于一起,且仅能反映地表环境变化的中间过渡信息,未能直接解析与地表发生事件或行为活动紧密相关的真实指标,所以解决好遥感对地表各类专题信息计算“准”的问题一直是个瓶颈,离满足实际应用需求之间尚有较大的距离;
第三,星空地一体化观测与应用体系至今未能真正构建成型,大多遥感应用普遍忽视了地面实测以及人与知识的协同作用,而这个作用的发挥则需要遥感与各种地表发生数据进行模型与知识上的深度耦合,在人提供少量知识的驱动下,一方面可以让遥感数据与各类信息发生时空上的聚合,另一方面也能从中发现更多未知的潜在规律,协同于一起才能使“数据观测→信息挖掘→知识发现”的计算过程走向良性的螺旋式上升,因此当下通过遥感驱动对各领域“新”知识的探测发现,还停留在较为初级的摸索阶段。
可以看出,上述三大痛点问题实际上需要一环套一环地加以解决,若解决不好“精”而“快”的问题,也就探测不到“准”的信息,最终也就发现不了“新”的知识!所以综合而言,遥感研究在本质上还是一个地理学范畴的问题,需按简单到复杂的方式将其回归于地理学对地表现象、过程、格局的综合分析,才能把遥感研究推升到一个“对复杂地表进行精准化信息挖掘与知识化落地应用”的新境界!
其实,对于这些问题的思索并非是一时的突发奇想,而是本人二十多年来在遥感智能化处理与分析研究过程中反复实践、不断提出疑问的总结,是在“放弃与坚持”“推倒与重建”的迭代道路上徘徊前进而产生的认识积累与经验沉淀。所以,我们特别希望通过这一本书对遥感智能计算框架的系统提出以及相关实践工作的整理,初步回答如何基于遥感开展精准地理应用的“大”问题。
早在世纪交替的2000 年前后,周成虎院士就带领我和杨晓梅、杨存建、明冬萍、沈占锋、汪闽等几位博士提出了遥感影像地学理解与分析的基础理论与关键方法,当时针对如何从影像空间向地理空间信息转化的问题,认为必须综合遥感成像机理与地学分析思想、机器学习技术开展信息解译,提出了从浅层生理感知到深层心理认知的影像理解路线;后来又通过引入计算机视觉与高性能计算技术,发展了影像深度计算与信息主动计算相结合、以“像元-基元-目标”为体系的高分辨率遥感影像地学计算技术,并曾尝试用GIS 空间图分析的思想来指导信息提取的相关研究。应该说,我们团队在国内较早地开创了高分辨率遥感地学分析与智能计算的研究方向。然而长期以来因地理学思维比较薄弱而对地表的复杂性认识不清,加上对于智能计算技术的运用也只停留在拿来主义的简单套用上,总想试图用一套模型、一次计算去解决影像分类或地物识别的经典难题,而事实上这种处理思路可能连“地物能否从影像上精确而普适地被识别?”这样的基本问题都难以回答清楚。因而在2004 年之后大约近十年的时间里,我对这个方向的研究感到迷茫甚至失去信心!尽管如此,如何从遥感影像中“精细化”地挖掘地理空间信息的“精准遥感”问题,却一直根植于内心而从未改变。
好在周院士对这个方向一直没有放弃!他始终鼓励我们:“对于遥感地学智能计算方向的研究一定是正确的,相信只要不断坚持就一定能取得进展和突破!”指导我们一定不要忽视地理学思想和领域知识在其中应发挥的主导性作用,并形象地用“发挥每一粒像元作用,认清每一寸土地功能”这样一句话高度概括了大数据与人工智能时代对遥感研究提出的高标准与新要求,也为我们的研究指明了方向。在周院士的支持和指引下,通过源自于实践的持续研究与不断思考,我们近年来逐步明晰并深化了对“精准遥感”问题的认识,也正是对这些年工作的凝练和总结才形成了本书的理论与思想。
而回顾这一路,在实践中以问题驱动探索的研究历程中,和各路老师、朋友、伙伴们不期而遇,在探讨碰撞、互帮互助中交叉融合、产生火花,启迪并指导我们完善了这套体系。我回忆起这一路上产生重要启发的几个里程碑式片段,在此记录与大家一起重温,更希望读者以此能对我们的研究背景和发展历程有一个轮廓性的认识:
1
启 程
早在20 世纪90 年代中后期,也就是我就读于资源与环境信息系统国家重点实验室的研究生时代,在何建邦研究员、周成虎研究员、池天河研究员等实验室新老主任们的联合推荐下,我来到香港中文大学地理系跟随梁怡教授学习运用模糊专家系统、人工神经网络等前沿技术开展遥感智能处理与分析的研究,第一次真正接触机器学习方法并开始思考遥感影像理解的科学问题。也正是在香港求学期间结识了同在梁教授门下访问的西安交通大学张文修教授、徐宗本教授和他们的一众弟子。应该说,后来支撑我们研究的主要方法基本都取经于这个群体的老师们,如向吴伟志教授、米据生教授学习了粒计算思想与概念格方法;向马江洪教授、梅长林教授学习了统计分析方法;向张讲社教授学习了尺度空间理论;向张艳宁教授、曹飞龙教授、邵明文教授请教了支撑向量机、人工神经网络和深度学习方法与技术;等等。回想起来,在香港那段时间的学习生活真乃此生最为宝贵的经历,跟随梁教授入门了智能计算领域,也由此开启了和西安这群师兄弟们长期交流合作的愉快旅程。
2
工 匠
若干年后的2012 年,跟随周院士在苏州创建了国产卫星数据处理与应用的基地(中科天启),也在这个阶段周院士规划了由“影像处理机(IPM)”“专题信息生产线(PLA)”和“大数据管理平台(gDOS)”三大系统构成的遥感大数据综合处理与计算体系,并先行对IPM 系统进行了设计与研发。我也在此过程中系统地向武汉大学张永军教授、中国科学院新疆生态与地理研究所杨辽研究员以及贵州迈普李红播老师学习了数据获取和摄影测量方面的技术方法,而感受最深的则是他们身上所散发的对技术与产品极致追求的一种工匠精神。
3
启 示
而真正对遥感智能计算研究产生新想法是从2014 年的一个具体应用需求开始的。当时周院士在湖南国土厅的学生陈建军博士向我们提出了一个非常现实的需求:“能否基于遥感识别湖南省每一块耕地上种植的作物类型,指导政府部门开展粮食种植补贴的精准核算?”于是,我和学生朱长明博士来回长沙几次开展了系统调研,并设计了一套“图谱耦合”的时空协同技术框架,即先精细提取农业地块(图),再准确判断地块上种植的作物类型(谱)。然而受到当时数据获取能力、购买成本以及信息提取技术水平等多方条件的限制,该方案未能顺利实施,但由此给了我们一个启示:遥感精准应用的研究势在必行、大有可为!本专著中时空协同框架的思路正是起源于此,成为后续遥感智能计算体系的雏形。
4
感 悟
在2015 年由西安这群师兄弟们共同组织的一次学术会议上,我们交流学习到了粒计算用于大数据处理的三个核心关键词—“粒化”“重组”“关联”,联想到当时正在探索的遥感图谱认知理论,忽然产生了一种茅塞顿开、豁然开朗的“顿悟”感。于是我们对时空协同框架进行了向“空间”与“属性”分别扩展的优化设计,将空间部分以分层感知的思路独立出来,而让时空协同聚焦于时序信息的重组与分析,再将属性部分独立为多粒度决策,梳理清晰了三个基础模型的逻辑关系,初步形成了本专著遥感大数据智能计算的研究体系。后来又通过不断向数学、计算机领域的学者们讨教,逐步明确了深度学习、迁移学习、强化学习以及粒计算技术在这套体系中如何合理地引入,制定了优化改进的方向。这个过程给我们的启示是:当你清楚了自己想要什么的时候,多学科交叉必然会带来新的思维和创新活力。
5
协 同
从2016 年下半年开始,我们参与了“地理大数据挖掘与时空模式发现”项目的讨论与研究,承担了其中“对地观测大数据时空格局理解与功能透视”的研究任务。在向刘耀林教授、裴韬研究员、刘瑜教授和杜云艳研究员等国内GIS 领域知名学者讨教过程中,进一步深化了我们对遥感与地理学关系的思考,明确了遥感与其他各类地理大数据通过时空聚合开展协同挖掘的思路。针对具体研究目标,我们又提出了以地理图斑作为遥感大数据的认知单元,对应了粒计算中应对大数据处理的粒结构,就此形成了遥感智能计算体系中的图斑理论。
6
落 地
从2017 年至今的三年多探索过程中,我们从未忘记研究的科学问题一定要来源于现实生活与实际生产的初心。而在和各行各业的接触与合作中,也越来越坚定了我们立足于精准遥感方向研究的信心。在广西壮族自治区农业科学院信息所覃泽林研究员的支持下,我们正合作开展针对广西壮族自治区每一块耕地的精准监测与农情服务实践;在和天津大学建筑学院左进博士的合作中,我们共同构建了高分遥感与城市空间设计相结合的理论与技术体系;在与中国科学院地理科学与资源研究所张百平研究员的交流中,我们初步摸清了在山地开展高分遥感研究的基本问题;在与云南林业和草原局尹俊研究员的研讨中,我们形成了在复杂山地开展自然资源遥感精细调查的大致思路;在内蒙古农牧科学院草原中心孙海莲研究员与宁夏农林科学院信息所冯锐研究员的共同推进下,我们正合作开展草地资源精准制图与生态资产评估的探索;在和河北师范大学刘劲松教授的合作研究中,基本了解了人口统计与聚落空间的关系,并分享了第一手的调查数据,为我们开展基于地理综合的社会数据遥感制图研究提供了基础。而特别要提及的是,从2018 年开始,我们瞄准了在极端成像条件下开展山地农业遥感的探索方向,在贵州师范大学周忠发教授的鼎力支持下,一起在贵州落实了综合试验区,初步确立了在多云多雨地区开展精准遥感研究的基本思路,这也是我们立志于在今后几年内力争攻克的研究难题。我们经常说要牢记发哥的一句话:“贵州遥感做好了,全世界任何地方遥感就都可行!”
7
脚 印
科学问题来源于实际应用,而解决问题又离不开技术与方法的支撑。在构建由“分层感知(粒化)”“时空协同(重组)”和“多粒度决策(关联)”三个基础模型组成的遥感智能计算体系过程中,以下四大环节的突破是关键性的:
在2014年构建的时空协同框架基础上,黄启厅博士于2015 年在人工勾画地块之上融合了中分光学时序数据,对地块作物种植类型进行了高精度判别,分别以湖南澧县与广西扶绥为试验区首次实现了地块级作物种植结构的遥感制图,并依据该过程中的实践经验和认识反馈,对“时空协同反演模型”进行了理论完善;
针对人工勾画地块效率低的关键问题,夏列钢博士于2016 年开始追踪深度学习技术,并发展了基于边缘主动学习实现的农业地块智能化提取技术,以此为基础建立并完善了“分层感知器模型”;
与此同时针对遥感非万能的瓶颈问题,吴田军博士又引入了粒计算的思想,在地块之上成功融入了非遥感类的多源数据,进而顺利挖掘了决策式规则知识并开展了地块级评价规划的精准制图和专题应用,据此为基底搭建并发展了“多粒度决策器模型”;
针对多云多雨地区光学时序卫星数据难以获取的痛点问题,周亚男博士于2018 年开始尝试在地块之上用SAR 数据重组时序信息,用深度学习时序模型探索了地块作物的分类方法,初步形成了在多云多雨地区开展作物生长模式挖掘的研究思路。
我们以上述四个关键突破为着力点,从简单到复杂逐步构建形成了遥感大数据智能计算的理论与方法体系,并从中进一步明确了遥感精准应用的发展目标。
与此同时,在周院士的支持与部署下,2018年开始由胡晓东博士和张亚军博士联合,在苏州基地带领周楠、张竹林等几位骨干人员协同开展了技术上的攻关,从无到有地组建了设计、研发、生产、运营和应用一体化的天启PLA 信息团队,将这套遥感智能计算的思想和方法有序地转化为针对农业、林草、城市等领域应用的专题产品生产线,并在2019 年围绕江苏全省精准土地利用产品进行的“大练兵”式的试验生产中,论证了我们由此制作的信息产品在效率、精度和成本各方面都兼具的综合优势。这项工作给我们的启示是:遥感理论与方法的研究必须要与生产应用实践有机融合,科学问题要具有鲜明的需求导向和问题导向特征,才能不断突破,避免闭门造车。
8
回 归
我从小就对外面的世界多有向往,似乎永远都对天空与大地充满着好奇,有很强的方位感,对于地图特别敏感,所以也算是一种缘分,机缘巧合中居然就从事了遥感与地理相关的职业。当年有幸考入到地理所信息室,对我来说就如同半只脚踏入了地理学的门槛。回想在九一七大院(在奥运公园里的龙形水系位置,至今还在大屯路上保留着洼里南口的公交车站)独立三层小楼里的各种往事,在这里结识了一群来自于全国各地、专业背景更是五花八门的师兄弟们,我们在这里一起成长,然后又各奔了东西。
志峰兄无疑是这群伙伴中的“领袖”,只要有他在,整个小楼立刻就增添几份欢乐与热情。志峰确实是我的体育和生活老师,20 年前他带我在北辰购物中心买的那块羽毛球拍子至今还完好地保存在家里,而我后来真正学会的项目却是打乒乓球,水平在业余的业余里面还算是凑合。其实,志峰兄对我最大的帮助是在地理学知识的指导上,每次和他见面,都会结合具体的自然或社会现象给我讲解背后蕴含的地理驱动机制,逐步推动着一个技术男也开始思索起地理学本质的一些问题,特别是关于当今遥感大数据支撑地理场景认识方面的科学问题思考,主要思想还是源自于他的引领。可以说,志峰兄带动着我将另外的半只脚也正迈入到地理学的大门之中。这些年的每一年都会定期带着我的团队奔赴广州,在大学城优美而静娴的珠江水岸聆听关于如何用地理学分析思维来凝练遥感对复杂地表认知的科学问题。所以在这本书写作的萌芽状态,我就首先想到了邀请志峰兄共同来完成撰写,因为地理学与遥感相结合始终是我们共同的愿望与目标,也正是这本书出版的宗旨所在:传承陈先生地学信息图谱的思想,让地理学指导遥感的研究,而遥感研究最终要回归于地理学的问题。
9
未 来
作为中国科学院大学的岗位教师,我和杨晓梅研究员、沈占锋研究员协作每年都在雁栖湖校区开设《遥感信息智能计算》课程。备课和讲学的过程,驱动着我对遥感智能计算理论与方法进行系统思考与认真梳理,而每次上课之中,学生们也表达出很高的学习热情,许多学生都会在课后与我热烈讨论,而我也从中收获了新的认识与体会。另外,这些年我也经常受邀去各地高校讲座,在此过程中和大家共同探讨了这个研究方向,无论是我们地学圈内还是数学或计算机领域的师生,都对这项工作表露了一定的兴趣。为此,学生刘建华博士还特意将讲座分享于微信公众号上,受到了很高的关注。因此,这本书写作的动力很大程度上是源自于为广大师生编写一部系统探讨人工智能遥感参考书的一种意愿。
在前期的写作计划与筹备阶段,我们就确定了把这本书打造为一本能让大多数读者“看得懂”的“科普型”学术著作,重点以讲述思想和分析案例为主,具体的技术细节计划将于后续规划出版的系列专著中深入介绍。在这本书里,我们一再强调将地理学分析思想、机器学习技术以及遥感机理模型有机综合,在面对复杂地表时考虑如何参照地理学家对地表分异与相似规律的认识,从综合地理的角度对关注的问题进行分解和规划,而这恰与系统科学的处理思想是高度一致的。因此当我们今天再回顾钱学森先生30多年前对人工智能发展提出的复杂系统思维时,深刻感觉到经典思想对我们当前智能遥感研究仍具有重要的指导意义。
纵观本专著针对遥感信息智能提取的研究,我们始终在努力理解并传承陈述彭先生于20 世纪提出的遥感地学分析与地学信息图谱思想。例如,在我们体系中最先发展的“时空协同反演模型”就是依据图谱分析思想设计形成的;进一步从中分解出来的“分层感知模型”则是将地学分析中分区分层思想与机器学习技术进行了有机融合,从而增强了基于遥感影像对复杂地表的“图”理解能力;而同步发展的“多粒度决策模型”则希望在知识层面将数据与机器学习技术再一次深度融合,试图构建形成面向地学应用的一套“知识图谱”。因此,我们孜孜不断追求的遥感“精准”应用目标,本质是努力实现图谱耦合的认知过程,其中“精”是体现在对复杂地表用精细化“图”方式的场景表达,“准”是体现进一步重组各类数据形成“信息谱”之后,再通过地理模式的挖掘实现对“图”内在机制和运行过程“知识谱”的透视发现。也就是,遥感大数据智能计算的研究是对复杂地表之上实现“从现象到本质”“从定性到定量”逐步提升的图谱耦合认知过程。
在21 世纪第三个十年的开端之际,我们谨以此书纪念陈述彭先生100 周年诞辰,期望在当前大数据和人工智能的新时代,以陈先生地学信息图谱思想为引领,以对复杂地表的系统认知为切入再一次启程遥感地学理解与分析计算的实践之路!
骆剑承
2020 年2 月9 日于北京
【相关阅读】
本文摘编自《遥感大数据智能计算》(骆剑承等著. 北京:科学出版社,2020.8)一书“前言”,有删减,标题为编者所加。
(遥感大数据地学理解与计算;下)
ISBN 978-7-03-065386-4
责任编辑:杨帅英 张力群
将遥感影像智能化地提取为地理信息,为地理大数据挖掘提供位置发现与时空关联的基准,是当前遥感认知研究所面临的挑战与机遇。本书综合地理分析思想、图谱认知理论与机器学习技术,设计从浅层感知到深层透视的路线,发展了遥感大数据智能计算模型与精准应用方法。本书分8章:第1 章提出地理与遥感大数据的主要特征、科学问题以及关键思想;第2 章论述地理图斑概念及遥感智能计算理论;第3 章介绍机器学习的遥感计算运用机制;第4 章阐述精准LUCC 生成相关技术;第5~7 章分别针对城市、农业与生态应用,介绍精准遥感应用的实践路线;第8 章提出基于综合地理的土地空间优化技术方法。
本书主要论述人工智能新时代的遥感地学分析基础理论和关键方法,可供遥感测绘、地理信息技术及应用等领域的科技人员和研究生阅读参考,也可作为高等院校相关专业的教学和研究资料。
《遥感图谱认知》在充分认识遥感认知特殊性的基础上,发展和完善了遥感图谱认知理论和计算方法体系,发挥人脑认知和机器认知的各自优势,将人脑认知所得的先验知识有针对性地逐步融入机器认知过程中,一定程度上提高了遥感影像机器认知算法的智能化水平,为遥感影像的智能认知探索可行之路。全书共为8 个章节。第1 章绪论,简要介绍本书研究的背景和意义,以及高分相关研究的现状与趋势。第2 章总领性地介绍遥感图谱认知理论和方法体系,重点介绍遥感图谱认知三段论及其流程。第3~8 章则分别围绕遥感图谱认知三段论开展具体方法介绍和研究细述,其中,第3~5 章属于图谱认知第一段的“由谱聚图”框架,分别介绍影像多尺度分割算法、自适应迭代的专题信息提取,以及地块级土地利用图斑的形态提取和属性分类方法;第6 章属于图谱认知第二段的“图谱协同”框架,分析如何协同中、高分遥感影像数据开展农作物种植分布的土地覆盖类型识别;第7、8 章属于图谱认知第三段的“认图知谱”框架,分别介绍历史知识迁移的遥感影像智能分类与信息更新技术,以及基于空间格局知识开展复杂专题信息提取的方法。
(本文编辑:刘四旦)