好文推荐 | 遥感大数据:信息提取模型的发展演化
遥感人的成长家园
官网
标题:Remotely Sensed Big Data: Evolution in Model Development for Information Extraction(遥感大数据:信息提取模型的发展演化)
作者:Bing Zhang[1]*, Zhengchao Chen[1], Dailiang Peng[1], Jón Atli Benediktsson[2]*, Bo Liu[3], Lei Zou[4], Jun Li[5] and Antonio Plaza[6]
[1] Key Laboratory of Digital Earth Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing100094, China
[2] University of Iceland, Reykjavik IS 107, Iceland
[3] Nanjing University of Information Science & Technology, Nanjing 210044, China
[4] Texas A&M University, TX 77843, USA
[5] Guangdong Provincial Key Laboratory of Urbanization and Geo-simulation, School of Geography and Planning, Sun Yat-sen University, Guangzhou, 510275, China
[6] Hyperspectral Computing Laboratory, University of Extremadura, Avda. de la Universidad s/n, E-10003 Cáceres, Spain
*E-mail:zb@radi.ac.cn
杂志:Proceedings of the IEEE,Vol. 107, No. 12, pages 2294-2301 (2019)
DOI:10.1109/JPROC.2019.2948454
网址链接:
背景信息
当今遥感技术广泛应用于地球观测的各个领域,包括水文学、生态学、海洋学、冰川学、地质学等,以及军事、情报、商业、经济、规划等诸多方面,其通过航空航天平台上的主动、被动遥感器获得不同波谱特征和空间分辨率的遥感图像,这些图像记录了地物电磁波信号或能量,借此构建数理模型可描述地物特征。
在上世纪60—80年代,虽然在遥感器谱段设置中遵循了一定的地物电磁波谱特性准则,但是基于精确的图像物理量纲、尤其是与地学过程模型的深入耦合研究还是比较少见的,遥感信息提取更多的是对遥感图像本身的信息增强处理,常用的图像处理算法更多偏重于图像灰度拉伸和对比度增强等相对变换以利于图像目视判读,目标探测、图像分类、地物参数提取等遥感影像应用通常是基于地表观测值与影像DN值、或反射率、或反射波段组合等之间的统计模型(Statistical Model),这是一个遥感信息提取的“数字信号处理时代(Digital Signal Processing Era)”。
由于遥感的成像条件极易受大气、地形等外在因素的影响,统计模型始终受到样本代表性和模型通用性等问题的困扰。上世纪90年代,以地物发生发展的过程机理为基础,研究遥感信息源与传输介质、地物目标间相互作用的定量过程和结果,建立物理模型(Physical Model),如辐射传输模型、几何光学模型、混合模型等,定量地反演或推算相关目标地学参数。一个标志性事件是从2000年开始美国地球观测系统卫星开始提供MODIS全球定量遥感产品,这使得研究人员可以借此发展更多的遥感物理模型, 遥感信息提取也自此进入了“定量遥感时代(Quantitative Remote Sensing Era)”。
2007年1月11日图灵奖得主、著名的计算机科学家Jim Gray在美国国家研究理事会计算机科学与通讯分会(NRC-CSTB)上首次提出了基于数据密集型科学研究(Data-Intensive Scientific Discovery)的第四范式(Paradigm),也就是后来所称的“大数据(Big Data)”。它是继实验科学范式、理论科学范式、计算科学范式之外,人类认知领域的一种全新方式。它既包括数据本身,也包含信息挖掘方法论。2010年以后,空间对地观测科技的飞速发展为人类提供了超高维度和超高频次的地球观测数据,加之人工智能科技的兴起,遥感信息提取也逐渐步入了“遥感大数据时代(Remotely Sensed Big Data Era)”,在此背景下遥感信息提取在方法与应用等方面又将面临着新的机遇与挑战。
主要内容与观点
1
遥感大数据中的深度学习(Deep Learning for Remotely Sensed Big Data Exploitation)
进入2010s以来,海量、多源、异构数据的快速增长不仅带动了遥感数据分析方法和技术的快速发展,也改变了人类利用遥感数据认知世界的方式。传统上,遥感界主要通过实验手段和理论方法构建信息分析模型,显著依赖于先验知识和经验。而在以数据密集型科学发现为显著特征的新时代,遥感信息提取和知识发现主要借助于对大量数据的深度挖掘和学习,聚焦于数据本身而非固有先验知识。我们将这种基于大量数据样本驱动下进行知识发现和信息提取的模型称为数据模型(Data Model)。
数据模型的本质是以大样本数据为基础,通过智能方法自动学习地物对象的遥感化本征参数特征,进而实现对信息的智能化提取和知识挖掘。数据模型不仅对计算能力提出了更高的要求,而且对数据处理方法本身也提出了新要求,传统处理方法无法满足遥感大数据的处理精度和效率。
深度学习(Deep Learning)作为人工智能(Artificial Intelligence)的新领域,近年来在图像识别和语音识别等领域取得了创纪录的突破性进展,于2013年被列为10大科技突破之首。深度学习迎合了遥感信息领域的时代迫切需求,同时提供了智能信息提取的高阶方法论和实现途径。作为基于数据表示的一类机器学习方法,深度学习具有适用于遥感信息处理的以下四个显著优势:
(1) 显著地降低了传统遥感信息处理方法对先验知识的依赖;
(2) 可以提取遥感图像内在的丰富语义特征;
(3) 具备表征遥感尺度效应的潜力;
(4) 具有强大的非线性关系学习与处理能力、以及对特征的多维表达能力,更好地契合了遥感地表过程的复杂特性。
这些优点导致了深度学习在遥感信息提取中大放异彩,并且使数据模型成为遥感大数据时代的显著标志。当前,深度学习已经渗入了众多遥感数据分析领域之中,彰显了深度学习在遥感领域的巨大优势和应用潜力,如:目标识别(Target Detection)、图像分类(Image Classification)、参数反演等(Parameter Retrieval)。
2
遥感信息提取模型的发展演化 (Summary of Developments in Remote Sensing Models)
根据上述分析,可以清楚看出遥感信息提取技术历史发展脉络。另外,通过遥感领域两大权威期刊(Remote Sensing of Environment、IEEE Transactions on Geoscience and Remote Sensing)1973年以来遥感信息提取采用统计模型、物理模型、数据模型的文章所占比重随着年代的变化分析,总结遥感信息提取技术所经历这三个阶段明显的特征。
(1) 1970s—1990s的“数字信号处理时代”: 遥感信息提取实现途径主要是采用数字信号处理方法,对先验知识依赖性较高,信息获取的本质实际上是一种信息增强,是一个以统计模型为主、物理模型发展的时期。发表的遥感信息提取技术论文中统计模型一直占据很大的比重(>50%),但自20世纪70年代末以来统计模型逐年呈下降趋势,物理模型所占比重开始上升。
(2) 1990s—2010s的“定量遥感时代”: 遥感信息提取主要采用解析计算的方法,对先验知识依赖性也较高,信息获取是通过已知的物理过程模型演算而来,是一个统计模型与物理模型并重、数据模型开始起步的时期。从文章统计分析来看,这个时期统计模型比重下降最快,物理模型比重上升最快,两者交叉出现在90年代中期,主要物理模型包括大气校正模型、植被与土壤的双向反射分布函数物理模型、海洋生物光学模型等,数据模型在此期间所占比重约5%左右。
(3) 2010s至今的“遥感大数据时代”: 是一个统计模型逐渐明显衰退、物理模型稳步推进、数据模型快速发展的时期。尤其是近些年,数据模型应用的比重占到18%左右。以深度学习为代表的数据模型成为这个时代遥感信息提取最显著的特征,对先验知识依赖性低甚至不依赖,信息主要是基于数据自身驱动的知识和规律发现,不仅可以处理已知的理论过程模型,也可以处理那些未知的机理过程。
从文献调研的趋势分析可以看出:统计模型在未来所占的比重将持续下降,物理模型仍是主流;从2012年开始,基于数据模型的遥感图像分析与应用文章增速开始超越物理模型,这标志着遥感大数据时代的逐步到来。当然,可以预见,在未来较长一段时间内,全球科学家将继续致力电磁波谱与地表、大气等作用的物理机理研究,推动物理模型的进步,但由于深度学习能够满足复杂多样的遥感应用需求使得数据模型的发展将有巨大的飞跃。
尽管数据模型可以克服统计和物理模型所面临的困难,但我们认为这些模型不能独立使用,恰恰相反,将这三种模型的优势结合起来,在复杂的场景中利用它们的独特能力是很重要的,为了支持各种定制的、更精细的应用需求,这三种模型的边界将来可能变得模糊,将形成充分整合后的模型。
3
讨论与总结(Discussion and Conclusion)
以深度学习为代表的数据模型已成为这个时代遥感信息提取最具创新性的标志,基于本文的总结分析,提出了以下三方面研究内容:
(1) 深度学习模型在遥感信息提取中有很大的应用前景,但目前可用的训练样本数量有限。对此,创建适用于有限标记样本的鲁棒性模型显得非常重要,这样可降低获取具有大量标记样本的新数据集成本,也可将减少训练时间和创建鲁棒性模型所需的标记样本数量。
(2) 新的大数据处理框架是处理大量遥感数据的普通解决方案。对此,需要进一步探索高性能计算和高通量计算替代方案,包括基于云计算解决方案的GPU并行化和集群分布/并行化。
(3) 低功耗和高功耗计算架构都需要研究如何应用于实时数据处理,以便全面评估和进一步优化深度学习模型,从而可以显著地减少数据解译过程中的地面计算与数据通讯压力。
文章图表
图1 遥感信息提取模型发展的时代特征
Development periods in remote sensing models for information extraction
图2 两期刊自1973年以来涉及不同遥感信息提取模型的文章数量比较
Analysis of the percentage (left axis) and the number of articles (right axis) published since 1973 in two of the main remote sensing journals: Remote Sensing of Environment and the IEEE Transactions on Geoscience and Remote Sensing. Red, green, and blue lines: the percentage of articles on statistical models, physical models, and data-driven models, respectively. Black line: the total number of articles published in the three aforementioned categories (right axis).
好文速递
遥感资讯
专家报告丨基于无人机航拍的黄河源玛多县大型野生食草动物种群数量调查
会议招聘
更多精彩信息,请关注“遥感学报”微信公众号!
1
END
1
编辑:悠悠
指导/审核:梧桐君
声明
欢迎转载、转发本号原创内容,转载信息请与本号联系授权,标注原作者和信息来源为《遥感学报》。
本号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请在20日内与本号联系,我们将在第一时间处理。《遥感学报》拥有最终解释权。
微信入群
为便于学术交流,提供优质服务,《遥感学报》建立了微信群。需要加群的小伙伴,请加小编个人微信入群,并备注:姓名+单位。营销广告者勿扰。
微推转载、合作联系:
E-mail:jrs@radi.ac.cn 或 微信后台留言。
电话:010-58887052
邮箱:jrs@radi.ac.cn
网站:www.jors.cn
点小花花,让他们知道你“在看”我