查看原文
其他

人工智能时代的地图绘制

慧天地 2021-09-20

The following article is from GISer学习团 Author 沙德轩

点击图片上方蓝色字体“慧天地”即可订阅

“欧比特杯  ”高光谱遥感影像智能处理行业应用大赛已于2019年5月24日开始接受网上报名。报名请关注《慧天地》微信平台大赛通知

比赛通知|关于举办“欧比特杯” 高光谱遥感影像智能处理行业应用大赛的通知

或欧比特网站https://ohs.obtdata.com

现在人工智能在各行各业都已经应(烂)用(大)广(街)泛(了),从手机到智能家居设备,从生活场景到工作场景,我们似乎已经离不开人工智能相关的概念和应用了。说到地图绘制领域,人工智能或者机器学习的发展又能给它该来哪些改变呢?让我们一起跟随作者(Tim Wallace)的这篇文章,来详细了解下人工智能时代地图绘制技术将如何演变。


机器学习,指一项通过经验和数据强化计算机系统的技术。

O’Reilly 提供的流程图

当你在地图设计的语境下思考机器学习时,需要从感性思维转换到理性思维上,与通常将规则(数学公式)应用于数据来得到答案的传统方法不同,机器学习的方法是通过使用数据本身和加了标签的训练数据集来帮助我们寻找相关关系和有效的判断条件。比如下面应用场景:

“嘿,机器学习算法,我这里有张航空影像图,里面拍到一些樱桃树,另外还标记出了其中一部分樱桃树在什么位置,你能不能告诉我剩下没有标出来的樱桃树在什么位置?多谢了!”

通常情况下,我们放入训练模型算法的标记数据越多(这些数据要能够标识出识别目标的细微差别),算法就越能够找到目标物体的提取规则。 对于上面说到的提取樱桃树的问题,如果样本能体现出各种花朵颜色、树木大小和分支模式这些自然中的真实状况,那么训练效果会比较理想。 但是就像人类大脑的思考模式一样,如果我们在训练集中加入了过多细节,那么机器学习算法可能会感到困惑。这种现象称为过度拟合over-fitting,通常会产生不良的结果。


粗糙制图时代的人工智能“实战”

举一个人工智能的例子-- Photoshop的内容感知填充工具。从表面操作上很难看出这个功能背后的运行机制,但可以肯定的是人工智能算法在背后发挥了重要作用。这个工具基于图案的接近度和相似度,用图像中其它区域的图案填充选定的区域(这个功能最近被Adobe拓展到了视频应用中)。


在2010年的NACIS制图会议上,我首次接触内容感知填充功能。当时Alex Tait宣布在修改小区域图像时将用这个功能替代原来的“克隆工具” 。


下面这张图是哨兵2号拍到纽约市,前后两张图对比可以看出水体部分被自动“内容感知填充”了。这张gif图像表述了人工智能在卫星影像处理中的“强大”和“傻缺”的功能。大多数的水体部分被城市的蔓延图案填充。从图像可以看到哈德逊河、东河和长岛海湾被填满了“建筑物和街道”图案。

gif图太大,无法上传,注意箭头所指处

但也有一些相对自然的地方,比如:新泽西州的帕塞伊克河和哈肯萨克河布满了绿意。临近河流的区域大多是湿地,所以河流被湿地填充看起来也很自然。

gif图太大,无法上传,注意箭头所指处

有的地方却很滑稽,在布朗克斯区和白石大桥上,特朗普高尔夫球场被扩展到超大规模。球场上增加了大约50个球洞,这些球洞蜿蜒穿过Throggs Neck和Rikers Island之间的大部分区域。 Soundview公园的田野和赛道也被扩大了三四倍。这些区域都被城市的形态所填充。

gif图太大,无法上传,注意箭头所指处

另外一个地方是罗斯福岛南部东河段。 在这里,StuyTown被完整复制填充到联合国总部到长岛市海滨之间的空间中。

gif图太大,无法上传,注意箭头所指处

计算机视觉 VS 机器学习

既然我们已经用纽约作为研究案例,那就再多举一些纽约的例子。

哨兵二号RGB影像,纽约市,2018年7月7日

这是一张哨兵2号拍摄的夏季的纽约市。它看起来就像我们用手机拍摄的彩色照片一样,在GIS或RS中,专业术语叫做真彩色图像。与人眼不同,像哨兵二号和Landsat-8这样的卫星捕捉到的是电磁波谱信号,光谱中的红、绿和蓝波段都是分开获取的。如果把不同光谱制作成动画,这种波段切换会显示出快速移动的元素,就像下图1月份的拉瓜迪亚机场附近的场景一样。

2019年1月31日在拉瓜迪亚机场附近拍摄的哨兵2号序列波段

我们必须把几个不同波段的图像按照顺序融合到一起才能生成真彩色影像。下面三张图像是红、绿、蓝三个波段的全色影像图,亮度高的地方表示该光谱颜色更深。蓝色波段那幅图的水体部分比同一区域的红色和绿色波段更亮一些,所以水体一般看起来是蓝色的。

绿

当我们把这几张图像以红、绿、蓝组合合成后,就得到了之前看到的真彩色图像。当然还有其它更有趣的波段组合方式。


以我们最为熟悉的植被制图--归一化差异植被指数(NDVI)为例,NDVI是一种经典的制图运算方法,主要用来绘制阔叶和针叶植被。NDVI是计算公式为近红外波段与红色波段之差除以近红外波段和红色波段之和。图像上亮度最高的植被用最亮的像素点表示:

纽约市的NDVI图像

如果想让地图效果看起来更好看些,可以把NDVI图像使用彩色色谱进行渲染,亮度对应绿色程度来表示植被:


用绿色渲染后的纽约市NDVI图像

利用这种技术,我们可以轻松识别出图像中的公园、高尔夫球场、公墓、湿地和街道上的树木覆盖和草地情况。NDVI在植被制图中效果很好,被广泛应用于相关领域。

NDVI图像的”哈里斯边角检测”结果图

计算机视觉经常与机器学习概念混淆。在卫星影像中,计算机视觉经常被用于识别模式。比如在上面图像的例子里面,计算机视觉模型被用来提取纽约植被图像中的边缘角(一个专业概念)。这是1980年就提出来的老方法,只是用到了一些高级的数学工具,所以不能被理解为机器学习。


但是最近计算机视觉的算法变得越来越强大,人们开始把机器学习算法融入其中。这些算法可以在图像里识别模式、识别图像本身,还可以分割图像(把图像中的物体从背景中分割出来)。


试想在一张全家福合影里,计算机视觉的机器学习算法可以把每一个家庭成员的像素轮廓勾勒出来,包括猫、狗和背景中的一个鱼缸,算法甚至可以告诉你哪个人是你的奶奶。

机器学习算法绘制出来的树(黑框中)与NDVI对比效果

我已经开始用机器学习给树木植被制图了,这是机器学习在制图学中应用的例证。为了让纽约植被地图的制作更为精准,笛卡尔实验室使用激光雷达作为地面真值来训练算法。一旦算法训练成功,训练好的模型可以被应用到任何一米分辨率的航空或卫星影像。如上图我们看到NDVI与树木的对比, 当树木地图被显示时,新泽西公园和沼泽地的草地逐渐消失。


被支配的传感器们

地图绘制工作一直都是由手工完成的。 在整个制图历史中,每当出现新的制图技术,地图制作者们通常都会积极接纳,以便节省地图绘制时间和提升地图制作质量。 比如当人类开始乘坐热气球升空飞行时,地图制作师们争先恐后地利用这一技术获得观察地物的新视角,并将看到的内容呈现在地图作品中。 当摄影技术被发明后,制图师们又积极地拍摄鸟瞰图并将其纳入到地图制作的流程中。


19世纪60年代,James Wallace Black拍摄了历史上公认的第一张美国境内的航空影像,随后基于热气球测绘制图的方法发展迅速。1862年,亚伯拉罕·林肯让地形工程局设立了一个“气球部队”,用来在维吉尼亚半岛战役期间监视美国南方联盟军队。

1860年左右获取的波士顿航照图

不到一个世纪的时间里,摄像机和其他传感器被固定在气球上,然后被搭载到飞机、火箭和卫星上。卫星一旦成功发射,就会一直运行下去。 现在,人类拥有无数的卫星和无人机,可以以更快的速度、更高的分辨率以及更多的电磁波光谱波段来记录地球表面的信息,于是海量数据蜂拥而至。

目前在轨的卫星


机器学习成为制图的神器

传统的系统无法有效处理由新传感器获取的海量数据集。现在人们遇到的最大问题是:如果不使用云计算,传统的计算过程需要花费过多时间。虽然有些数据集已经被建立了索引,但是手动寻找合适的数据集并在数据里选取特定的要素仍然会消耗大量时间。即使你拥有完美的数据集,制图过程中的某些步骤,例如对图像进行分类,仍然非常繁琐且费时费力。

从遥感影像到地图的制图过程

未来可待。我们正在被传感器革命中产生的新数据冲击,但我们也在见证机器学习技术的飞速发展,这些技术有助于挖掘我们真正想要和需要的信息,从而摆脱数据泥潭。

“纽约时报”制作的地图集中的一幅,该地图使用了微软通过机器学习算法生成的建筑物轮廓数据集

上图是来自纽约时报的一幅插图,展示了波士顿地区的建筑物轮廓信息。这张图使用的是开源建筑数据集。该开源建筑数据项目来自微软公司,他们利用了125,192,184台计算机生成了全美50个州的建筑轮廓数据。(微软不止生成了美国主要城市的建筑轮廓数据,最近还把加拿大主要城市的建筑轮廓数据生产了,还免费共享了出来,之前我在知识星球中做个分享,详见  https://t.zsxq.com/VfIe6AA)


通过这份地图,我们可以了解到使用机器学习进行绘图的潜力(如果我们可以绘制美国的所有建筑物,接下来我们可以做些什么好玩的呢?!)。 虽然微软的数据集在美国大部分地区表现良好,但在局部地区也存在一些问题。因此“纽约时报”使用本地数据源修补了数据中的一些问题,并将最终成果共享在MassGIS项目中。


在宏观尺度,机器学习算法产生的结果是非常棒的。但如果地图制作者仔细审查了该地区内某个具体数据,则可以将审校后数据替换掉机器学习的分析结果。 换句话说:

在人类专家的监督协助下,机器学习在造地图工作中可以完胜之前其它方法!

笛卡尔实验室用机器学习算法在影像图上识别出的变电站

当人类专家开始跟机器学习算法协作时,可以做出超级棒的效果。诺丁汉大学的Doreen Boyd曾经用机器学习方法绘制过奴隶制的轨迹。其它科研机构比如微软用机器学习技术识别建筑物。笛卡尔实验室正在用机器学习技术在影像上识别核电站、森林野火、树木植被、太阳能电池板安装、风车涡轮机、森林开伐、油井开采等地物。如果人眼可以很好的识别独特的地形模式,那我们就可以把机器学习算法训练的跟人类一样优秀。

南卡罗来纳州Henrietta城外的太阳能装置,由笛卡尔实验室利用机器学习算法识别

所以,只要计算机视觉和机器学习继续变得更强大和更精致,它就可以成为绘制地图的神器。当部分工作可以交给机器训练算法来完成时,我想应该没有地图制作者还想手工操作吧!制图师们可以专注于最重要的部分,设计出更清晰和美观的地图来讲故事。


如果我还要重做几十年前在制图学初级课程中的大作业,用彩色铅笔对航空照片进行分类,我肯定会让机器学习算法来帮助我完成这个工作。

来源:GISer学习团(说明:本文原文来自medium网站上的一篇《Mapmaking in the Age of Artificial Intelligence》,在翻译和审校过程中,GISer学习团根据中文阅读习惯对部分内容进行了些许的删减和调整。)版权归原作者及刊载媒体所有

文章翻译:沙德轩

内容审校:张云金

欢迎大家关注《慧天地》同名新浪微博

微博ID:慧天地_geomaticser


荐读

点击下文标题即可阅读

国际瞭望|五角大楼人工智能中心将重点解决这4个问题

研究绘制精度更高的全球气候划分地图

人工智能即将进入产业爆发的拐点

编辑 / 呼慧珊 审核 / 黄兰琳 李梦夏

指导:万剑华教授

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存