查看原文
其他

GIS笔记 | 基础空间分析 Basic Spatial Analysis (上)

沈劼 六把铲 2023-06-25
GIS, a powerful set of tools for collecting, storing, retrieving at will, transforming, and displaying spatial data from the real world for a particular set of purposes. 
Burrough, 1986
上学期选修了斯坦福地理空间中心的GIS基础课,这学期又上了一门考古GIS。于是决定把笔记整理出来,以免自己之后忘了。新的笔记GIS系列,以我上课的笔记、老师给的lab和部分教材内容为主。由于我是新入门,所以我的记录和理解必然会有错漏之处;同时由于是英文翻译过来的,所以中文术语或表述可能有不准确的地方,大家仅作参考。有问题请随时指出,我们共同进步。
教材(Libgen可以找到全本pdf;本文插图都源于教材第九章):

Bolstad, Paul. GIS Fundamentals: A First Text on Geographic Information Systems, Sixth Edition. Sixth edition. Ann Arbor, MI: XanEdu Publishing Inc, 2019.

上学期初的时候有朋友问我学GIS除了把地图做好看一点还有什么用,我当时颇有一些无言以对。因为我确实没有想到除了数据可视化之外,GIS还能对我的研究有什么本质上的帮助。上了一学期的课,又拿着自己手上的数据试了几遍,我逐渐意识到GIS方法根本上还是对数据的管理和呈现。相比常见的数据处理,GIS的数据多了一个空间坐标信息(coordinate data),所以常常会让我把关注的重心放到地理空间属性上,从而忽略了别的数据属性(attribute)。
因此要把GIS用好,熟悉软件的操作方法是一方面,另一方面则是要理解自己手上有什么样的数据,想要解决什么问题或者达到什么效果。这就是我先整理基本的空间分析方法的原因。之后会跟着老师上课的进程,梳理一些基本的GIS在考古研究中的应用方法。
一、空间分析简介
要素 Feature:就是我们要处理的空间对象,在地图上以点(point)、线(line)或面(polygon)的形式存在。
属性 Attribute:就是一个要素包含的各种特征,比如一个代表房屋的点,其属性表里面可能记录了“建造年代”“面积”“材料”等属性。再比如田野调查用GPS记录采集到的陶片位置的时候,陶片在地图上以点要素的形式存在,而每个陶片的陶色、陶质等属性也会同时记录下来。
所谓空间分析,就是对要素的坐标(coordinate)及其关联属性(attribute)数据的分析,通常有三个范围:Local, Neighborhood, Global。
1.1 Local operation:通常只使用一个要素(feature)的数据,所用数据也仅关乎该区域本身,与相邻地区无关。如下图所示,每个区域的人口密度都是根据该地区的数据算出,和别的区域无关。
1.2 Neighborhood operation:通常结合多个相邻的要素分析得出结果。如下图所示,计算每个州的接壤州的数量。
1.3 Global operation:需要使用所有要素的数据才能得出所需结果,通常用于进行排位、顺序、比例等分析。如下图所示,对每个州1990年总人口数进行排序。

二、查询(selection)
查询,也可以理解为筛选,是根据自己的分析需求,设置某个(些)条件或者标准,然后查找出满足条件的要素。可以对要素的数据属性进行查询,也可以对其空间位置进行查询。比如那些地区的人口超过一百万,或是哪些国家靠近海岸线等。
2.1 集合代数(set algebra)
集合代数主要用“小于<”,“大于>”,“等于“=”,和“不等于<>”等条件进行查询。如下图所示,“state = Vermont” 即是查询图中属于Vermont州的城市;“state <>New York” 即是查询不属于纽约州的城市。
举个考古的例子,可以用来查询某个遗址内,完整器物大于五个的遗存数量。
2.2 布尔代数(Boolean Algebra)
布尔代数是使用“或”,“与”,“非”等条件来进行查询,往往用于将不同的集合代数条件联合起来,进行多种条件的查询。如下图所示,例1中所列条件筛选出了“面积大于100,000,并且农场收入少于一百亿”的地区。例2则是筛选出不属于德州的地区,也等同于state <>Texas。例3则是一个复合使用,筛选出降雨量大于1000,并且税收较低或是房价低于65000,并且犯罪率较低的宜居地区。
举个考古的例子,可以查询遗址内出土了青铜器或玉器,且墓主性别为女性,但是没有二层台的墓葬。
摘自维基百科:布尔代数(英語:Boolean algebra)在抽象代数中是指捕获了集合运算和逻辑运算二者的根本性质的一个代数结构(就是说一组元素和服从定义的公理的在这些元素上运算)。特别是,它处理集合运算交集、并集、补集;和逻辑运算与、或、非。(基本就是高中数学里集合的概念)
2.3 空间查询 (Sptaial Selection)
前两种查询主要是对要素的属性(attribute)进行查询,而空间查询则是基于空间关系进行查询。包括邻接查询(adjacency),距离查询(proximity selection),包含查询与落入查询(Contain,Within),相交查询(Intersect),等。
2.3.1 邻接查询 Adjacency
于查询与别的要素相接的要素,一般用于查询面要素(polygon)。如下图所示,查询与亚利桑那州邻接的州。邻接的标准如果是共享线条,则科罗拉多州以外的州都算邻接,如果是共享某一个点,则科罗拉多州也算入邻接。
举个考古的例子,可以划定好考古学文化范围后,查询邻接的考古学文化。
2.3.2 距离查询(proximity selection)
距离查询是选定一个要素,设置一个距离范围,然后查询离这个要素特定距离内的其他要素。最常见的距离查询工具就是缓冲区(buffer),即在某个面要素周边生成一个缓冲区,然后筛选出位于这个缓冲区内的其他要素。如下图所示,距离黄色区域60公里内的点都被选中。
举个考古的例子,可以查询在某个中心遗址特定范围内的其他遗址或遗物。
其他距离查询的工具介绍可参考:https://pro.arcgis.com/en/pro-app/latest/tool-reference/analysis/an-overview-of-the-proximity-toolset.htm
2.3.3 包含查询与落入查询(Contain,Within)
包含查询(containment)是选定一个要素A,对包含A(不管是全部包含还是只包含部分)的要素进行查询。落入查询(within)则是A完全落入另一个要素内,对这个完全包含A的要素进行查询。
如下图所示,黑色线条为密西西比河,灰色部分为“包含”了密西西比河的州,但密西西比河并不“落入”某一个州。
举个考古的例子,可以查询落入某河流域范围内的遗址。
三、分类(Classification)
在数据量较大的时候,对数据进行一个分类分组,然后再进行可视化,就可以简化数据突出重点。
3.1 数值分类 (classification of values regardless of shape)
如图所示,图中不同的街区人口不同,如果各自用不同的颜色代表并显示在图中,就会一片花里胡哨,毫无作用。但如果分成小中大三组,各自设定好人口范围,就可以只用三种颜色来表示街区的人口数量,简洁明了。
或是二分类(Binary classification),即根据“是”或“否”满足某个条件来分类。如下图所示,根据位于密西西比河的东岸或西岸,各州被赋予了0和1值。
3.2 数据定义分类(Data-defined classification)
3.1.1 等间隔(Equal-interval classificaiton),即将数值范围(如人口从0到5133)三等分:0-1711, 1712-3422,3422-5133。这样第一组街区的数量最多,第二组其次,第三组最少。
3.1.2 等积(equal-are classification),即设定三组内含的要素数量一致,然后再进行区分。这样就会分成0-902,903-1223,1224-5133三组。
3.1.3 自然断点(Natural breaks classification),即根据频率的本身峰值变化来分类。
不同的分类方法各有利弊,要根据自己的研究需求,和对数据的理解来选择合适的分类和可视化方法。
四、融合(Dissolve)
融合主要用于将相似的要素组合起来,如之前二分类所举的例子,将各州按照密西西比河东西岸进行分类后,就可以将同类的要素融合,形成一张东西部的地图。
又或是街区人口图,将同属一组的街区融合后,就可以更直观地看到人口分布。
当然,不同的分类和融合方法,最后可能会产生截然不同的结果和视图,这就是可塑性面积单元问题(modifiable areal unit problem (MAUP))。如下图所示,左上角为地区人口的平均年龄,而剩下三张图分别代表了三种不同的分类方式,以及融合后大区域的平均年龄。因此在选择数据处理方法的时候一定要慎重,要想清楚自己的问题是什么,想要借助数据表达什么。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存