查看原文
其他

文科出身的考古学生如何入门科技分析方法 | 考古GIS基本概念

沈劼 六把铲 2023-06-25

It is important to acknowledge that ... a useful conception of GIS is as a 'spatial toolbox'.

- Wheatly and Gillings, 2002

一、地图投影和坐标系相关

地图投影 Map projection:是一种在二维地图上表示地球三维表面的方法。在将地球的球形或椭球形表面变换到平面上的时候,被展平的球面会有一定程度的变形。

就像图一的橙子一样,当橙子皮被剥下铺平,越靠近顶端面积越小,但是在地图上所显示的面积却是和中间大块的皮一样的,这就是将三维球体投向二维平面时的形变。如果想要减小形变,那我们看到的就不是常见的方形地图,而是如图二所示的样子了。

(图1,图源:

https://www.reddit.com/r/MapPorn/comments/c2lcoy/visualizing_the_distortion_of_webmercator_with_an/



(图2,图源:https://geohackweek.github.io/visualization/02-projections/)

坐标参考系CRS(Coordinate reference system):是一种定义一组坐标,用于表示地球表面位置的系统。由于地球并不是一个规则球形,在进行地图投影的时候,通常使用的是虚拟的模型(如规则球形、椭球形,以及更准确反映地球形状的其他模型)。而在设定坐标的时候,基于不同模型生成的坐标系也会不一样。如图三所示,不同的投影方式会形成不同的地图,要准确表示地图上点的位置,就需要使用合适的CRS。

(图3,图源:课件)

所以我们在使用空间数据之前,一定要注意数据的CRS,不同的地图投影可能会产生不同的角度、距离、面积和形状扭曲,必须使用适当的坐标参考系以确保在投影中使用的坐标准确且有意义。

老师曾经给我们讲过一个在外蒙调查的经历,他们根据以往的调查数据跑了好几个点,什么都没看到,然后才发现司机所用的导航系统的CRS和他们记录所用的不一样,在对坐标进行了调整之后才成功找到了遗址点。

美国常用的CRS似乎是WGS 84,老师还提过他倾向于用UTM,因为UTM的测量单位是米,比经纬度能更直观地体现遗址或遗存的空间距离。国内的话,根据我的朋友圈调研结果,是WGS84,西安80,和大地2000

经纬度Longitude/Latitude/Degree:经纬度不多做解释,要注意的是表示经纬度的方法通常有两种。一种是十进制度数decimal degree,使用小数表示经度和纬度的度数部分,例如经度 -122.4194°、纬度 37.7749°。一种是度分秒Decimal minute second(DMS),将经度和纬度的度数部分、分数部分和秒数部分都分别表示为整数,例如经度 122°25'10"、纬度 37°46'30"。


二、GIS相关

向量数据(Vector data):用点(point)、线(line)和面/多边形(polygon)来表示几何图形的图像数据,统称为要素(feature)。

要素(Feature):用向量数据来表示的空间对象,如遗址点、道路、河流、建筑物等等。要素包含了几何形状、空间位置坐标和属性(attribute)。如图四所示,道路的几何形状是线,位置坐标内含在文件里,路名则是其属性的一部分。

(图4,图源https://pro.arcgis.com/en/pro-app/latest/help/data/feature-classes/feature-classes.htm)

栅格数据(Raster data):由像素组成的网格创建的图像,这些像素块具有相同的大小,每个像素块都有一个相关联的属性值。常见的栅格数据有多光谱遥感数据、照片和高程模型。当你放大超过一定比例时,栅格会像素化(即你可以看到图像的组成方块)。在地理信息系统中,光栅图像中的每个像素都有一个空间分辨率值,表示为单位长度与像素的比值,例如5m/像素或“5m分辨率”。矢量数据常用于独立的空间对象,在记录地形之类连续的空间信息时,栅格数据更方便。

(图5,图源:

https://www.google.com/url?sa=i&url=https%3A%2F%2Fdesktop.arcgis.com%2Fen%2Farcmap%2Flatest%2Fmanage-data%2Fraster-and-images%2Fwhat-is-raster-data.htm&psig=AOvVaw1BZEX6DqUU9QtotS3TIXoX&ust=1679804884427000&source=images&cd=vfe&ved=0CBAQjhxqFwoTCMiHhv2e9v0CFQAAAAAdAAAAABAJ)

标记图像文件格式(Tagged Image File Format “TIFF文件):.tif是一种常见的栅格图像文件格式,它储存由像素组成的图像数据。

栅格数据分辨率(raster data resolution)是指栅格数据中每个像素表示地面上多少个单位的长度或面积,通常用米或英尺表示。例如,如果栅格数据分辨率为10米,则每个像素代表10米×10米的区域;如果栅格数据分辨率为30米,则每个像素代表30米×30米的区域。栅格数据分辨率是影响数据质量和分析结果的重要因素之一。具有高分辨率的栅格数据通常可以提供更精细的地理信息,更好地反映地物的特征和变化;而低分辨率的栅格数据则可能会忽略地物的微小变化,从而影响数据分析的准确性和精度。

栅格数据分辨率的选择通常要根据数据的应用需求和数据来源进行考虑。在一些需要高精度地理信息的应用中,如地形分析、水文模拟等,通常需要使用高分辨率的栅格数据;而在一些数据获取难度较大的应用中,如遥感影像分类、土地利用变化检测等,为了降低数据获取成本和提高数据处理效率,通常会使用低分辨率的栅格数据。

图层(Layer):是指地图中的一个数据层,每个图层都包含一个或多个地理空间要素,例如点、线、面等,这些要素通常是由同一种数据类型组成,例如矢量或栅格数据。在GIS中,层是组织和管理地理数据的主要方式之一。通常每个图层都是一个单独的矢量或栅格数据文件。GIS软件通常支持多个图层同时显示在地图中,每个图层可以通过叠加、透明度、颜色等方式来表达地理信息。图层的叠加顺序可以调整,从而控制图层在地图中的显示效果。如图六所示,上面是矢量图层,下面是栅格图层,处理后叠加在一起形成了最后的地图效果。

(图6,图源:https://serc.carleton.edu/eyesinthesky2/week5/intro_gis.html)

属性表(Attribute table):属性表的每一行(row)都有一个要素或一个栅格像素的记录(record),每一列(column)则是一个类别的信息都有一个字段(field)。这些类别称为属性(attribute)。在GIS中,每个要素都以其空间坐标的表格形式存储。这些要素的坐标通常隐藏在属性表中,但特征的形状会被记录下来。属性表还可以存储非空间数据,从而将其与特征关联起来。对一个国家来说,这可能包括其人口、政治资本、主要进出口或矿产资源。对于一个考古遗址,这可能是时代,遗址的古代和现代名称,或某种文物类型的存在或不存在(见表一的例子)。由此可以看出属性表对于数据收集、可视化、查询和分析是多么重要!!(原样保留老师的感叹号)

ID

遗址名

时代

陶器类型

陶器数量

有无房屋

1

龙山

A

100

2

仰韶

B

101

(表1,表源:我瞎编的)

数字高程模型(Digital Elevation Model):虽然空间信息是三维的,但是高程数据通常都是单独储存,并不和经纬度一起保存在要素的文件里。DEM是一种栅格数据集,用于描述和表示地形的高度信息,包括山脉、河流、沟谷等地形特征。DEM数据可以用于生成等高线、坡度、坡向、流域等地形分析产品,帮助用户了解地形特征,进行水文分析、路线规划等分析。

三、GIS软件相关

常用的GIS软件:最常见的应该就是ArcGIS Pro,优点在于应用广功能全,缺点在于只能在Windows系统中使用,且收费贵还经常崩溃。此外还有Quantum GIS (QGIS),开源免费且稳定,但(据老师说)制图不好看,通常和另一个开源软件GRASS (Geographic Resources Analysis Support System)一起使用,功能不输ArcGIS。

(图7,图源:软件官网)

底图(Base map):是GIS中的基础地图,用于提供背景参考信息和地理环境的基础数据。在GIS软件中一般都可以直接加载底图,如图八所示,常见的地图有世界地形图、街道图、国家地图、水系图等。

这样的底图不需要自己找数据来源,但是也无法修改。如果需要改动数据,比如把世界地图中的中国单独裁剪出来,就得自己去找世界地图的数据,导入GIS软件后再操作。

(图8,图源:https://www.esri.com/about/newsroom/arcwatch/customize-your-basemap-in-arcgis-online/)

常见文件格式

矢量文件(shapefile):.shp 是一种用于存储地理空间数据的文件格式,通常用于地理信息系统 (GIS) 中。Shapefile 文件包含一个或多个要素 (features),每个要素都有一个几何形状、一组属性以及其他相关信息。Shapefile 文件可以包含点、线和面等各种几何类型的要素,是GIS 中最常用的数据格式之一。

地理数据库(Geodatabase): .gdb 是ArcGIS中的一种数据格式,相比单个shapefile更有优势。单个的矢量文件只包含要素的矢量文件和属性表,地理数据库还可以储存不包含空间信息的普通表格、要素数据集以及记录所有这些数据的关联。因此可以批量处理查询、分析和转换。非商业地理数据库的文件大小限制为2 GB。


ps:这篇里面比较长且正式的定义都是ChatGPT写的。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存