查看原文
其他

一文搞懂如何进行矢量数据质量检查

走天涯徐小洋 走天涯徐小洋地理数据科学 2022-07-17

矢量科研数据质量检查方法

矢量数据是地理科研工作当中经常接触的一类数据,那么如何判断自己制作的矢量数据是否合格呢?建议从以下几点进行判断:

  1. 数据完整性检查
  2. 位置精度检查,查看矢量数据空间范围是否正确,空间位置定位精度是否符合要求;
  3. 图形完整性检查,查看矢量数据图形是否完整,查矢量数据图形是否有明显不合逻辑的空缺、飞地、孔洞等
  4. 属性精度检查,检查数据属性表命名是否规范,和数据字典进行核对,是否有属性数据缺失或错误
  5. 拓扑检查,通过建立拓扑规则,查看矢量数据是否存在不合理的拓扑错误

下面详细逐一解释:

1 数据完整性检查

目前SHP文件是最常用的矢量数据交互格式,那么我们需要先明白SHP文件是由哪些部分构成的。

Esri Shapefile

文件类型

  • .SHP
  • .DBF
  • .SHX

描述

  • Shapefile是最常见的矢量数据格式,所有的商业和开源GIS软件都支持。无处不在的它已成为行业标准。Shapefile由三个必须的文件组成:
    • SHP是要素几何。
    • SHX是形状索引位置。
    • DBF是属性数据。
  • 下面的是可选文件,需要注意的是,一般情况下,PRJ为必须完整的,否则矢量数据的空间位置会发生错误:
    • PRJ是投影系统参数。
    • XML是关联的元数据。
    • SBN是用于优化查询的空间索引。
    • SBX优化了加载时间。
    • cpg对于中文或者日语等非英语的SHP文件,存储了文件编码信息,ANSI或UTF-8

检查要点

  • 检查SHP文件组成是否完整,对于科研工作产生的矢量文件,一般必须保证有以下文件:
    • .shp
    • .dbf
    • .shx
    • .prj
    • .cpg(如果SHP文件打开没有出现乱码情况,这个可以没有)
  • 检查文件命名是否规范
    • ArcGIS文件命名要求英文(中文也可)_数字,例如:geodata_123
    • 不仅仅是SHP、TIF等文件要遵循上面的命名,所有存放GIS文件的文件夹都建议遵循上面的格式
    • SHP属性表同样,字段命名也是上面的要求

实例与问题

  • 下图是一个完整的SHP文件:
一个非常完整的SHP文件实例
  • 当SHP文件在ArcGIS中打开后,往往会出现一个LOCK文件,这个LOCK文件不影响SHP完整性,LOCK是一个文件锁,表明这个文件处于占用状态。如果ArcGIS非正常关闭,LOCK文件可能不会自动消失,拷贝SHP文件时无需拷贝LOCK文件。
在ArcGIS中打开这个SHP

2 位置精度检查

3 图形完整性检查

  • 检查图形有无不合逻辑的孔洞、空缺等等,可以和其它数据进行交叉验证
陆地明显不能有空缺

4 属性精度检查

  • 矢量数据属性表应根据数据字典、元数据进行加工制作
  • 核对数据字段数量是否完整
  • 核对数据字段名称是否正确
  • 核对数据字段类型是否合理
  • 核对数据属性表是否有空值、异常值

5 拓扑检查

以上是我推荐的矢量数据检查要做的几个方面,供大家参考,如果有其它建议欢迎留言讨论。

参考文献

  1. 史上最全GIS格式总结,看完这个应该没啥不认识的了
  2. GIS位置错误的数据修正方法
  3. 如何走好GIS数据处理的第一步
  4. 为什么你的GIS数据处理总出错?徐老师分享他的GIS处理秘诀!
  5. GIS基础之GIS属性表操作


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存