从事测绘地信必备的数据格式清单!各种GIS数据格式和扩展名汇总
天天跟数据打交道,怎么能少了对各种数据格式的认识。GIS应用于各种行业,软件的多样性也使得格式"样式"繁多。面对一堆"狂飙而来"的未知格式数据,这可能是任何GISer的一场"噩梦"。
矢量数据
矢量数据不是由像素网格组成的。相反,矢量图形由顶点和路径组成。矢量数据的三种基本符号类型是点、线和面(面)。这些 GIS 文件格式包含矢量数据。
点是 XY 坐标
矢量点只是 XY 坐标。通常,它们是带有空间参考系的纬度和经度。当要素太小而无法表示为面时,将使用点。
线连接点
矢量线将每个顶点与路径连接起来。基本上,你按照设定的顺序连接点,它变成一条矢量线,每个点代表一个顶点。
线通常表示本质上是线性的要素。例如,地图将河流、道路和管线显示为矢量线。
面连接折点并闭合路径
当您按特定顺序连接一组折点并将其关闭时,这现在是一个矢量面要素。创建面时,第一个和最后一个坐标对是相同的。
.SHP
.DBF
.SHX
shapefile 是最常见的地理空间文件类型。所有商业和开源都接受 shapefile 作为 GIS 格式。它无处不在,已成为行业标准。但是,您需要一组完整的三个文件,这些文件是构成形状文件所必需的。三个必需的文件是:
SHP 是要素几何。
SHX 是形状索引位置。
DBF 是属性数据。
您可以选择包含这些文件,但不是完全必需的。
PRJ 是投影系统的元数据
.XML是关联的元数据。
SBN 是用于优化查询的空间索引。
SBX 优化了加载时间。
.GEOJSON
.JSON
GeoJSON 格式主要用于基于 Web 的映射。GeoJSON 将坐标存储为 JavaScript Object Notation (JSON) 形式的文本。这包括矢量点、线和多边形以及表格信息。GeoJSON 将对象存储在大括号 {} 中,并且通常具有较少的标记开销(与 GML 相比)。
GeoJSON 具有简单的语法,您可以在任何文本编辑器中修改。Webmaps浏览器理解JavaScript,因此默认情况下GeoJSON是一种常见的Web格式。但是JavaScript只能理解二进制对象。幸运的是,JavaScript 可以将 JSON 转换为二进制。
.KML
.KMZ
KML 代表 钥匙孔标记语言。此 GIS 格式基于 XML,主要用于 Google 地球。KML由Keyhole Inc开发,后来被Google收购.KMZ(KML-Zipped)取代KML成为默认的Google地球地理空间格式,因为它是文件的压缩版本。
KML/KMZ于2008年成为开放地理空间联盟的国际标准。经度和纬度分量(十进制度)由 1984 年世界大地测量系统 (WGS84) 定义。垂直分量(高度)以米为单位从 WGS84 EGM96 大地水准面垂直基准面开始测量。
.GML
GML允许使用XML的地理坐标扩展。可扩展标记语言 (XML) 既是人类可读的,也是机器可读的。
GML 以文本形式存储地理实体(要素)。与GeoJSON类似,GML可以在任何文本编辑器中更新。每个要素都具有属性、几何(点、线、曲线、表面和面)和空间参考系统的列表。
将GML与GeoJSON进行比较时,通常会有更多的开销。这是因为 GML 为相同数量的信息生成更多数据。
.GPX
GPS 交换格式是一种 XML 架构,用于描述从 GPS 接收器捕获的航点、航迹和路线。由于 GPX 是一种交换格式,因此您可以根据其描述属性公开将 GPS 数据从一个程序传输到另一个程序。
GPX 的最低要求是纬度和经度坐标。此外,GPX文件可选择存储位置属性,包括时间,高程和大地水准面高度作为标签。
.DLG
数字折线图(DLG)文件是在传统纸质地形图上生成的自然矢量。例如,这包括乡镇和范围,等高线,河流,湖泊,道路,铁路和城镇。
.TAB
.DAT
.ID
.MAP
.IND
地图信息标签文件是地图信息软件的专有格式。与 shapefile 类似,它们需要一组文件来表示地理信息和属性。
选项卡文件是链接关联的 ID、DAT、MAP 和 IND 文件的 ASCII 格式。
DAT文件包含关联为dBase DBF文件的表格数据。
标识文件是将图形对象链接到数据库信息的索引文件。
MAP文件是存储地理信息的地图对象。
IND 文件是表格数据的索引文件。
.OSM
OSM文件是OpenStreetMap的原生文件,它已成为世界上最大的众包GIS数据项目。这些文件是来自开放社区众包贡献的矢量特征的集合。
GIS格式OSM是OpenStreetMap基于XML的文件格式。更高效、更小的 PBF 格式(“协议缓冲区二进制格式”)是基于 XML 的格式的替代方法。QGIS中的数据互操作性可以加载本机OSM文件。OpenStreetMap插件可以将PBF转换为OSM,然后可以在QGIS中使用。
.VCT
.VDC
IDRISI矢量数据文件具有VCT扩展名以及具有VDC扩展名的相关矢量文档文件。VCT 格式仅限于点、线、多边形、文本和照片。创建 IDRISI 矢量文件后,它会自动创建用于构建元数据的文档文件。属性直接存储在矢量文件中。但您可以选择使用独立的数据表和值文件。
GBF-DIME文件格式由美国人口普查局在1960年代后期开发,是最早存在的GIS数据格式之一。它用于存储主要城市地区的美国道路网络,这是普查信息中的关键因素。
GPF-DIME支持Choropleth映射,还有助于消除数字化特征的错误。DIME是由美国人口普查局生产的当前TIGER(拓扑集成地理编码和参考)系统的关键组件。
ArcInfo 覆盖范围是一组包含点、弧、面或注记的文件夹。抽搐是地理控制点,有助于定义覆盖范围。
属性存储在 ADF 或 INFOb 表中。每个要素都用唯一的编号标识。这些要素编号是将属性数据与每个空间要素链接的一种方式。
覆盖范围是软盘时代的标准格式。但随着时间的推移,这种 GIS 格式已经过时,并且在 GIS 软件中大多不受支持。
Autodesk Drawing
.DWF
.DWG
.DXF
Autodesk CAD文件格式专为二维和三维设计而设计。它们通常包含图层中的边、曲线和注释文本等元素。DWG/DXF 是使用笛卡尔坐标的矢量文件。每个元素在网格中绘制 XY 点。
DWF(设计网页格式)更具体地用于在互联网上查看和使用。
DWG(DraWinG)是包含元数据的AutoCAD的本机格式和工作版本。
DXF(图形交换格式)将图形信息存储为数据的精确表示。但DXF的目的是CAD程序之间的数据交换。
Bentley Microsystems DGN File Format
.DGN
DGN 是 Bentley 软件公司 MicroStation 的原生格式。与其他CAD设计格式类似,工程师和建筑师将其用于施工设计。
DGN文件由图层组成,包括注记,点,折线,多边形,
和多路径。它们还包含样式信息 (颜色索引) 和空间参考系统。
2
栅格数据
栅格数据由像素组成。它们通常间隔规则且呈方形,但不必如此。栅格通常看起来像素化,因为每个像素都有自己的值或类。
ERDAS Imagine (IMG)
.IMG
ERDAS Imagine IMG 文件是Hexagon Geospatial开发的专有文件格式。IMG文件通常用于栅格数据,以存储单个和多个波段的卫星数据。
IMG 文件使用一种hierarchical format (HFA) 该格式是可选的,用于存储有关文件的基本信息。例如,这可以包括文件信息,地面控制点和传感器类型。
作为IMG文件一部分的每个栅格图层均包含有关其数据值的信息。例如,这包括投影,统计,属性,金字塔以及它是连续还是离散类型的栅格。
.ASC
ASCII 使用一组介于0到255之间的数字(包括浮点数)进行信息存储和处理。它们还包含带有一组关键字的头文件。
在本地存储格式中, ASCII 文本文件存储使用一种分隔符(逗号,空格,TAB等)格式存储GIS数据。你可以利用一个转换工具如ASCII to raster将非空间数据转换为空间数据。
.TIF
.TIFF
.OVR
已成为GIS和卫星遥感应用的行业图像标准文件。GeoTIFF可以有其它附件:
TFW存储TIFF文件所处的空间位置信息;
XML是GeoTIFF可选文件,存储元数据;
AUX存储投影和其它信息;
OVR存储影像金字塔,用于快速的访问和影像显示缩放。
.RST
.RDC
IDRISI 将RST扩展分配给所有栅格图层。它们由数字网格单元格值组成,这些值包括整数,实数,字节和RGB24。
栅格文档文件(RDC)是RST文件的随附文本文件。他们将列和行的数量分配给RST文件。此外,它们还记录文件类型,坐标系,参考单位和位置误差。
.BIL
.BIP
.BSQ
Band Interleaved files 是一种存储航空和遥感单波段或多波段栅格影像的格式。
Band Interleaved for Line (BIL) 根据行存储所有的像素信息;
Band interleaved by pixel (BIP) 按像素存储;
Band sequential format (BSQ) s按波段存储。
BIL包含一个头文件(HDR),该头文件描述了图像中的列,行,带,位深度和布局的数量。
.PIX
PIX格式是由PCI Geomatics开发的一种栅格格式。这是一种灵活的文件类型,图像和辅助数据存储在一个称为“Segments”的独立文件中.例如,“Segments”可以包含投影,属性信息,元数据和图像/矢量。
Grid文件是一种Esri开发的专有格式。Grid文件没有拓展名,而且是一种独一无二的可以存储属性数据的栅格文件格式,但是它只能给Integer类型的文件添加属性。
属性数据存储在value attribute tables (VAT) 中 网格中每个唯一值的一条记录,其计数表示格网网格的数量。
Esri Grid文件可以为integer(整型)和floating point(浮点型)。 土地覆盖是离散网格的示例。每个类都有一个唯一的整型格网值。高程数据是浮点型网格的示例。每个像元代表一个高程浮点值。
压缩栅格文件
我们通常将图像压缩分为两类——有损压缩和无损压缩。
有损压缩通过永久消除某些信息来减小文件大小。具体来说,它消除了冗余信息,即使用户可能没有注意到它。例如,JPEG 是一种使用有损压缩的格式。但是,无损压缩会在压缩期间保留栅格值。同时,它仍然需要减小文件大小。
ER Mapper Enhanced Compression Wavelet.ECW
ECW 是一种压缩图像格式,通常用于航空和卫星图像。这种 GIS 文件类型以其高压缩率而闻名,同时仍保持图像中的高质量对比度。
ECW格式由ER Mapper开发,但现在归Hexagon Geospatial所有。
.JP2
JPEG 2000 通常具有 JP2 文件扩展名。它们是具有最新JPG格式的小波压缩,提供了有损或无损压缩的选项。
JPEG 2000 GIS 格式需要一个提供栅格地理位置的世界定位文件。由于其有损压缩,它们是背景图像的最佳选择。JPEG 2000可以实现20:1的压缩比,类似于MrSID格式。
.SID
.SDW
LizardTech专有的MrSID格式通常用于需要压缩的正射影像。MrSID 图像具有 SID 扩展名,并附带文件扩展名为 SDW 的坐标定位文件。
MrSID 具有令人印象深刻的压缩比。彩色图像可以以超过 20:1 的比例压缩。LizardTech的GeoExpress是能够读写MrSID格式的软件包。
三维数据格式
Open Scene Gragh Binary简称OSGB。它是由二进制存贮的、带有嵌入式链接纹理数据(.jpg)的OSGB格式。
OBJ文件是Alias Wavefront公司为它的一套基于工作站的3D建模和动画软件"AdvancedVisualizer"开发的一种标准3D模型文件格式,很适合用于3D软件模型之间的互导。
三维模型的一个万能格式,大部分三维软件都支持。
一个obj文件一般包含obj,mtl,jpg三个文件。.jpg为纹理图片
3D Tiles是用于传输和渲染大规模3D地理空间数据的格式,例如摄影测量,3D建筑,BIM / CAD,实例化特征和点云等。与常规的模型文件格式相比,最大的特点就是包含了分层分户的瓦片,根据可视化需要呈现相应的细节,并且已经被纳入到OGC规范当中。
.3ds是3Dmax的衍生文件格式。
做完MAX的场景文件后可导出成3ds格式,可与其他建模软件兼容,也可用于渲染。
激光雷达文件格式
LiDAR技术的发展彻底改变了我们看待地球表面的方式。
作为点云数据,LiDAR 是具有高程值的密集坐标点网络。这些 GIS 格式需要专门的软件或扩展模块才能查看或编辑。
ASPRS LiDAR Data Exchange Format
.LAS
.LASD
.LAZ
LAS 文件格式是专门用于供应商和客户之间交换的二进制文件格式。总体而言,LAS文件维护特定于LIDAR的信息,而不会丢失信息。与 ASCII 和其他专有文件格式不同,LAS 文件可供公众使用。坐标点测量的密集网络有时非常大,以至于通常需要对其进行拆分以防止文件大小变得太大。
压缩 LAS 文件时,专门用于此的文件格式为 LAZ。您可以使用LAZ文件格式节省大量存储空间。像大多数文件压缩一样,LAZ没有信息丢失。最后,LAS 数据集 (LASD) 引用一组 LAS 文件。LASD 的目的是能够从引用的 LAS 文件中检查 3D 点云属性。通过 LAS 数据集,您可以可视化三角化表面并执行统计分析。
.XYZ
XYZ文件没有存储点云数据的规范。前 3 列通常表示 X、Y 和 Z 坐标。但是没有标准规格,因此可能包括RGB,强度值和其他LiDAR值。
它们属于 ASCII 点云文件格式组,其中包括 TXT、ASC 和 PTS。 像 XYZ 这样的非二进制文件是有利的,因为它们可以在文本编辑器中打开和编辑。
高程文件格式
USGS DEM, Canadian CDED
.DEM
DEM 格式是由 USGS 专门开发的基于栅格的 ASCII 文件,用于捕获数字高程模型。由于 USGS 生产的大量传统高程模型,它们在行业中被广泛使用。DEM 格式是包含 3 种记录类型的单个文件。
记录 A 存储 DEM 的一般特征,例如描述性名称、最小和高程最小值和最大值、范围边界和 B 记录的数量。
记录 B 包含标题和高程剖面图。
记录 C 存储数据的准确性,并且是可选的。
.DT0
.DT1
.DT2
数字地形高程数据 (DTED) 是由国家地理空间情报局创建的标准格式。它们是一种栅格格式,由通常从飞机雷达捕获的地形高程值组成。用户定义的属性通过 TAB 文件分配。3 级分辨率包含各种单元格间距分辨率:
0 级间距为 30 弧秒间距(标称 1 公里)
1 级间距为 3 弧秒(约 100 米)
2 级间距为 1 弧秒(约 30 米)
GIS软件工程文件格式
GIS工程文件用于 GIS 应用程序。通常,它们都分层存储图层,直接打开可显示数据。通常用于构建地图的符号系统、查询、标注和其他属性。
这里主要汇总的是ArcGIS与QGIS工程文件。
Map Exchange Document (MXD).MXD
MXD 代表 地图探索者文档。ArcGIS 使用此文件格式将地图图层存储在内容列表中。数据框中的每个图层都引用一个数据源。
地图图层以等级方式从地图布局显示。重新打开 MXD 时,将保留自上次保存以来的所有符号系统和标注
.QGS
QGS扩展名是GIS软件程序QGIS(以前称为量子GIS)的项目文件。此文件类型可以类似于.TXT或.XLS文件打开。
所有地图图层和合成器都存储在 QGS 工程文件中。它保留自上次保存以来相同的标注和地图图层。地图图层的引用指向物理数据源。
QGIS项目自动生成项目文件的备份,文件扩展名为QGS~。这些文件与项目文件存储在同一目录中。
.APRX
ArcGIS Pro 工程文件 (APRX) 包含地图、工具箱、数据库、文件夹甚至样式。它们还可以包含与数据库、服务器和文件夹的连接。
APRX 文件是 MXD 的后继文件,MXD 等效于 Esri ArcGIS 中的工程文件。但它们与 MXD 的不同之处在于,工程可以在单个工程中具有多个地图和布局。
.QGZ
QGZ 是 QGIS 3.2 及更高版本的默认项目文件。这个压缩容器存储QGS XML文件,用于存储QGIS布局,属性和图层。
.MXT
地图交换文档模板 (MXT) 是 Esri ArcGIS 的标准化布局。它们包含可在组织中重复使用的通用底图和页面布局。
.WOR
.MWS
映射合成文件 (.MAP) 将一组地图图层、符号系统和调色板存储在具有 MAP 扩展名的文件中。重新打开地图后,MAP 文件会根据需要重新创建地图布局以进行打印。
切片地图格式受服务器处理能力与网络传输带宽等因素的影响,切片格式的地图越来越流行,切片地图是一种多分辨率层次的金字塔模型,从切片金字塔的底层到顶层,分辨率越来越低,但表示的地理范围不变。Vector Tile Package
.vtpk
Esri的矢量切片(Vector Tile Package)以vtpk为文件后缀,利用协议缓冲(Protocol Buffers)技术的紧凑的二进制格式来传递信息。当渲染地图时矢量切片使用一系列储存的内部数据进行制图。
被组织到矢量切片的图层(比如道路、水、区域),都有包含几何图形和可变属性的独立要素(例如姓名、类型等等)。通俗的说,就是将矢量数据以建立金字塔的方式,像栅格切片那样分割成一个一个描述性文件,然后在前端根据显示需要按需请求不同的矢量瓦片数据进行显示。
.tpk
TPK是一种数据文件类型,主要是用于将切片文件打包形成离线地图包,TPK可作为切片底图被加载。
.slpk
SLPK(Scene Layer Package)是一个将符合I3S(Indexed 3D Scene,ESRI 为3D数据推出的支持Web、移动和云端的数据标准)规范的节点信息和资源打包到一起的一个压缩包文件。目前主要支持:3D模型、集成格网、点以及点云数据。
GeoPackage是一种开放的、基于OGC标准的、独立于平台的、便携式的用于传输地理空间信息的压缩格式。GeoPackage统一规范在SQLite数据库中存储以下内容:矢量数据、不同比例尺的影像切片、扩展文件等。
MBTiles 是由MapBox公司主导的一种地图切片存储的数据规范,它使用SQLite数据库,可大大提高海量地图切片的读取速度,比通过切片文件方式的读取要快很多,适用于Android、IPhone等智能手机的离线地图存储。
.mvt
MapBox 矢量切片通过Google Protocol Buffers(一种兼容多语言、多平台、易扩展的数据序列化格式)进行编码,这种格式应用于客户端或服务端高效渲染或查询要素信息。使用.mvt文件为后缀。
数据库文件格式
数据库是相关信息的集合,允许数据的输入、存储、输入、输出和组织。数据库管理系统 (DBMS) 充当用户与其数据库之间的接口。
空间数据库包括位置。它具有点、线和多边形等几何图形。GIS 将来自多个源的空间数据与许多不同的人相结合。数据库将用户连接到 GIS 数据库。
Esri File Geodatabase
.GDB
Esri 将文件地理数据库创建为用于存储多个属性表、矢量和栅格数据集的容器。它是个人地理数据库 (MDB) 的后继产品,Esri 建议使用文件地理数据库而不是个人地理数据库。
文件地理数据库具有结构和性能优势。它们具有快速的性能、多功能关系、兼容的栅格存储、改进的空间索引、数据压缩、可自定义的配置和 1 TB 的文件大小限制。在地理数据库中,地理数据集称为要素类。但地理数据库可以存储更复杂的数据,例如网络、栅格镶嵌和要素数据集。
.MDB
个人地理数据库使用默认的 Microsoft Access 数据库文件扩展名 (MDB)。它们曾经是用于管理地理空间数据的最普遍的数据库类型。个人地理数据库非常有利,因为您可以管理多个属性表、矢量和栅格数据集以及创建关系类。
但它们最大的缺点是存储容量有限,只有2GB。而文件地理数据库提供 2TB 的容量。最后,只需添加几个栅格和矢量数据集,即可快速达到个人地理数据库的存储容量。
.GPKG
GPKG 是独立的无服务器 SQLite 数据库,可以包含矢量、切片、栅格、图层属性甚至扩展的任何内容。与具有 3 个强制文件的 shapefile 不同,这个开放标准的地理空间容器易于共享,因为它都包含在一个文件中。
.MBTILES
MBTILE 用于在单个文件中存储和打包栅格或矢量地图切片集。文件格式基于 SQLite 数据库。MBTiles 唯一支持的坐标系是球面墨卡托。MBTiles文件格式专为Mapbox和其他网络/移动应用程序而设计。
.SL3
.SQLITE
SpatiaLite使用SQLite数据库引擎。但是SpatiaLite通过赋予SQLite空间功能来扩展SQLite。SpatiaLite 提供与地理数据库类似的功能,并且大致等同于 PostgreSQL + PostGIS。它们是开源和轻量级的,能够在单个文件容器中保存空间和非空间文件。
以上只是部分数据格式的汇总,也可能是你GIS职业生涯中开端的数据格式,毕竟GIS是一个多样化和扩展性的技术,从2D到3D以后的数据也会越来越丰富。
文章来源:GISGeography、CSDN
部分整理于网络由小助手整理编译(本文部分内容由谷歌翻译而成,可能有错误语句及不通顺情况,所以仅供参考学习。)
- END -
全球矢量任意下载!路网、建筑、水系...
国外15款最佳遥感软件
在SHP, DWG, DXF, KML/KMZ矢量数据中自由行走
10块钱也能买卫星影像?!颠覆遥感数据传统服务模式,成果数据24h送达