查看原文
其他

干货分享 | 地理学论文数据的处理过程

The following article is from 赛杰奥 Author 姚鲁烽,何书金等

       

地理学论文中数据的使用是写作中应注意的重要问题之一,也是审稿中出现最多的问题之一(姚鲁烽、赵歆,2002)。数据检查的内容包括:数据的来源说明、即时程度、时间长度、空间范围、抽样密度、选取类型、完整程度、采集条件、测试方法、处理过程和精度验证等。


本文仅探讨其中“论文数据的处理过程”。


                                                               图源于网络


1.数据处理的方法说明


对数据处理方法要交代清楚。例如,说明资料交叉相关分析的显示结果,需解释交叉相关分析的具体算法。如果是时间上的交叉相关分析,同期相关系数应与有关图件一致。再如,作为时间序列,天气事件的自相关本身就较为明显,纯粹使用相关检验得出不同资料在时间上的同步性,论据不充分。另外,对于不同月份土壤湿度指数(NDMI)图分析前,要对图像进行大气纠正。因为NDMI差异很大程度上是由大气影响造成的,在分析前必须去掉大气影响才有一定的可比性。



2.数据转换过程的说明


数据的转换要按国家的有关标准进行。例如,可参照GB/T 17798—2007地理空间数据交换格式标准。

 

气象站本身具有一定的海拔高度,其温度观测结果掺杂了海拔高度对地理要素的影响。因此,利用其资料与太阳总辐射的拟合结果来确定辐射温度修正系数也掺杂了海拔对地理要素的影响。例如,气温数据转换过程的介绍不宜仅用描述性语言,应提供确切的函数公式,否则会影响读者对数据可靠性的判断,影响说服力。



3.数据合成方法的说明


在进行数据合成时,采用的数据来源必须全面说明。对用多种来源的数据合成的图表要分别说明各地、各类数据的来源。采用不同的数据资料,要说明是如何处理成一个数据的,以及选用它的依据和理由。


1)数据的数字化处理

从已有图件数字化得来的数据,如年日照时数图、土地资源图、年平均降水量分布图等,应说明这些图件数据的比例尺、生产时间,不同类型的数据在空间尺度上是否存在差异。如果存在差异,要说明运用何种办法实现匹配,这也是GIS工作中最重要的环节。虽然利用的环境资源数据是多年平均值,但最好能有一个时间上的说明。


2)数据的标准化处理

采用长时间序列的AVHRR NDVI遥感数据,应对数据质量进行分析,特别是后期NOAA卫星及AVHRR传感器的改变可能会造成前后两个阶段NDVI值系统性的差值,从而影响模型计算结果,若能对数据做标准化处理,会减小数据源的误差对计算结果造成的影响。


3)数据的可视化处理

数据可视化技术包含4个基本概念:数据空间、数据开发、数据分析和数据可视化。


▋ 数据空间是由n维属性和m个元素组成的数据集所构成的多维信息空间;


数据开发是指利用一定的算法和工具对数据进行定量的推演和计算;


数据分析指对多维数据进行切片、块、旋转等动作剖析,从而能多角度多侧面观察数据;


数据可视化是指将集中的大型数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。


4)数据的参数化处理

数据的参数化处理是地理学用于建立相关模型研究的方法之一。在使用时应注意对数据参数化进行相关说明。例如,利用天气发生器对气象观测数据(或气候模式模拟数据)进行参数化处理,且应说明经处理后的数据在具体用途上与原数据有何区别。


5)数据处理中的问题


▋ 1)数据的多元处理


多要素分析需要数据的多元处理。例如,对气象资料应做多元统计分析,一元统计的相关系数没有对比性;对多要素分区特征应进行多元回归分块处理,不能仅用对数值上的单回归处理。


▋ 2)数据的像元分解


在国内多采用亚像元分解,对遥感数据进行次像元分解。亚像元分解的结果要与TM影像结果进行比较,并说明数据精度。像元、亚像元和子像元都强调像元等级尺度和混合特征。因此,其物理意义没有本质区别。端元或纯净像元的选取对像元分解结果的精度影响较大。为提高精度端元,选取应参照Landsat TM/ETM+影像的特征进行,从而有效地减小像元分解误差。


▋ 3)数据的图像校正


利用归一化水汽指数(normalized difference moisture index, NDMI)表征地表水汽含量,探讨NDMI作为评估LST-NDMI关系的指标的适应性,要说明地学背景和依据。例如,要对图像进行大气纠正,有些遥感影像数据的差异是大气影响造成,必须去掉大气影响才有一定的可比性。


▋ 4)数据的指标相关


采用多目标加权函数法得到每个网格的生态环境背景状况指数,应该考虑各个指标之间的相关性,避免重复计算。


▋ 5)数据的重建方法


对数据处理方法要描述清楚。例如,地表温度数据每两期进行合成的方法是什么?是将两期平均还是取两期的最高值?LST产品处理时采用的基于高程-温度梯度关系的方法需要提供出处:如何重建,如何计算平均误差?在受篇幅限制,无法提供细节的情况下,则需要提供参考文献。


▋ 6)数据的分布特征


要说明分析实验数据的方法,且需采用合理的计算方法。例如,土壤重金属用算术平均值来表征数据样本水平不合适,用此算术均值与背景值比较来说明土壤重金属含量的升高也不妥当。正确的做法是:将数据转换成正态分布后,用正态分布的平均值表征样本,然后再做进一步的比较和分析。再如,对土壤重金属进行正态和偏态分析,要说明使用正态和偏态分析的原因,并阐述分析结果说明了什么问题,然后联系环境背景值加以比较。


图源于网络

本文转载自赛杰奥,有删改。


图文编辑:许多

责任编辑:张敏

审核:王波涛 梁龙武

猜你喜欢

1.干货分享 | 视频教程:如何处理标准地图以满足期刊要求?

2.干货分享 | 地理学精选视频课推荐(含5门国家级精品课),文末更有福利放送!

3.佳文欣赏 | 中国城镇化进程中新区的空间生产及其演化逻辑

4.佳文欣赏 | 空心化:谁来振兴你,我的故乡我的家

扫描二维码关注我们哟

我知道你在看

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存