手把手教你从曲线图中提取原始数据——GetData Graph Digitizer
在科技论文写作过程中,需要将自己的数据和前人成果进行对比。有时候无法从别人的论文中得到原始数据,只有一张有坐标轴的曲线图,该怎么方便快捷地提取出其中的数据呢?
官网对该软件的描述如下:
GetData Graph Digitizer is a program for digitizing graphs and plots. It is often necessary to obtain original (x,y) data from graphs, e.g. from scanned scientific plots, when data values are not available. GetData Graph Digitizer allows to easily get the numbers in such cases.
数据图准备
getdata能识别的图形文件格式包括 tif、jpg、bmp和pcx等。
多数学术文献是pdf格式,因此你必须首先用能打开pdf格式的工具软件(如Adobe Reader、福昕阅读器)打开这类文献。然后,用阅读工具自带的图形截取功能或微信、QQ、等的截屏功能或者windows系统自带的截图软件,把想要获取数据的数据图截取并在计算机上存储为getdata能识别的图形文件格式。要注意的是微信、QQ等截图的默认存储格式是png,不是getdata能识别的格式。
早期的文献不少是手工扫描或照相后转换成pdf格式的,其中的数据图可能是歪斜的(如下图)。这时候,需要用具有图片旋转功能的工具软件(如word、photoshop等)将数据图旋转正立后再存储,以方便getdata正确读取数据。
打开软件,File→Open Image,打开图片。
首先,我们需要设置曲线颜色和背景色,便于软件识别。Operations→Set line color,将鼠标移至曲线处点击,软件会自动识别曲线为绿色,按确定即可。
同样的步骤设置背景色(此处为白色,Operations→Set background color)。
然后,我们来设置坐标轴,Operations→Set the scale。
顺序为 X 轴最小值→X 轴最大值→Y 轴最小值→Y 轴最大值,首先点击 X 轴最左端,弹出最小值设置窗口,此处设置为 2004。
然后点击 X 轴最右端,最大值设置为 2012。
然后设置 Y 轴最小值为 0。
设置 Y 轴最大值为 220。
最后确定即可。
然后,我们就可以获取折线图中各点的数据了,Operations→Point capture mode,只要鼠标点击绿色的点,即可获取该点的坐标值(列在右侧 Data 窗口中)。
下图中,左侧为软件识别的数据,四舍五入后与右侧原始数据吻合度很高。
其实很多时候,我们遇到的一般不是折线图,而是曲线图,那么我们需要获取曲线上各点的数据,一样很简单。我们依然以上图为例,设置好坐标后,选择 Operations→Digitize area,默认值即可,然后选择数据区域。
软件即可自动识别曲线上各点及其坐标(Data 窗口)。
最后把数值导出即可(File→Export data)。
其他说明
getadata还有其他诸如图片放大、数据连线、绘制网格、撤销、擦除等功能,都比较简单,用户稍加试验就能掌握,不再赘述。
高分屏/windows缩放支持的不好,有些文字显示模糊,不过某些大厂软件对高分屏的支持也不好
软件很久不更新了,最后一次是2013年6月19日的了,希望下次能改善吧。 没有MAC版
居然不支持png格式图片,这个格式很常用啊!许多截图软件默认png格式,pcx这种我头一次听说的格式都支持!想不通过为什么不支持png……
安装包
关注公众号:科袖网,回复 getdata 即可获取软件安装包,也可以在http://www.getdata-graph-digitizer.com/下载。可以试用21天,购买一份需要30美元或者RMB 207.89
更多精彩请点击下方阅读原文,下载科袖APP。