查看原文
其他

夜校|从照片到占域模型:红外相机数据分析

质兰 质兰公益基金会
2024-09-09

本期夜校可在手机端收听完整内容:在本公号的菜单栏,点击【成长社区】—>【登录夜校】,输入用户名和密码或在公号名片页(如下图示意)点击【服务】,找到【登录夜校】进入【工具坊】版块。

Tips:首次访问,需要先登录质兰成长社区,输入www.izhilan.cn上的用户名和密码,点击【登录】,即可查看所有内容。新朋友可以点击注册账号,完成注册认证!

---------------------------------------------------------------------

【内容介绍】

在实际工作中,大量红外相机获取的数据都被浪费了,在本期夜校中,王放老师基于自己的研究和保护经历,与大家分享了红外相机调查的设计和数据分析,并聚焦在占域模型(Occupancy Model)的使用。


【关键词】

红外相机、占域模型、栖息地预测、种间关系


【速记分享】

  • 数据到底是什么?四类数据简介

不管科研团队、保护区或者是野生动物爱好者,当我们去做生物多样性的调查和研究时,往往会集中在一些很常见的问题上,比如动物在哪,这个动物需要什么样的环境,在过去5-10年,栖息地怎样变化?


解决这些问题的要点在于知道需要什么样的数据,怎样不浪费数据以及怎样从有限的数据里最大限度获得和生态、种群、群落有关的信息。

 

我们经常有个困惑: 大量的数据被浪费了、大量的数据被滥用了。为避免这样的情境发生,当调查野生动物时,首先我们要了解所谓的数据到底是什么第一类数据是:“有”数据,英文是presence-only,这个数据就是说明在什么地方有这个动物。

上图是秦岭西部全国大熊猫调查得到的数据。每一个绿色的小点就是工作人员在这个地方看到过熊猫的粪便、看到了熊猫吃竹子的痕迹或者直接目击到了活着的熊猫,这意味着这个地方有熊猫,这就是有数据,这是做调查时最常见的数据类型。

 

第二类数据: “有无”数据(presence-absence),它除了说明动物在哪里,还说明它们不在哪里。

 

 

上图中每个黑点是2015年在四川北部有国家一级保护动物羚牛的位点,每个白点是相应的没有该羚牛的位点。当知道什么地方有、什么地方没有该羚牛时,你的分析能力会显著增强。

 


比如,假设我是一个对动物有鲜明偏好的一个人(我们可以把它等同于动物对环境和栖息地的选择),那根据上图,大家能否猜出我喜欢什么动物?上图就是非常典型的有数据。因为信息不足,可以有各种猜测, 比如喜欢食肉目,喜欢凶猛的动物、喜欢北半球的物种等。当只有有限的信息时,要去评估偏好,就会遇到非常大的困难。

 

为什么从有数据变成“有无“数据后,我们的数据分析能力会得到非常大的提升呢?比如现在我告诉大家下图中的动物我不喜欢,这时对于信息的排除能力会一下加倍。所以‘有无’数据对于‘有’数据是巨大的补充。

 

 

有无数据是非常关键且重要的,一旦我们知道什么地方没有动物,我们就能够用更好的模型,用更少的数据得到让人信服的、扎实的结果。

 

第三类是计数数据。鸟类调查、蛙类调查等都很常见,比如蛙类调查时走一条样线,记下听到的蛙声或被惊起来的蛙的数量,都是计数数据。有无数据很难评估动物的多度,而计数数据可以实现。在多度的基础上,是第四类个体识别数据,它的优势在于可以进一步评价数量。

 

比如下面的雪豹,这个李娟老师的数据。根据雪豹的头上、前肢、后背或尾部的斑纹可以识别该花纹属于哪一只雪豹。这样,就可以完成个体的计数,而通过个体计数,可以用标记重捕评价物种的数量。


  • 了解数据性质

有数据、有无数据、计数数据再到个体识别数据,数据质量是一路上升的,在这个过程里,最关键的就是把低级别数据通过实验设计,通过分析变成更好的数据。最不应该出现的是把已经很好的数据用错误的分析方法,错误的思路降级成差的数据。最常见的,就是把很好的数据变成有数据,比如红外相机数据或千辛万苦做的动物痕迹调查。

 


如上图,秦岭大熊猫自然保护区的调查,每条小红线都是一个两到五公里的监测样线,监测人员在这几百条样线上去看熊猫的痕迹,把有熊猫的点记录下来。遗憾的是,这样的一个数据经常被认为是有数据,用最大熵模型或最简单的T检验方法去看熊猫跟环境之间的关系,这样常会得出错误的结论

 

为什么说这个数据并不是一个有数据呢?因为当你真正在山里时,完全可以设计一些规则,来确定发现熊猫粪便的概率有多大。比如在熊猫分布的区域里,假设每走一百米,我们平均见到0.3个熊猫粪便,这意味着什么?如果一个网格或者一个区域,走了两千米,即20个一百米。那这个区域,按照概率,应该能够见到20乘以0.3,即6个熊猫的痕迹。如果我1个熊猫的痕迹都没有见到,是不是可以通过计算、通过规则,认为这个地方有70%-80%的概率是没有熊猫的。

 

  • 关于相对多度

最常看到的红外相机的数据分析,会有两种,第一种是通过红外相机得到物种清单,更进一步可能还包括拍到动物的位点。第二种在很多核心期刊的文章里出现过,就是相对多度的概念。


比如一些物种更多出现在中低海拔,一些更多出现在高海拔地区,相对多度指数(relative abundance index, RAI)通常指每一千天能够拍到多少照片或者每拍摄一张照片需要用的平均时间乘以一百或者一千,或者用拍到这个物种的数量跟工作时间相比得到的一个比值,这个比值就代表这个动物的相对多度。

 

我们更多推荐占域模型而不是相对多度来处理珍贵的红外相机数据,是因为相对多度听起来很美好,但实际上,会出现非常多可能犯错误的地方。

 

比如当大熊猫高海拔的RAI是10,即每1000天可以拍到10张照片,低海拔RAI是3。这说明什么呢?说明大熊猫喜欢高海拔吗?实际情况往往不止于此,比如很有可能在工作的这个区域,低海拔有农田,有居民点,所以大熊猫并不是因为海拔,而是对农田,居民点的回避或者有可能低海拔有公路交通,有噪音,有污染,有旅游开发等其他因素?与此同时,当我们发现一个大熊猫的RAI是10,果子狸的RAI是8的时候,是否能说明保护区里大熊猫的数量比果子狸要多?不一定,因为不同物种相机探测存在巨大偏差。


羚牛的RAI通常比较高,为什么?第一,它聚群,经常有几十只甚至几百只的大群通过,很难漏拍。而大熊猫虽然独居但它体型较大,所以有比较大的散热面积,但果子狸跳跃的速度很快,独居、体型又小,所以很有可能大量的果子狸经过相机,但没拍到照片。同理,RAI也没办法做跨季节的比较。红外相机是靠探测动物体温跟环境的温差,在夏天,环境温度三十多度,动物的体温也三十多度,就很难清晰准确地探测到动物。


  • 占域模型Occupancy Model:红外相机数据分析标准方法

通常基本设计的第一步:分网格,如上图所示,把保护区分成不同的区域,有的可以直接分大区,有时候可以分方格。分了区域之后,要在不同的区域放红外相机。放了红外相机之后最简单的办法就是拍到了动物就代表这个地方有动物,没有拍到就代表这个地方没有动物,但这样的方法就放弃了数据的珍贵和有效之处。


实际情况是什么样子呢?最简单的实际情况就是把一台相机放在野外过了不知道多少天收回来了,第一种情况这个地方没有动物,第二种情况是这个地方有动物,但出于各种原因,相机没有拍到,而第三种情况是我拍到了,即这个地方有并且被我探测到了。


如果我们加入一个新的指标,叫相机的探测概率,也就是它的探测成功率,刚才的3种情况就可以表述为:


即可以用三种概率来描述红外相机拍摄的结果。传统上,放十台相机,在保护区里有三台相机拍到这些动物,就会认为这个空间里面有30%的区域是被某动物覆盖。但如果能够通过一个办法去评估该动物出现时,只有50%的可能被拍到,那十台相机有三台拍到该动物,即意味着实际上它可能出现了6次。


怎么评估探测概率,或者说怎么得到比如刚才提到的50%的探测概率呢?第一,对于每一个位点进行重复取样;第二,对每一个位点记录探测历史(此处的详细解释,请参考视频)。

 

通过探测变量,可以非常好的修正数据,这是占域模型中最重要的核心:通过探测历史知道探测成功率,基于探测成功率可以做多因素分析,就可以知道不同物种、不同季节、相机放置人员、相机品牌等带来的偏差。


可供参考的数据格式,包括每个位点的基本信息,包括海拔、坡度、坡向、森林类型、森林起源等。同时每个位点的探测变量,探测变量影响相机探测的成功率,如安相机的温度、安相机的人员,相机的型号、有没有用气味引诱剂、相机前对着的空间是否开阔等。最后还有每个动物的名称和类型。


占域模型还可以用来做多物种之间的关系。熊猫、羚牛、斑羚、小麂、毛冠鹿,每一个动物对环境的需求都不同,比如熊猫就喜欢竹子,竹子越多,熊猫越多,但小麂是讨厌竹子的,竹子越多,小麂越少。豹猫也是讨厌竹子的,所以为了熊猫恢复竹子,并不是所有动物都会变好。而熊猫和羚牛很排斥居民点,但是豹猫、黄喉貂这些中小型食肉动物很喜欢居民点,这些居民可以让这些中小型的食肉动物在林子里面继续存活。所以如果有很多区域要做熊猫的保护,在评价优先级的时候,我们就应先选择那些不仅能帮助熊猫,也能够帮助其他动物的区域来恢复,通过多物种的占域模型来评估保护的优先级。


红外相机用好的方法分析,能够得到非常多的数据,除了占域模型,空间、时间还有时空的总和等数据都是潜在的分析方向。比如,在秦岭发现狗漫山遍野跑,这些狗会不会影响其他动物?根据红外相机的数据,我们发现如果狗在相机前活动后,小麂会在很长的时间都不回到这个相机前。它会因为狗的出现,而隔很长时间才回到它关键的栖息地,而没有狗的地方,小麂出现之后过一段时间就会再回来吃东西。这种时间的变化可以直接反映出秦岭山脉里面的狗如何直接影响野猪、红腹锦鸡、豹猫等各种各样的野生动物。类似地,我们也可以分析,人类活动对物种的影响。


红外相机的数据非常珍贵,能够告诉我们保护是不是有效、告诉我们保护的优先级、告诉我们物种之间的关系、评估家犬家畜带来的干扰等。要善用红外相机的数据,有大量的工作是可以通过红外相机的数据来挖掘的、包括气候变化,人地耦合等。


继续滑动看下一个
质兰公益基金会
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存