【鸟事琐谈】说说记录中心的人工审核与智能审核
说明:这是发表在《中国鸟类观察》2015年第二期记录中心专辑上的一篇文章,我自己都忘了,郑州鸟友郭丹丹今天(2022年1月19日)找我,想要转发分享,她说:“时间有点久,但是传递的理念还是很适用。”得到提醒与鼓励,翻出来先看了一遍,谢谢自己——今天怕是很难有精力写出这样的长篇大论了。当初下笔千言,今天还是删节一部分,免得啰嗦——
说说人工审核or智能审核
新的中国观鸟记录中心上线半年,收集了一些用户意见,很意外地发现,他们不喜欢这个新记录中心的一个原因是:取消了人工审核!甚至会因此而不想用这个记录中心。
为什么新的记录中心要把人工审核取消,总要找机会做一个陈述……先来摘录一些以前关于记录中心审核的讨论吧。下面是2010年3月一段审核员们的QQ聊天记录(略):
(今注:旧版记录中心是整条记录由审核员人工通过,未通过的不能前台呈现。审核员最初是一些观鸟时间较长的鸟友担任,后来是发记录达到300种?以上后自动获得审核员资格。多年后逐渐出现的困境在于1.记录越来越多,相比之下审核员人数与经验偏少;2.审核有疑问鸟种依靠在留言框问答来解决问题,但问答难以同时在线而往往拖很久无法通过审核;3.记录中心经常停摆,一旦能用就赶紧发积压的记录而顾不上审核,未审核记录越积越多。)
再抄一段,大约是2010年10月橘树在记录中心的留言:
记录中心又有争论,我也说几句。
1、记录中心是2002年的产物,发挥了巨大的推动观鸟发展的作用,但是由于设计和运行都存在缺陷(比如这个留言板的狭小,不得不分段发言),目前还没有办法解决或者替代,致使很多记录不能顺利通过审核,并因此出现争吵,根源都是记录中心本身问题的体现。
2、使用记录中心的人(发记录的和审核记录的都包括)对记录中心的功能、理念和上面提及的缺陷,并不是都十分了解,或者个人之间的理解有偏差,造成因为审核而出现的争吵有时形同鸡同鸭讲,各执一词,不断升级还难以解决问题。
3、由于以上1、2、,长期积累的问题不能解决,目前的情况就是很多老资格的审核员不经常来了,而新涌现的观鸟者又非常有热情地来发记录,结果大量记录积压不能通过审核,使矛盾继续累积并可能继续升级。
4、在没有新的数据库替代记录中心的时候,如果你要使用记录中心,就要有思想准备:没人及时审核记录,审核过程出现讲不清的问题,等等。
5、具体到这个宁陕记录(除了记录中心自身的问题),出现的是一个老问题:以人为据。任何记录,无论团队观察还是个人记录,每一个鸟种的确定性都应该由发记录者个人负责,不能说“同行者有谁”,“谁说了是什么”,并以此来证明这个鸟种的确定性(团队记录委托其中一人来发记录,另当别论)。因此,审核者不应该提问同行者有谁,并以此判断记录能不能通过审核;记录者不能说别人的相同记录通过了审核,为什么我的不行。
6、现实中,以人为据是大量的、自然地存在着,根据年龄或鸟龄来判断一个人的记录是否可信,也是正常的。但是较真的话,讨论到具体鸟种,以人为据显然不能说服人,必须有其他证明,如果没有照片,可以有现场描述、笔记,等等。如果没有,可删除这个鸟种,使整篇记录通过审核,以后再找机会观察、证实。
不知我说清楚没有?现在可以和大家说的是,记录中心的问题要解决,但是需要时间,请大家耐心等待。这里可以继续来发记录,但是大家再看看4、,别无他法。
呵呵,先不说那条记录里面的具体矛盾是什么,只要想想,为了一条记录中的一种鸟,要写这么多的东西来说明,而且是前面已经有了很多争吵之后,就够让人崩溃的了。
放松下,讲一个小故事:
去年(2014年)3月在福州森林公园和几位以前不认识的鸟友一起看鸟,一只很隐蔽的小鸟转瞬即逝。
我:大概是XX。
他们立刻:你确定?那我们回去发记录。
我:?!
各位想想,你是这样发记录的吗?别人看见后告诉了你是什么,你就去发记录了?而现在有多少鸟友是这样发记录的?如果是这样发的记录,审核不审核管什么用?
回到审核这个问题来。
表面看,记录中心的重要改变是没有审核了,其实,最重要的改变是重心的转移——从地点名录或旅行名录为首要,改为鸟种确定为核心。换个说法,就是以创建地点发整条记录为首要,变成以发单个鸟种为首要。当记录中心的APP启用,这个特点就更明确了。
斗转星移,中国大陆有人观鸟已经快20年,记录中心也有了12年(2022年12月将满20年)。当年在一片空白中,观鸟者为中国大陆各个地方留下鸟种记录,到记录中心开列名单,是很重要也很令人兴奋的事情。记录中心刚开始的几年,建立新观测点是一大亮点,而那些观测点后面的一大串鸟名,说明着我们的成就,嘚瑟之后吸引着其他鸟友陆续前往。而现在,当记录中心已经有6000多个观测点,许多经典观测点的记录已经有几百条之多,我们发记录的心态也要变了。为了给哪个地方拉长鸟种名单,退居次要,而你自己是否把鸟看清认准了,更重要。就说前面那个福州森林公园的故事,为一次观鸟旅行拉长鸟种名单,为一个森林公园拉长鸟种名单,都不那么重要,因为你已经不是先行者,重要的是你真的看清、认识那种鸟了吗?你的鸟种list是实打实的吗?
设计新的记录中心,不是有了朱雀会才开始的。鸟语者记录中心由赵烟侠在2002年创建,个人支撑12年,其艰难与辛苦(也包括乐趣)难以估量。而记录中心从创建就一直在改进中,以适应观鸟发展的新需要。2003年开始编辑《中国观鸟年报》——对重要鸟种记录整理摘录汇编成册,对记录中心的功能又有了新要求,尤其是鸟种的确定性。
-依靠全人工编辑的年报,坚持编了7年只印出来5年的-
当观鸟人越来越多,人工审核的缺陷慢慢显现——即使天天泡在记录中心,也难以解决记录中发现的鸟种问题:提问了十天半月也不见回答,是非常可能的;提问了引起不满,说凭什么不信任我,更是常事;或者就来一句:谁谁说是这个,以人为据了,等于没有答案。
喜欢有人工审核的估计两种情况——因为我也是从积极审核,乐此不疲过来的——自己的记录被认可的成就感,能去勾别人记录的成就感。但是你只要翻一下记录,发现大量记录没有人审,感同身受,就知道新人不被认可的滋味。而这些记录是不可能随便通过人工审核的,因为审核员对记录地点不熟,对记录人水平吃不准,提问又效率低下,只能放着。
新的记录中心要解决这个问题,只有一条,人工审核被智能审核取代。智能审核是一步一步的。首先依靠观鸟者个人的责任心,去确定鸟种的可发不可发,可信不可信,再依靠程序辨别,确定是否进入数据库,是否进入年报的收录,进入更高一级的数据库。
(今注:2014年新版记录中心上线,审核员和数据量的严重不匹配,取消人工审核功能,智能ai审核提上开发日程。在镜朗团队技术支持下,记录中心开发团队终于将ai审核结合分布图审核,于2020年4月上线,用户看得见的即鸟种标红,再配合后台人工审核——分区域邀请当地资深鸟友担任,对标红鸟种二次筛查审定。)
任何人去发记录,本着积极负责的态度,每一种鸟都是自己确定的,这是第一道“审核”,没有把握的鸟种可以暂时按下不表,等有了新的野外经验再下回分解。而不会像以前那样,因为个别鸟种的不通过,耽误同一次看到的其他鸟种进入数据库。这道审核过去其实是让审核员来做了,现在换成你自己,不适应么?很简单,就是不确定的鸟种先不发嘛。其实你发了也没什么,现在的记录中心就是要做到,如果重要的珍稀鸟种,你提供的信息不详细不全面,比如只有一个鸟名加时间地点,它就在那儿放着,不会被轻易收录,会等着你有机会再见到它时去验证去补充。……而之前那个记录的可信性,看你自己的把握了,能否补充什么?还是应该删掉?
就是说,鸟种记录将是分级进入数据库的,所有原始记录都保存了,确定与不确定的,但是它们不会随便被采信。根据发记录者填写鸟种相关信息的完整程度和鸟种本身的珍稀程度,它们才可能进入高一级的数据库,被采信和采用。这样的智能审核,首先是开发者非常麻烦,每一种鸟都要提供很多信息作为备案,而后台的技术工作也不简单,但用户的麻烦仅在于自己对自己的记录负责任,你填的信息越详细越准确,鸟种的可信度越高。而在这个过程中,观鸟者在学习,在成长,从新手到资深。当你记录的某种鸟被年报收录,那样的成就感不是更带劲?而观鸟者小小的虚荣心是要满足的,新的记录中心一定会考虑哈。
记住一点:记录中心从人工审核到智能审核,不仅依赖技术的进步,更依靠观鸟者的进步,这是中国观鸟大势!
(全文见《中国鸟类观察》2015年第一期记录中心专辑)
——————————
当年洋洋四千言,再啰嗦几百字:继给“超分布”的鸟种“标红“之后,记录中心又增加了提交图片的功能,记录提交者如果能给标红鸟种提交现场图片,就有望取消标红=这一记录被接受。但是不如意处依然存在,比如标红迟迟不能取消(该区域人工审核缺人手),比如标红鸟种并没有图片可以证明,等等,新的需求不断涌现——增加提交录音资料功能,增加审核人手等等。
综观以上问题,基本可以看出,还是中国鸟人不够多,记录不够普遍,尤其是东北、西北(新疆除外),“省尾”区域,鸡鸣三省区域,比较容易出现标红,说明这些地方以往的鸟种记录少,信息不充分。所以,出现标红应该欢欣鼓舞——突破以往的认识了!继续努力!
看来还是上文最后那句话“点睛”,记录中心的进步,“不仅依赖技术的进步,更依靠观鸟者的进步”=“ai的基础是分布图,分布图的基础是记录,这是个相互升级过程(韦铭语)”。记录中心只有在观鸟记录越来越多的条件下,智能审核才能不断升级,这不仅依赖众多记录来充实信息并完善记录质量与可靠性,也依赖更多的后台技术支持也都成长为观鸟人,懂得观鸟人的需求而在后台给予实现,能及时有效地处理鸟种信息。
听说记录中心的“技术支持”们也组了一支队伍在玩2022观鸟大年,这恐怕是国内其他鸟类数据库的后台难以做到的,给他们鼓掌!加油!中国观鸟记录中心,终归前台后台,是同一战壕,携手共进!
-2018年8月,记录中心后台开“全体大会”-
-2016年的记录中心APP页面与教程-
…
后面的路,大家一起见证~