样本命名注意事项——优秀的课题从一个好名字开始
本文转自“态昌基因”,己获授权。
在中国取名有很大的学问,不管是人,宠物、公司,还是项目、计划,我们都会绞尽脑汁的给他想个名字,不光要找有好寓意的字甚至还要考虑生辰八字,风水八卦等等,因为大家都相信一个好的名字是一个好的征兆,会带来一个好的结果。在科研项目中给样本命名同样十分的重要,一个好的命名规则将给后续的实验、分析和数据调用等带来极大的便利,混乱的命名规则也会给你后续的流程带来混乱。
首先我们要明白为什么要给样本命名,在一个项目中少则几十个,多则成百上千的样本;样品的名称不是仅供自己看的,还要考虑到审稿人、读你文章的人,想了解你项目的人的感受。如果每个样本都给予各式各样的名字,那么多的样本在一起光名字就可以让大家看得眼花缭乱,又何谈顺利的开展项目,又如何让别人对你的项目感兴趣;所以我们需要对样本归类,制定命名规则,进行统一命名,使在整个项目过程中样本的使用更有序。样本命名有哪些要注意的呢,主要有以下三个原则:
1. 样本名称的唯一性
这个大家都很好理解,为了区分不同的样本,样本名称的唯一性那肯定是必须的,但是大家往往都注意到了同一项目的样本命名的唯一性,而忽略掉了不同项目样本名称的唯一性;科研很多时候都不是独立的,有时候在做某一项研究时可能发现之前项目的研究数据也是有用的,那么这种相对独立的命名规则就能让我们在调用数据结果合并分析时减少很多麻烦。除此之外还要注意:
① 字母“o”和数字“0”还有字母“Z”和数字“2”在样本名称中不要同时出现,无论字母是否大小写;
② 小写字母"l”和数字“1”在样本名称中尽量不要同时出现,大写字母可区分;
③ 小写字母“q”和数字“9”在样本名称中尽量不要同时出现,大写字母可区分。
2.样本信息的完整性和一致性
完整性
在开始项目前,就要制定一个命名规则,这个命名规则里面要包含样本的基本情况比如:样本来源、处理方法、采样时间点等信息,那么只用看名称就可以能知道对应样本的大致信息了。
一致性
再好的制度没有人去执行也是没用的;在整个项目过程中所有的样本必须按照同一个命名规则进行命名,确保在项目过程中不会因为使用不同的命名规则而导致错误的理解实验结果;可能会在面对一个不符合预期的实验结果,经过各种验证才发现是因为名字问题在做数据分析的时候把样本分错组。
3.样本名称的简易性
有人说既然你要名称完整的反应样本的基本信息,那我把所有信息都放上去好了,结果弄出来一个样本名字好长一串,那这样的名字也起不到统一命名的意义,本来是想更简单,结果看着这么长一串头都大了还做什么项目。
怎么来简化这个名字呢?
首先,我们需要知道这个是哪个项目,从项目名称里面找2,3个有代表性的单词首字母依次放在名称的前三个;接着,就是分组信息了,根据样本的分组情况用一个简单的英文就OK了;然后,采样时间或者采样批次,时间如果有比较可以加上时间,不过可能采样的批次更重要一些,一般来说2位数就能搞定了,最后就是样本顺序了,哪个组,哪个批次的第几号样本,基本上2位数或者3位数就行了。这样看来一个比较简单的项目情况下,样本的名称基本上在10个数字(或字母)以内就能比较全面的覆盖样本的信息了;当然如果还有其他的信息需要纳入还可以再加几位数。
除此之外,在项目过程中很多时候我们不可能把完整的名称写上去,比如在实验流程、数据分析、文章发表和第三方合作等情况下用完整的样本名称就不太适宜,那么就要在同时设计出一个有代表性的简短名称。这个简短的名称因为涉及到后续的数据分析和文章发表,那就需要注意下名称中最好只有字母、数字、下划线,不要有特殊字符;因为在使用软件或者程序命令进行数据分析时,系统无法识别名称中的特殊字符,这点也是我们需要注意的。
举个例子,一个项目简称EP,对照组(control group)中第二批次的第三个样本EP/C/02/03,最后的样本编号就是EPC0203,因为简短名称是用于这个项目的,再去掉用于区分的0,用“-”来区分批次和样本的编号可以命名为C2-3,当然有时候可能因为样本信息复杂,样本名称比较长,按关键取一个3、4个字符的名称比较难,那我们就需要重新编号同时将样本的名称和样本编号列表对应,比如下表:
实际上,对于一个长期采用固定命名规则的人,根据个人习惯字母所代表的意思基本上都是固定;若干年后看到某个样本的名称,你可能很快的就知道是哪个项目的什么样本;这样对于以后用再次利用之前项目里的数据也有很大的帮助。
最后祝大家的项目都从一个好的名字开始,有一个好的结果,发一篇高质量的文章。
猜你喜欢
写在后面
为促进读者交流、加速科学问题解决,我们建立了“宏基因组”专业讨论群,目前己有八百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论。问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”