红皇后学术

其他

综述|Nature Reviews Genetics:基于测序数据研究抗菌素抗性的方法和资源

Model和用于检测赋予耐药性的突变的Protein
2021年1月6日
其他

凌波微课|扩增子多样性研究的结果解读

之前与“凌波微课”合作制作了一个系列的视频教程,主题是“扩增子多样性研究的结果解读”,整个系列共十六期内容,之前已经在公众号上逐步更新完成,这里做一个目录方便大家查找!这个系列讲的都是最基础的东西,对于已经开始这方向研究的大多数朋友来说可能没有太大的用处,不过比较适合零基础的朋友来入门,各位老师同学可以把这个系列视频当作是新生入学的一个基本培训内容,至少看一遍之后知道在做什么东西了,有了数据也知道都是干嘛用的!当然觉得公众号查找不方便的,也可以在B站搜索凌波微课,所有的视频都已经上传了B站,不过还是更推荐在公众号的联系里看,因为去了B站很可能就中毒了,一天可能不知不觉就过去了😂01
2020年12月14日
其他

凌波微课|扩增子研究第十六讲:扩增子测序结果中的物种功能预测

rRNA的OTU分类学注释表,计算出样品中不同氧需求、温度范围、能量来源、新陈代谢、环境来源和宿主的微生物比例。BugBase(https://bugbase.cs.umn.edu/):基于16S
2020年12月11日
其他

凌波微课|扩增子研究第十五讲:扩增子测序结果中的个性化分析

test的结果相结合,一出现就成为了“网红”。这幅图的上三角是环境因子的相关性,颜色和大小代表相关系数,下三角是微生物群落结构与环境因子之间的Mantel
2020年12月4日
其他

凌波微课|扩增子研究第十四讲:扩增子测序结果中的环境因子关联

学生信,做分析,就上凌波微课扩增子测序结果中的环境因子关联
2020年11月27日
其他

凌波微课|扩增子研究第十三讲:扩增子测序结果中的统计差异检验

test:检验样本是否复合正态分布。F-test:检验不同组样本方差是否存在显著差异。T-test:样本量小于30、两组样本符合正态分布、两组样本总体方差相等,比较两组样本均值差异性。One-way
2020年11月20日
其他

凌波微课|扩增子研究第十二讲:扩增子测序中的beta多样性分析

Unifrac在计算时只考虑物种在样本中是否存在,Weighted
2020年11月12日
其他

凌波微课|扩增子研究第十一讲:扩增子测序中的alpha多样性分析

学生信,做分析,就上凌波微课扩增子测序--Alpha多样性分析
2020年11月7日
其他

凌波微课|扩增子研究第十讲:扩增子测序中的物种组成分析

同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。▼更多精彩,请关注我们▼把时间交给阅读我是主讲人Bonnie
2020年10月29日
其他

凌波微课|扩增子研究第九讲:扩增子测序结果中的基本信息统计

学生信,做分析,就上凌波微课扩增子测序结果中的基本信息统计同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。▼更多精彩,请关注我们▼把时间交给阅读我是主讲人Bonnie
2020年10月23日
其他

凌波微课|扩增子研究第八讲:微生物多样性物种分类注释

学生信,做分析,就上凌波微课微生物多样性物种分类注释同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人Young,今天我们给大家分享的内容来自公众号“红皇后学术”。上一期我们介绍了《凌波微课|扩增子研究第七讲:高通量下机数据质控标准》,今天我们就带大家看一下OTU的聚类注释。这一期是本系列课程前半部分关于方法原理方面的最后一期了,在之前的几期中,我们从头了解了16S
2020年10月15日
其他

凌波微课|扩增子研究第七讲:高通量下机数据质控标准

“学生信,做分析,就上凌波微课”高通量下机数据质控标准视频文字版同学们,大家好!学生信,做分析,就上凌波微课!我是主讲人小Young,今天我们给大家分享的内容来自公众号“红皇后学术”。上一期我们介绍了高通量测序下机数据格式和质量评估标准,今天我们就带大家看一下高通量下机数据质控标准。本期凌波微课主要有三个方面的内容:1).高通量测序数据质控整体流程2).数据质控基本概念3).数据质控的标准PART
2020年10月9日
其他

凌波微课|扩增子研究第六讲:高通量下机数据评估标准

学生信,做分析,就上凌波微课!高通量下机数据评估标准同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描视频上方的二维码,关注凌波微课,加入凌波微课交流群,参与我们的课程和课下交流。我主讲人Young。今天我们给大家分享的内容来自公众号“红皇后学术”。上一期我们介绍了高通量测序流程,测序之后得到原始下机数据,今天我们就带大家看一下高通量下机数据评估标准。本期凌波微课主要有两方面的内容:1.高通量测序原始数据格式说明2.下机数据质量评估下机数据我们来看一下具体的下机数据,高通量测序得到的一般是FASTQ格式的raw
2020年9月24日
自由知乎 自由微博
其他

凌波微课|扩增子研究第五讲:微生物群落研究建库测序流程

学生信,做分析,就上凌波微课!微生物群落研究建库测序流程视频文字版同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描视频上方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人小Young,今天我们给大家分享的内容来自公众号“红皇后学术”,主题是:微生物群落研究建库测序流程。前几节课介绍的都是关于16S
2020年9月17日
其他

凌波微课|扩增子研究第四讲:微生物群落研究策略

学生信,做分析,就上凌波微课!微生物群落研究策略同学们,大家好,学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人Young,今天我们给大家分享的内容来自公众号“红皇后学术”,主题是:微生物群落研究策略。微生物群落研究之前,有几个问题需要先弄清楚。由于二代测序技术读长的限制,最多只能得到16S
2020年9月10日
其他

一个10篇一作SCI博士的走心分享----宏组学研究之“道” (完整收藏版)!!

写在前面我自己做科研的逻辑其实挺简单的,就是拆分、细化、成本核算的一个过程。但是这种东西就是这个样子,说起来容易,理解起来难,转化为自身并加以应用更难!!每个人最终其实都应该形成自己的“道”,但这个东西不是一朝一夕就可以的,也不是看了别人说的照着做就能行的。这个东西其实和“三观”的形成过程有点像,每个人的人生经历和现有的知识储备不可能完全一样,也就是说你的“道”也不可能和别人完全一样,所以说用别人的“道”硬往自己身上套肯定会出现很多的不兼容。举个例子,我们经常会遇到一种情况,同一个人说了同一句话,不同的人听了理解的意思完全不同,有些人的理解可能完全偏离了说话人想表达的东西。举个更具体一点的例子,经常会有人来问我一些问题,这个时候对方的心里肯定是认为自己把问题描述清楚了,但其实很多时候我都是要靠猜。反过来也是一样,有时候我觉得理解了对方说的问题,但其实根本就是南辕北辙。这个时候我们说的就会驴唇不对马嘴,最后问题基本上得不到解决。这其实就是因为两个人的背景不一样,思考问题的方式不一样,也即是“道”不一样导致的一些不兼容。再说一个非常现实的问题,作为一个学生来说,你和导师的“道”是不可能完全一致的,这个并不是说谁对谁错的问题,也与导师的水平没什么关系。简单的说就是两个人的经历背景不同,现有的知识体系不同,导师说的东西对于他自己来说肯定是完全的“对”,但是这个东西必然不能完全的适合于学生。作为一个学生,如果不能把老师说的东西进行消化、吸收、修改、转化,进而融入自己的“道”,而是不加思索的完全照做,那最后的结果大概率是不会成功的。实验为什么会失败?为什么得不到想象中的结果?为什么文章写不出来?其实都是源自于此,“学而不思则罔”!!说了这么多就是想传达一个观点,我接下来写的东西是我的“道”,大家不要不假思索的照搬,我更希望大家能够在科研实践的过程中把我的东西揉碎了融入到自己的“道”中。我的“道”用一张图来展示一下我平时做一项工作的逻辑流程。图比较简单,这个东西也没办法讲的太细,因为每个人面对的情况都不一样,就算用一个实例来详细的说一遍,其实对大家帮助也不大,还是要在自己研究的实践过程中才能慢慢的掌握。这里有两点要强调一下。第一,一定要记得,不是所有的工作都是能完成的,有些东西硬逼也逼不出来,该放弃的还是要放弃,而且越早放弃其实是越有利的。执行人的能力是一方面,有些工作确实是力所不能及,同时还有很多客观条件限制,比如说需要一个仪器但就是没有,需要一个样品但就是拿不到,需要足够的经费但是钱不够。这种时候正面硬刚解决不了问题,果断放弃去做另一个能实现的工作不香么。第二就是不要钻牛角尖,我们在做科研的时候当然会有一个预期的假设或者结果,但是这东西永远是预测,不是现实,其实更多的时候都是结果与预期并不一致,至少并不完全一致。这是非常非常正常的事,但是很多人一遇到这种情况就懵了,然后就开始不断的尝试各种方法让结果与预期一致,最终自己给自己灌输了一个“与预期不一样的结果就没法用”的心理暗示,极端的情况可能还会导致个别人走上“学术不端”的不归路。其实完全没有必要这样,与预期不一致也不是没有结果,把所有的结果都列出来,丢掉预先给自己设置的框架,单纯的从结果出发,只要几个结果之间能找到逻辑的联系,能给出一些合理的解释,那么也能讲一个不错的故事,文章也就出来了。研究思路接下来会分3部分来分别介绍一下宏组学研究从研究目的确定到执行的过程我是如何实现拆分和成本核算的。当然水平有限,肯定做不到让大家看完了就全懂了,只是希望尽量的能够把与宏组学研究决策相关的几个关键点讲清楚。第一部分主要是介绍一些宏组学研究的基本思路,所有的研究工作都是基于想要回答一个科学问题,没有一个明确的科学问题,研究工作也就无从谈起了。现在宏组学相关的研究其实开展的已经非常广泛了,大部分简单的问题都已经有人做过了,现在能做的工作更多的是某一方向的细分内容或者是不同学科方向之间的交叉内容。因为涉及到的方向非常多,我个人也没有能力把一些科学问题说的特别的细,下面的内容大多只是对于一些宏观研究方向的罗列,应该会对一些研究初期考虑是否能够使用宏组学的方法有一定的帮助,但是对于具体的研究内容肯定需要各位自己的总结和思考。做了一个图对基本的研究思路做了一个归类,当然比较简陋、也比较表面,每一类也只是简单的举了一两个基本的例子。虽然比较简陋,但是在选题的时候基本的思路就是这样的,核心的观点就是做的东西要是别人没做过的,或者至少没有完全回答清楚的问题。现在大部分单一分类尺度的内容都已经被做过了,除非有一些特殊的研究靶标,比如说冷门的物种、特殊的环境、新型的添加剂、特定的处理等等。如果这些东西你都没有,换句话说就是你没有别人拿不到的样本,那就只能做的相对麻烦一点。两个基本的思路,一个是在单一问题上深入的研究,比如别人只观察到有差异或者关联,那你要做到回答这些表象下面的深层机制,这通常比较难,也更依赖于个人的能力。第二个就是不同尺度的结合,比如说单一时间尺度和空间尺度都有人做了,那可以做一个时间+空间尺度的研究。再或者说正常发育阶段的有人做了,那可以在正常发育过程中结合一些人为处理。通常这种工作相对来说比较容易,但是常规工作量可能会大一些,而且这种工作其实谁都能做,要想不被别人抢先,可能也要花费更多的经费。宏组学研究框架上一部分中,我浅要的谈了一下宏组学研究的研究思路,也就是我们在开始进行研究之前所要确定的“科学问题”。有了“科学问题”这个出发点,我们就可以进行研究方案框架的搭建工作。整个的研究框架涉及以下几个问题:确定具体需要的宏组学技术;样本的设置和实验的流程;其它相关数据的获取;成本与成果的妥协。接下来分别来介绍一下。宏组学研究的分类具体使用哪一种宏组学技术是确定研究方案的第一步,这直接关系到后续研究样本的设置、样本采集和保存的方法、组学数据获取的技术策略以及数据的分析策略等等,而这一问题完全取决于最初想要研究的“科学问题”。我个人把宏组学研究基本上分为三类:单一宏基因组学、比较宏基因组学、多组学关联。单一宏基因组学顾名思义,就是对单一样品进行宏基因组学的测序和研究。这种方法一般是针对稀有、珍贵的样本,比如极地、深海、太空等环境样本。主要的研究目的是深入研究其中难分离难培养的微生物,尽可能的得到不可培养微生物的完整基因组信息,从而对其生态功能、环境适应性、进化等方面进行研究,部分研究还会探索其工业应用的价值。这种研究通常样本数目较少,但是由于其需要尽可能的对测得的数据进行组装,因此所需的测序数据量通常较大,一般都会达到100G以上,有的甚至会测数百G的数据进行分析。比较宏基因组学这种方法是目前使用最多的研究方式,简单的说就是通过不同样本之间的比较来回答最初的“科学问题”。这种方法主要的研究目的是分析不同环境、不同处理、不同时间节点、不同来源、不同性状等等总之就是不同的样本中微生物群落结构和功能的差异,以及这些差异与样品其它数据之间的关系。那么很直观的就是至少要有不同的样本,单一样本肯定是没有办法进行比较的。这种比较通常是基于统计学的方法,那也就是说不同样本之间要具有足够的生物学重复,不然一方面很多比较方法无法进行计算,另一方面样本量不足够统计学分析结果的准确性也会受到影响。生物学重复生物学重复这个问题其实困扰了非常多的人,很多人都想让别人告诉他多少个生物学重复就肯定足够,这是不可能的,因为理论上来说多少个都不够。一条其实不用说大家也都知道的规则就是:“能获得多少样本就测多少样本”。但这通常来说不现实,一方面有可能我们本身就拿不到几个样本,另一方面也是更为重要的就是两个字“差钱”!!!当然公司都会告诉大家最低要求3个重复,那3个重复到底够不够呢?某种意义上来说是够了,如果你对最终的成果没有要求,简单的说就是能发文章就行,那3个重复够了。要是稍微对研究成果有点要求,恐怕3个重复都是不够的,要想发高水平的文章,那更是远远不够。现在的高水平文章,不说都是几百个样本,至少也是几十个样本吧。所以道理也很简单,想要发好文章就要舍得花钱多测点样本。虽然道理大家都懂,但是有些人就是比较轴,非要去琢磨这个临界点,就想知道多少个样本恰好就够了,多一个样本也不想测。这个其实也很简单,没测出来结果之前没人能说到底多少个样本就恰好够用,都是凭感觉,这个时候一定要想明白一个事情。多测了样本,是多花钱了,不过文章发出来了之后多花点钱其实可以接受,但要是测的样本不够,后期想补都没法补,最后文章发不出来这个是没法接受的。有舍有得嘛,最好还是认花钱多测点样本。还有一些更不信邪的,非要去赌那些小概率事件,正常研究思路不想做总想着去以小博大,极端一点的比方说就想用1万块钱发10分的文章。这种建议出门去买个双色球,中了直接千万富翁不需要搞科研了,没中说明你运气不行还是老老实实的做正常的研究吧。比较+单一宏基因组学宏基因组技术已经发展了很多年了,比较宏基因组的研究也已经非常多了,具体到现在来说,可能很多研究体系的简单比较宏基因组已经被人做过很多了,这就需要研究人员更进一步。很多研究者就将比较宏基因组学和单一宏基因组学相结合进行研究,简单的说就是在比较宏基因组的基础上对数据进行深度的拼接,争取获得一些物种的基因组草图,从而为功能基因的宿主识别提供更准确的证据。前面也说过了单一宏基因组学要求样本的测序数据量比较大,而比较宏基因组学要求测序样本的数目比较多,两者相结合那研究所需要的成本就是几何倍数的增加。所以这种研究其实还是需要比较巧秒的设计的,对执行者个人能力的要求也很高,最好不要轻易尝试。多组学关联这个比较直观,宏基因组只能回答基因层面的结果,可以结合宏转录组、宏蛋白质组、宏代谢组等技术的结果在生物代谢网络水平得到更深入、更准确的研究结果。另外一个方向是可以通过宿主的转录组、蛋白质组、代谢组数据与共生微生物的宏组学数据相结合,探索微生物与宿主的互作机制。多组学关联属于投入大、回报大同时风险也大的研究方案。投入大很好理解,单独的宏基因组成本就已经很高了,还要再同时测其它的组学数据,这个成本一般的实验室是很难承担的。回报大也比较好理解,多组学关联研究由于数据很多、研究的非常深入,所以通常来说发表的都是“大文章”。风险大其实往往是被忽视的一点,这么大的数据量、这么复杂的研究体系,首先对分析执行人的要求必然就很高,另外也非常容易遇到难以理解的、前后逻辑不通的、甚至是自相矛盾的结果。所以说想要做好一个多组学关联研究还是非常难的,在开始实施之前已经要有血本无归的心理准备。样本的设置a.在分析不同组样品差异时,组内样品具有其它因素的混淆者有助于真实差异单元的发现这个不难理解,比方说做一个人类疾病相关的研究,理论上来说疾病组和健康组发现的差异就是与疾病有关的结果,但实际上,人类的性别、年龄、生活方式、饮食、生活地域等等因素都会对其产生影响。极端的一点说,如果疾病组都是男性而对照组都是女性,那么发现的结果必然包含很多的性别差异,也就造成了研究结果的不准确。b.长期的时间跨度研究可以同时解决混淆者和群落稳定性的问题这一点其实和上一点比较类似,比方说我们想要分析某种人类活动对周围环境的影响,我们如果只取一个时间点的受影响样本和对照样本,由于环境微生物还会受到其他气候环境条件的影响,我们得到的差异结果必然就有一部分的假阳性。此时如果采集一定时间跨度内的样本进行综合分析,就可以有效的排除其它环境因素的干扰,其实就是我上一篇推文中所说的时间和空间尺度结合的研究。c.对于所有研究,标准的技术和样品处理过程都十分必要虽然说现在宏组学的技术已经比较成熟了,但是不同的实验过程,比如说不同的试剂、不同的测序平台、不同的样本处理方式等等依然会对测序结果产生很大的影响。所以在整个研究中,一定要保证所有样本的处理和测序过程要完全一致,这可以去除试剂和操作因素导致的差异,同时要有不添加样品的阴性对照,以排除某些试剂的特定影响。这一点对于大规模样本的研究或者是与前人已发表数据的综合分析尤为重要。d.对于动物模型研究,食粪性和父母差异的影响是必须要考虑的动物的食粪性会导致“cage
2020年9月5日
其他

凌波微课|扩增子研究第三讲:微生物群落研究的目的

学生信,做分析,就上凌波微课!微生物群落研究的目的视频文字版同学们,大家好!学生信,做分析,就上凌波微课!欢迎大家扫描视频上的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人Young,今天我们给大家分享的内容来自公众号“红皇后学术”,主题是:微生物群落研究的目的。通过之前的介绍,相信大家对于微生物群落研究技术的背景已经有所了解了,本节内容将告诉大家微生物群落研究能干什么?本期内容主要有三个方面,首先,我们来看一下微生物群落研究内容有哪些;第二,如何进行微生物群落功能研究;第三,微生物群落研究方法。PART
2020年9月3日
其他

凌波微课|分子钟学说和现代应用

学生信,做分析,就上凌波微课!分子钟学说和现代应用视频文字版同学们,大家好!学生信,做分析,就上凌波微课。欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人Bonnie,今天我们给大家分享的内容来自公众号“红皇后学术”,主题为:分子钟学说和现代应用。今天的主要内容包括:物种的概念。什么是分子钟?我们利用分子钟能做什么?01物种的概念首先我们来了解一下物种的概念。我们都知道,世界上存在的生物是五花八门、多种多样的,几乎没有人能够说的清楚这个世界上到底存在多少种生物。那么我们如何在界定哪些生物属于同一类,而哪些生物属于不同种类呢?古希腊的学者亚里士多德为了解释这一问题,提出了物种的概念,他将物种定义为与其它相似的物种在生殖上相互隔离的生物群体。经过数百年的研究和发展,物种已经成为了生物分类学研究的最基本单位。并且在物种概念的基础上,发展出了一整套完整的生物学分类方法,也就是我们常说的“界-门-纲-目-科-属-种”层级分类方法。最初的生物分类源于林奈的系统分类法,界定是依赖于不同物种间表型的相似性,但是这种方式限制非常大、主观的因素非常明显、分类的准确性也没有保障。而且这种方法尤其不适用于微生物的分类鉴定,由于人类的肉眼是无法识别微生物,需要依赖显微镜进行观察,这就限制了表型比较方法的应用。同时自然界中微生物的多样性非常高,高达99%的微生物是不能够在实验室进行纯培养的,也就无法观测其表型特征。02什么是分子钟?为了更准确有效的鉴定物种的分类学位置,许多学者对生物中若干代表性的蛋白质进行分析,发现了分子进化速度恒定这一现象。也就是说可以通过评估代表性基因的差异水平判断物种的亲缘程度,这就是“分子钟”学说,用于评估物种亲缘关系的代表性基因就是“分子钟”。自1960年代提出以来,“分子钟”已成为包括系统生物学,分子生态学和保护遗传学在内的许多进化生物学领域的重要工具。03利用分子钟能做什么?在分子钟学说提出的早期,研究人员使用DNA杂交的方式进行物种亲缘关系鉴定,通过比较不同物种“分子钟”DNA的杂交程度,来判断物种的分类学位置。既然我们前面提到了,基于表型特征的生物分类已经不适用于原核生物了,基于DNA杂交的方法就成为原核生物物种分类的“黄金标准”,而且已经被使用了50年。但是此方法操作复杂、十分耗时,随着DNA测序技术的发展,基于杂交的物种分类技术已经被基于高通量测序的相似性比对技术所取代。在当代科学研究中,分子钟广泛使用的经典案利为扩增子测序技术。以原核生物的研究为例:细菌核糖体RNA含有3种,分别为23S、16S和5S,它们的核苷酸数目分别为2900nt、1500nt和120nt左右。20世纪60年代Woese等学者开始采用寡核苷酸编目法对生物进行分类,他通过比较各类生物细胞的rRNA序列特征,认为16S
2020年8月27日
其他

凌波微课|测序技术发展史及应用

学生信,做分析,就上凌波微课!测序技术的发展历史视频文字版同学们,大家好,学生信,做分析,就上凌波微课!欢迎大家扫描下方的二维码关注“凌波微课”,加入凌波微课交流群,参与我们的课程和课下交流。我是主讲人Bonnie,今天我们给大家分享的内容来自公众号“红皇后学术”,主题为:测序技术的发展历史及应用。在上一讲中,我们对微生物群落研究中最基本的概念“分子钟”以及最常用的“分子钟”16S
2020年8月27日
其他

加群、投稿、转载、交流、合作等一切事宜!!

红皇后学术简介红皇后学术建立与2019年8月,公众号的名字来源于”红皇后假说“,在《爱丽丝梦游仙境》内红皇后的世界中,必须不停奔跑,才能使你留在原地。我们其实也生活在红皇后的世界中,不进即是倒退,不进等于灭亡。科研之路永无尽头,学习之心永不停息!建立这个公众号的目的就是想要时刻提醒自己“逆水行舟,不进则退”,老本总有吃光的一天,要想不被淘汰,就只有不断的学习,不断的增强自身!!内容及运营宗旨分享的内容包括但不限于基于组学技术的最新研究成果解读、科研思路、实验和分析技术。推文的内容基本上是以微生物群落研究为核心,重点关注扩增子测序和宏基因组测序,同时辐射转录组、蛋白质组和代谢组的相关内容。在分析技术上,主要关注基于R语言的组学数据统计、分析和可视化解决方案,其它简便易用的分析工具也会偶有涉及。公众号正常会在每周一、三、五进行推送,周末和节假日随缘,个人运行没法做到日更,还请各位见谅,如有同行投稿一般会放在周二和周四推送。此公众号会长期保持开放性的运行状态,公众号所涉及的一切都是开源的、非强制性转发的、便于获取的,就算我个人之后进行一些营利性的工作,此公众号也将会在相当长的时间内保持开源、分享、便捷、无强制性的运行状态。加群为了方便大家交流,我决定也建立一个交流群,不然总是在别人的群里去沟通交流也不是那么方便。本群只有两个要求:广告君请您离开!本群可以其它自媒体的相关推文,但不要发那些需要转发才能获取资源的,不然我也会请您离开!请扫描下方二维码入群,入群后劳烦各位更改一下备注“单位-姓名”,如果二维码失效,请添加我的微信
2020年5月5日
其他

Venn图的各种绘制方法----在线工具&R语言自动处理数据并绘图

Venn图重要的事要先说,关注公众号“红皇后学术”,后台回复“Venn”获取本文介绍在线工具的网址以及R语言绘图示例文件和完整代码。Venn图通常用来展示不同样本间OTU的共有情况,在图中通常用一个圆形或椭圆形代表一个样本或一组样品,圆形的交叉位置代表不同样本间共有,重叠区域的数字表示对应的多个样本之间的共有的OTUs个数,未重叠区域表示各样本特有的OTUs,可以对2-5个(组)样本进行分析。VENNYVENNY是一个在线的Venn图绘制工具,进入网站后,页面如下方所示,可以进行2-4个(组)样本的Venn分析。在左侧的List中填入响应的数据并更改List的名称即可,数据为该样本中检出的OTU的名称,每一个OTU单独一行。具体的数据处理方式为,使用excel打开QIIME分析得到的OTU表格,选择样本列,按照从大到小排序,之后选择检出数目大于1的OTU名称,复制粘贴到响应的List位置即可。填入数据后,右侧即时显示生成的图像。可以在图像上方的工具栏对图像参数进行修改。点击图像中不同位置的数值,在左侧的Results一栏中就可以显示属于该区域的OTU名称。鼠标右键点击图片,选择另存为图片,即可保存绘制结果。JVennJVenn同样是绘制Venn图的在线工具,与VENNY的不同之处是,JVenn最多支持同时分析6个(组)样本,并且可以修改样本对应的颜色和进行简单的统计。进入JVenn的网页后,在右下方的List列表中输入响应的绘图文件,文件制作方法与VENNY一致,修改List的名称及其颜色。在右侧就会实时显示绘制的图形。在左侧上方的的Venn
2020年4月6日
其他

每天学习一点R系列

跟着红皇后,每天学习一点R知识!!R语言得简介和安装扩展包得安装R软件和扩展包得升级数据对象向量因子向量矩阵数据的导入和输出数据的调整plot和par函数绘图详解绘图区域设置颜色设置绘图后修改图像输出barplot条形图之双坐标轴barplot条形图之整合点线图barplot条形图之带误差棒的对称条形图barplot条形图之相关性分析结果分布箱须图的绘制一条代码搞定带误差棒的条形图玫瑰图在生物研究中的实际应用饼图的绘制扇形图的绘制小提琴图和气泡图的绘制坐标轴中断
2020年3月29日
其他

每天学习一点R:25.坐标轴中断

在处理数据时,我们经常会遇到个别数据的值与整体差别较大,导致图像绘制出来正常数据无法区分的情况,此时就需要用到坐标轴中断来实现不同尺度数据的同时展示。在R中可以通过plotrix包实现坐标轴的中断。散点图的坐标轴中断通过plotrix包中的gap.plot绘制坐标轴中断的散点图,之后使用axis.break调整坐标中断的形式。照例先介绍这两个绘图函数的详细参数。gap.plot(x,y,gap,gap.axis="y",bgcol="white",breakcol="black",brw=0.02,xlim=range(x),ylim=range(y),xticlab,xtics=NA,yticlab,ytics=NA,lty=rep(1,length(x)),col=rep(par("col"),length(x)),pch=rep(1,length(x)),add=FALSE,stax=FALSE,...)各参数意义:x和y为绘图的数据;gap为中断的范围;gap.axis定义在哪个轴中断;bgcol为背景颜色;breakcol为中断标志颜色;brw为中断相比于图像比例xlim和ylim为图像的x和y轴范围;xticlab和yticlab为x和y轴刻度的标签;xtics和ytics为x和y轴刻度位置。我们先来生成一组随机的绘图数据。x
2020年3月27日
其他

每天学习一点R:24.小提琴图和气泡图的绘制

小提琴图的绘制之前介绍过箱须图的绘制方法,虽然箱须图能够展示数据的中位数、最值和数据的整体情况,但是相对来说,还是小提琴图能够更好的展示数据的分布情况。UsingR包中有含有一个simple.violinplot()函数可以用于小提琴图的绘制。#载入依赖包library(UsingR)#载入示例数据data(mtcars)#绘制图像simple.violinplot(mpg~cyl,data
2020年3月25日
其他

每天学习一点R:23.扇形图的绘制

在上一期的推文中我介绍了饼图的绘制方法,可有些时候我们可能并不需要一个完整的圆来展示数据,此外在饼图中,有时我们无法有效的比较不同扇形区域的大小,特别是在扇形区域相差不大的情况下。今天介绍一种重叠扇形图的绘制方法来解决这一问题。绘图所使用的函数为plotrix包的fan.plot(),首先还是先介绍一下该函数的各种参数。fan.plot(x,edges=200,radius=1,col=NULL,align.at=NULL,max.span=NULL,labels=NULL,labelpos=NULL,label.radius=1.2,align="left",shrink=0.02,main="",ticks=NULL,include.sumx=FALSE,...)各参数意义:x,代表绘图个区域比例的数值向量;edges,弧形由多少个边组成;radius,扇形的半径;col,扇形各部分的填充颜色;align.at,开始align的位置;max.span,各部分最大的延伸角度;labels,各部分的标签;labelpos,标签的位置;label.radius,标签和绘图部分的距离;align,进行align的位置;shrink,相邻部分的间距;main,主标题;ticks,刻度线的个数;include.sumx,是否同时绘制一个所有数值之和的部分。接下来进行绘图的详细讲解,首先建立绘图所需的数据,绘图需要两个向量,一个代表各扇形的比例,另一个为各扇形的标签。a
2020年3月23日
其他

每天学习一点R:22.饼图的绘制

今天给大家介绍几个基本的饼图绘制方法,主要涉及的函数就是pie()和pie3D()。pie函数绘制饼图pie函数是R自带的一个基础函数,专门用于绘制饼图,还是照例先给出使用参数。pie(x,
2020年3月20日
其他

每天学习一点R:21.玫瑰图在生物研究中的实际应用

最近由于人民日报的一张图,直接导致玫瑰图大火,我在之前也对人民日报的疫情玫瑰图进行了仿制。但是实话说,在我们平时的科研数据展示的过程中,玫瑰图的使用频率还是相对比较低的,今天就介绍一个适合用玫瑰图进行展示的数据类型。我们平时无论是做转录组、蛋白质组还是宏基因组等,其中都会有一项结果就是COG数据库注释,COG将所有基因按照功能分为26个大类,以26个英文字母表示,而通常测序公司给我们的图是这个样子的。今天我们使用玫瑰图的形式来展示这个数据,首先需要将数据格式条形为如下形式:数据共分3列,第一列是COG功能对应的英文字母,第二列是注释到该功能基因的数目,第三类是该分类的详细名称。接下来我们进行绘图。#载入绘图包library(ggplot2)#导入绘图数据f
2020年3月18日
其他

红皇后学术文献解读列表

微生物群落组成谱研究MER:裙带菜养殖区域环境因子的变化驱动微生物群落的改变Science:海水样品环境因子采集标准及微生物群落关联研Microbiome:农田土壤微生物群落是随机变化的?PNAS:分散剂促进石油污染修复过程中微生物群落的变化AR:斑节对虾、海蜇和菲律宾蛤仔混合养殖池塘微生物群落研究宏基因组研究FM:宏基因组揭示海洋微生物地球化学循环规律NM:宏基因组+binning首次鉴定表面海水中非蓝藻类固氮微生物SBB:宏基因组binning分析酸性硫酸盐土壤中硫循环微生物JHM:宏基因组探索生物添加法降解多环芳烃过程中微生物及功能基因的变化SR:柴油污染土壤中微生物多样性对生态功能和污染修复的影响综述|Reviews
2020年3月17日
其他

每天学习一点R系列

跟着红皇后,每天学习一点R知识!!R语言得简介和安装扩展包得安装R软件和扩展包得升级数据对象向量因子向量矩阵数据的导入和输出数据的调整plot和par函数绘图详解绘图区域设置颜色设置绘图后修改图像输出barplot条形图之双坐标轴barplot条形图之整合点线图barplot条形图之带误差棒的对称条形图barplot条形图之相关性分析结果分布箱须图的绘制一条代码搞定带误差棒的条形图
2020年3月17日
其他

每天学习一点R:20.一条代码搞定带误差棒的条形图

在前几天的推文中曾经介绍过一种使用arrow()函数用箭头表示误差棒的条形图绘制方法,但是这种方法是基于后期绘图元素的添加,如果所绘制的图像相对比较简单,那没有什么问题,但是如果绘制多系列数据的条形图时,一个一个添加误差棒难免有些麻烦,因此今天给大家带来另外两个可以直接生成含有误差棒条形物的方法。gplots包的barplot2函数首先还是老规矩,先介绍一下barplot2()函数所包含的参数。barplot2(height,
2020年3月16日
其他

科研思路|Nature Ecology & Evolution:基因组结合转录组分析虾夷扇贝发育和光受体蛋白的进化

depths为0.1和2,gaps附近10bp的SNP删除。虾夷扇贝基因进化研究发育研究:采集不同发育时期(受精卵、blastulae、gastrulae、trochophore
2020年3月14日
其他

科研思路|JHM:对虾肠道和养殖环境中抗生素抗性基因分布

MaterialsIF:7.65发表时间:2018点击最下方“阅读原文”下载完整文献pdf文件。本文给出了一个相对清晰的抗生素抗性基因研究流程:研究目的抗生素抗性基因
2020年3月12日
其他

网红玫瑰图:新冠肺炎全球疫情形势图仿制

最近一段时间大家每天都会看到这张图,非常好的展示了全球新冠肺炎的形式,昨天刚有了仿制的打算,图还没画出来今天就看到了Y叔公布的绘图方法,我也是命苦啊!首先还是要感谢Y叔发布的“nCov2019”数据包,毕竟没数据还画什么!另外今天看了Y叔发布的代码,也参考了一些对自己的代码进行了修改,再次感谢Y叔!接下来进入正题,首先就是要下载“nCov2019”的数据包。install.packages("remotes")library(remotes)remotes::install_github("GuangchuangYu/nCov2019")在安装数据包的过程中提示需要升级一些依赖的包,我到最后有一个包没有升级成功,也不知道为啥,我就跳过了,并不影响图像的绘制。之后载入绘图数据。library(nCov2019)data
2020年3月11日
其他

科研思路|JP:蛋白质组揭示仿刺参与繁殖有关的体液免疫和生理特性的性别差异

(AM),因而分别进行了4组不同的比较以鉴定同性别不同繁殖时期
2020年3月9日
其他

每天学习一点R系列

跟着红皇后,每天学习一点R知识!!R语言得简介和安装扩展包得安装R软件和扩展包得升级数据对象向量因子向量矩阵数据的导入和输出数据的调整plot和par函数绘图详解绘图区域设置颜色设置绘图后修改图像输出barplot条形图之双坐标轴barplot条形图之整合点线图barplot条形图之带误差棒的对称条形图barplot条形图之相关性分析结果分布箱须图的绘制
2020年3月8日
其他

每天学习一点R:19.箱须图的绘制

今天我们来仿制一张箱须图,内容涉及boxplot()函数的使用以及利用jitter在箱子内部显示样品分布。原图展示依然与前两天推文的参考图来自同一篇文章,文章使用marker微生物计算了一个疾病指数,之后使用箱须图比较了疾病和健康样本中疾病指数的差异。今天就来仿照绘制一下这幅图,我绘制出来的最终图像是下面这个样子。还是照例先给出完成的绘图代码:gdi
2020年3月6日
其他

每天学习一点R:18.barplot条形图之相关性分析结果分布

今天继续介绍基于barplot()函数的图像绘制,但今天的重点并不是如何绘制图像,而是如何通过前处理进行数据的相关性分析和频率分布统计。原图展示还是上一篇推文中介绍的对称条形图的文献,其中包含一个对疾病和健康marker微生物的丰度进行相关性分析,进而使用条形图展示其相关系数分布的图形。今天就来仿照绘制一下这幅图,我绘制出来的最终图像是下面这个样子。还是照例先给出完成的绘图代码:disease
2020年3月4日
其他

每天学习一点R:17.barplot条形图之带误差棒的对称条形图

今天继续进行基于barplot()命令的文章条形图仿制,今天会重点介绍在R中如何绘制对称的条形图以及怎么给条形添加误差棒。原图展示之前看过一篇利用肠道菌群进行疾病诊断的文章,其中涉及到一个图形,作者将筛选出的marker微生物的总丰度与肠道菌群的alpha多样性指数在同一个图像利用对称的条形图进行展示,同时给出了健康和疾病样品间的差异检验结果。今天就来仿照绘制一下这幅图,我绘制出来的最终图像是下面这个样子。还是照例先给出完成的绘图代码:marker_abundance
2020年3月2日
其他

每天学习一点R:16.barplot条形图之整合点线图

在上一篇的推文中,我仿照文献中的图绘制了一个利用条形图和“点+垂线”组成展示样品中抗生素抗性基因和可移动基因单元检出数目的绘图方法,今天继续仿照文献中的图绘制条形图与点线图结合,同时展示样品中目的基因绝对丰度和相对丰度的图形绘制方法。本文会详细介绍绘图过程中如何进行条形图的绘制并通过修改参数对图像进行调整,本文旨在通过绘图实例讲解各个参数的使用方法,希望大家能够活学活用。特别要注意的是,本文内容中涉及的具体参数数值是根据绘图数据和生成图像的大小设置的,在自己绘制图像时需要根据自己的数据进行调整,切勿直接套用。例图展示原本文章中的图如下所示,使用堆叠的条形展示不同类型抗生素抗性基因的相对丰度,使用单独的条形展示可移动基因单元的相对丰度,之后使用点线图展示了抗生素抗性基因的总丰度。我在绘图的过程中,对图像进行了轻微的改动,添加了不同组样本间的间隔以更好的区分样品的分组信息,最终的图像就是下方这样。先给出绘图的完整代码:args.mges.number
2020年2月28日
其他

每天学习一点R:15.barplot条形图之双坐标轴

前几天学习了R语言绘图相关基本参数,接下来主要是以几个实例来解释各个绘图参数在实际绘图中如何使用,今天先以一个条形图的绘制来进行展开,例图是参考一篇关于抗生素抗性基因文章中的一张图,之后对其进行了改进,以双坐标轴的方式在同一张图中展示不同类型抗生素抗性基因和可移动基因单元的检出数目。本文会详细介绍绘图过程中如何进行条形图的绘制并通过修改参数对图像进行调整,本文旨在通过绘图实例讲解各个参数的使用方法,希望大家能够活学活用。特别要注意的是,本文内容中涉及的具体参数数值是根据绘图数据和生成图像的大小设置的,在自己绘制图像时需要根据自己的数据进行调整,切勿直接套用。例图展示原本文章中的图像如下所示,途中通过两个相邻的条形展示了不同样品中抗生素抗性基因和可移动基因单元的丰度,并且由于抗生素抗性基因可以根据对应的抗生素进行分类,因而使用堆叠的色块展示不同类型抗生素抗性基因的丰度。我在绘图的过程中,对上述图像进行了改进,以堆叠的色块展示不同样品中不同类型抗生素抗性基因的检出数目,以“点+垂线”的方式表示可移动基因单元的检出数目,并分别应用两个纵坐标轴进行标识,同时在图像中增加了一些用于表示分组的文本,最终的图像就是下方这样。先给出绘图的完整代码:args.mges.number
2020年2月26日
其他

每天学习一点R:14.图像输出

使用R语言进行图像绘制之后,最重要的步骤就是将绘制的图片导出,不然不就白画了😂😂😂R支持将图片导出为bmp、jpg、png、tif、dpf等多种格式。命令代码bmp格式bmp(filename
2020年2月24日
其他

每天学习一点R系列

跟着红皇后,每天学习一点R知识!!R语言得简介和安装扩展包得安装R软件和扩展包得升级数据对象向量因子向量矩阵数据的导入和输出数据的调整plot和par函数绘图详解绘图区域设置颜色设置
2020年2月23日
其他

每天学习一点R:13.绘图后修改

绘图后修改通常我们使用基本的绘图命令得到的基本图像并不能让我们满意,这就需要在基本图形的基础上对各个元素进行修改,主要涉及的内容基本上就是坐标轴、文字、图例或添加指示符号等等,今天主要介绍这些元素修改的命令及其中个参数的意义,大家可以收藏一波方便以后查找,在接下来的推文中会以实例的方式详细介绍各个命令的使用情况和使用方法。坐标轴axis(side,at=,labels=,pos=,lty=,col=,las=,tck=,……)各参数意义:side,一个整数,表示在图形的哪边绘制坐标轴,1、2、3、4分别对应下、左、上、右;at,一个数值型向量,表示需要绘制刻度线的位置;labels,标志至于刻度线旁边的文字标签;pos,坐标轴与另一个坐标轴相交位置的值;lty,坐标轴的线型col,轴和刻度线的颜色las,标签是水平(=0)还是垂直(=2)于坐标轴;tck,刻度线的长度,以相对于绘图区域大小的分数表示。axis()函数只能设置一种刻度线,但有时我们希望同时展示主要和次要两种刻度线,此时可以使用Hmis包的minor.tick()函数。library(Hmisc)#载入包minor.tick(nx=n,ny=n,tick.ration=n)各参数意义:nx和ny分别指定x和y轴每两条主刻度线之间通过次刻度线划分得到的区域个数;tick..ration表示次要刻度线相对于主要刻度线的大小比例。文字标题修改title(main
2020年2月23日
其他

每天学习一点R:12.颜色设置

R语言中的颜色R语言绘图中与颜色相关的参数:col,绘图使用的颜色;col.axis,坐标轴字符颜色;col.lab,x,y坐标标题颜色;col.main,标题颜色;col.sub,副标题颜色;fg,绘图前景色,包括坐标轴,各类boxes;bg,绘图背景色。可以直接通过颜色的名字或十六进制标识指定绘图所需的颜色,如需要指定颜色的元素是多个时,将颜色输入为一个向量,之后依次匹配颜色。d
2020年2月21日
其他

每天学习一点R:11.绘图区域设置

绘图区域设置昨天讲解了应用plot函数进行绘图及其绘图参数,在开始绘制一张图像之前,首先要做的就是定义绘图区域,以确定图像绘制的位置及各个元素的分布。par()函数中除了用于绘图元素的参数之外,还有一些是针对绘图区域设置的参数。mai,数字向量,格式为c(bottom,
2020年2月19日
其他

每天学习一点R:10.plot和par函数绘图详解

plot()函数plot()函数是R中最基本的绘图函数,其实最简单、最基础的函数,这也就意味着其具有更多的可操作性。plot(x,y,...)在plot函数中,只需指定最基本的x和y轴对应数据即可进行图像的绘制,x和y轴数据分别为两个向量或者是只有两列的数据框(第一类为x轴,第二列为y轴)。require(stats)plot(cars)plot绘图默认为散点图,可以通过type参数修改绘图的类型。type=”s”是先水平后垂直,type=”S”是先垂直后水平,type=”n”为不显示图像。par()函数plot()函数中的所有绘图参数基本上都是应用par()函数中的参数进行设置,接下来就详细介绍par()函数中可以设置的绘图参数。par(...,
2020年2月17日
其他

每天学习一点R:9.数据的调整

数据框的基本调整通过read.table或read.csv导入的数据一般为数据框格式(data
2020年2月14日
其他

每天学习一点R:8.数据的导入和输出

数据的导入在应用R进行数据分析之前,首先要做的一步工作就是将数据导入R工作环境。R所识别的数据通常为“X·Y”型的多变量数据,格式为txt或csv格式,不同数据间以制表符(Tab)或“,”间隔。输入数据可以使用excel进行录入和基本格式的修改,之后另存为,选择制表符分隔的文本(.txt)或CSV
2020年2月12日
其他

每天学习一点R:7.矩阵

6#设定矩阵的行名和列名matrix(1:6,nrow=3,ncol=2,byrow=T,dimnames=list(c("A","B","C"),c("D","E")))
2020年2月10日
其他

微生物研究相关工具

微生物研究相关工具系列!!BacDive:细菌Meta数据库帮你快速看透目标菌株怎么通过一株菌的名字了解它的前世今生我的菌应该叫什么名字??这个蛋白在什么地方上班?
2020年2月9日