3分和30分文章差距在哪里?
好的分析和可视化,可以提供大量的信息,同时兼顾简洁优雅。
今天我们抛开实验设计、方法和工作量等因素,仅从文章最吸引人的图片来讨论3分和30分(顶级)文章差距在哪里?
以2017年8月25日发表在Sciences杂志上的封面文章为例,简介顶级文章的图版设计、组合、展示方式,再顺便回想一下您读过的其它文章,尤其是3分级别文章,那差异不言而喻。
此篇Science正文仅有3幅图,但却准确传达了作者多年研究的精华成果,让我们带大家解读一下顶级文章中一图顶千字的妙用。
图 1. 哈扎人肠道菌群随季节变化
本图主要基于16S扩增子测序结果,从组间整体差异,不同时间点各分类学、OTUs种类角度,展示哈扎人肠道菌群随季节变化的特性。
本图有13个子图分为6组,从6个不同的研究角度、分析方法和展示方式来对本图主题进行说明。
(A) PCoA散点图+箱线图:基于无权重UniFrac距离的PCoA展示5个季节间样品的差异,可以看出不同季节间菌群在 PCoA2 轴存在变化,且随时间周期循环,颜色选用蓝、绿、紫即柔和又容易区分,并添加组主体置信椭圆背景色和95%置信区间虚线方便读者观察各组全貌和比较组间主体区别;右侧添加箱线图展示在PCo2轴上旱季和雨季分布存在显著差异,而两个旱季间无显著差异,同时添加拟合曲线突出周期变化的规律;
(B) PCoA+时间序列散点图:B图上部从科水平基于Bray-Curtis距离
进行PCoA分析,展示哈扎人和现代人区别;下部在PCoA1轴上再按季节时间顺序分组展示哈扎人菌肠随季节每年周期变化的规律;
(C) 流图 (一种堆叠面积图):各菌门中OTUs累计数量随季节变化(至少在10%样品中检测到的OTUs才用于分析)
(D) 桑基图:拟杆菌门、厚壁菌门OTUs在不同季节中物种动态变化;随着时间变化 ,哪些OTUs保留或消失,哪些新来的,以及在每个阶段中的变化。
(E) 线性判别分析 (LDA,一种限制性排序分析)展示按季节分组最大贡献的OTUs;
(F) 热图展示所有样品在不同季节不同科中OTUs丰度变化,即体现组内样品间重复性,又展示组间的周期变化的差异和规律。
点评:B图上部PCoA中为什么选择科不是OTUs,我估计作者应该是目、科、属、种、OTUs级别都分析过,只是科分类结果更好;PCoA下部时间序列散点图添加拟合,这种展示方式都是根据结果总结归纳,再选择合适的图形展示方式突出结论;C/D图把工业的stream graph
和sankey diagram
都使用上了,将艺术与生物规律完美结合,可见参与本文可视化的同行绝对是本领域中的顶级团队。很多优秀的顶级文章,一般也是由两、三个顶级团队优势互补的结果。
图2. 哈扎人肠道菌群功能随季节周期循环
本图主要基于宏基因组测序碳水化合物代谢基因的种类、丰度进行分析,揭示哈扎人菌群功能周期的变化和与现代人的差别。
本图有8个子图分为5组,从5个不同的角度主题进行说明。
(A) 箱线图展示宏基因组CAZYome
基因Shannon多样性按季节变化和与现代人比较;
(B) PCA分析CAZYome表明哈扎人与现代间此类基因显著差异即为样品间主要差异;
(C) 动植物碳水化合物/粘多糖占CAZYome中比例在哈扎人和现代人间存在显著差异;
(D) 几种CAZymes丰度在哈扎人中周期变化,以及与现代人比较
(E) 抗生素抗性基因多样性,哈扎人低于现代人,且存在季节周期变化
点评:宏基因组中从整体到类别,可分析的结果很多,但结果是用于服务科学问题和故事主线的。其中饮食的不同,主要影响碳水化合物的比例和组成,以及抗性基因的种类和丰度。因此选定好的逻辑出发点和故事主线是高水平文章的重点,这个别人很难帮你。但你有了好思路,找技术达人合作或与课题负责分析的朋友沟通,那是水到渠成和锦上添花的事,即使花费大量时间去美化都是值得的。当然也可自学差异箱线图绘制。
图3. 不同地区人肠道菌群样式与生活方式相关
哈扎人与HMP 16S扩增子公共大数据的比较,进一步强调大尺度上的国家、年龄与菌群的关系。
一张PCoA结合国家、年龄和主要细菌科在1/2轴上分布关系的讨论,证明想要表达的环境因素与菌群结构间的相关程度。
(A) 主图为基于Bray-Curtis距离的PCoA;上图为PCoA1轴坐标按地理分组绘制箱线图并排序,展示地区不同生活方式是菌群差异的最主要因素;左图为PCoA2轴坐标按年龄分组,尤其是存在有婴儿数据与成人差异较大要特别注意。
(B) 密度图展示7大菌门在PCoA1轴上样品的累计密度,可以观察数据分布模式,如单峰,双峰等,用于指导分型和进一步挖掘规律。
点评:(A) PCoA和箱线图在本领域最常用,想要展示传递丰富信息得靠你的科学问题和实验设计,具体绘图和组合的技术障碍,可以在培训班中解决。(B) 分布密度图在转录组、表观组学中极常用,但在微生物组中很少使用,本文将其巧妙的用于展示分类学沿PCoA1轴上分布,与上图顶部中地区分布相遥相呼应,设计之精巧让令我们这群十年生信老司机都十分佩服。
点评
其实此文的样本量并不大,作为时间序列研究仅有一年五个时间点共350个样品,时间点和样本量都比较少;科学问题也不够新颖,因为哈扎人肠道菌群与现代人的差异,早在2014年《Nature Communication》上己经发表,而且当时还测了代谢组。本文特点是研究时间跨度更大,主要发现是肠道菌群随季节的变化,这在现代人中也是很难观察到的(可能多年前北方冬季纯靠储存土豆白菜过冬时,我的肠道菌群季节变化也很明显)。更大的亮点在于,作者在结果的呈现上也是蛮拼的,在逻辑的框架上与图形艺术组合,使简单的结果瞬间B格满满,让广大同行清醒认识到自己离顶级文章的差距有多大。
样品都是13年3月至14年9月采集的,直到17年4月19日投稿,项目从采样至投稿历时超过5年,其中样品测序和数据分析也近4年,现在呈现在我们面前的结果一定是经历上百次反复计算和优化而来的,可以想像作者们为这个项目花费了多少精力了心血。
Reference
Samuel A. Smits, Jeff Leach, Erica D. Sonnenburg, et al. Seasonal cycling in the gut microbiome of the Hadza hunter-gatherers of Tanzania. Science 25 Aug 2017:http://science.sciencemag.org/content/357/6353/802
Schnorr, Stephanie L., Marco Candela, Simone Rampelli, Manuela Centanni, Clarissa Consolandi, Giulia Basaglia, Silvia Turroni et al. “Gut microbiome of the Hadza hunter-gatherers.” Nature communications 5 (2014). https://www.nature.com/articles/ncomms4654?WT.ec_
福利
如果您的文章结果,也能用上文这么清楚的思路和和高大上的展示方式呈现,还愁不能在众多高分文章中轻松脱颖而出吗?
如果你还不会分析,可以参加我们与2018年3月在北京鼓楼举办的《扩增子分析专题培训》,助力你把握分析思路,亲自实战分析,学会自己动手在大数据中挖掘科学问题的答案。
同时保证你十几种常见统计绘图轻松上手,即有我们开发的在线平台绘制,鼠标点选即出图;更提供R语言绘图实例和代码,让你轻松活学活用,进一步随心所欲,满足你绝大多数结果展示需求。
广大粉丝的期待下,生信宝典系列易生信培训班为大家提供一条走进生信大门的捷径,真正的实操教程,独创线下2天+线上5天+线下/上2天三段式教学,给予充足的实践和发现问题的时间,真正实现独立分析大数据。
我们的专题每月一期,每年同一主题仅有一次,错过一期就要再等一年了。
为什么要参加生信培训
学知识,更学经验;解决问题,更会如何解决问题。
自己科研项目有需要
公司分析虽然简单,但有时总不能对自己的胃口,一来定制分析费用贵,二来知识信息不对称,沟通成本高。不如自己学一下,无论是自己处理数据,还是跟跟公司沟通都会更方便,更有效率,合作也会更愉快。想要快速生信入门
生信之所以入门难,是因为涉及知识面广。自学周期长,老板又催的紧,远不能满足课题进度。培训跟着老司机走干道,9天学会自己需要半年摸索的经验,这个投入相比节省的时间,是很划算的。成为团队中不可或缺的人
无论是升学、出国、找工作,生物人才一抓一大把,但生信分析人才紧缺。多一份能力,多一个机会。而且掌握生信技能展开广泛合作是最容易成为核心成员,与团队粘性增强的重要方式。
我们的优势
实战派专家
讲师主要来自中科院百优博士、海内外博后,目前就职于科技公司CTO、中科院技术平台科学家,一线分析人员,人均30个以上近10年项目经验。真正解决你科研中的技术困难。不要再听那些大牛的讲座和培训了,满满的套路讲自己的文献,而不是怎么操作,结果回来后发现什么也干不了——成功学思路害人不浅: 不经实战的成功学思路对初学者都是耍流氓。强大的助教团队
我们拥有10余名中科院、清华、北大、中大、协和以及海归博士和博后。基础差跟不上,有一对一助教;培训后,有专享视频反复学。真正的售后保证
之前很多的培训班我也参加过,参加就真没有然后了。我们坚持只要认真学,就包教包会的原则,培训一个月内提供随时问题解答,学员终身专享论坛提供技术支持。绝佳的地理位置
培训地点是北京鼓楼——首都的二环里,背靠鼓楼面朝后海,周边无数的历史文化遗迹,对学员来説不仅是自身技术的蜕变,还有文化的洗礼。
我们的课程
转录组和R作图两期培训班已经结束
R培训现场,教室宽敞明亮,每人一张大桌。后台回复培训有惊喜哦。
助教1对1指导,图中两位助教分别为北大本科海归博后和清华博士。
目前可以报名的课程:
微生物多样性扩增子分析
手把手教你分析微生物多样,windows, mac,linux统统可以用起来,结果可视化水平向CNS看齐,宏基因组团队骨干全程参与,即是对本领域系统学习的好机会,更是实战技术交流的盛宴。ChIP-seq表观组数据分析
比对,peaks,差异,motif,富集分析及美图,一个都不能少宏基因组数据分析
海量数据无从下手,依托“宏基因组”公众号十余名核心技术骨干,带你从科学问题出发,在数据中海洋中开启淘金之旅。
更多课程的详细介绍,请扫描下方二维码。
复制以下链接
http://www.ehbio.com/Training/ 或
点击阅读原文跳转报名页,缴费成功还可获得32G品牌定制U盘 (内含数据资料)。多人(N,10>N>1)同时报名并缴费,每人还可获得价值N百元的礼品(充值或购物卡)。学会数据分析,成为实验中不可或缺的人,赶快报名吧!