其他
快打开!你需要的微生物云工具使用指南! |微生物专题
您在进行测序分析后是否有如下苦恼:
拿到项目结果没有头绪,不知道如何下手怎么办?
发现样本异质性想要剔除部分样本重新分析怎么办?
项目结果图片配色不喜欢怎么办?
项目结果图片里展示结果并不是我关注的想要挑选数据重新绘图怎么办?
项目结果图片不够丰富,有没有其他展示形式?
想要自己动手整理数据绘图但不会代码怎么办?
目前联川生物云平台包含如下5个模块:云工具、云分析、云课堂、资料中心和用户文章
图1 联川生物云平台
云课堂、资料中心和用户文章
1.1云课堂云课堂模块中我们对视频教程进行了主题分类,您可以在学习数十种云工具的使用。
1.2资料中心资料中心模块整合了包括不同产品DEMO报告、产品报告解读视频、SOP等材料,您可以使用微生物组学关键词和标签进行筛选学习。
1.3用户文章我们已助力客户发表大量优质文章,您可在用户文章模块使用16S等关键词进行查找;另提供了影响因子查询小工具,您可将鼠标放在用户文章名称打开该工具查看期刊IF。
02
云分析云分析模块包含扩增子项目重分析和扩增子项目重绘图两个模块,侧重点不同根据您的需求选择使用。
2.1扩增子项目重分析重分析模块目前仅针对我们的在服项目,可从原始数据开始重新生成ASVs,α多样性,β多样性等所有项目流程分析结果,您可在此模块进行剔除样本的从头分析。
2.2扩增子项目重绘图重绘图模块输入文件为包含物种注释的ASVs/OTUs丰度表(feature_table_with_taxonomy.xlsx)、OTUs/ASVs代表序列(2_feature_rep_seq.fasta)和样本分组信息表(sample_info_ori.xlsx),您可在此模块进行样本剔除/重命名、增加比较组、指定分组顺序的图形优化等分析。
03
云工具云工具模块目前适用于微生物数据处理和绘图的工具已有20余款,包括β多样性的PCA、PCoA、NMDS和CCA/RDA分析、组间/样本间取合集/差集的VENN图和UpSet图、分类群等数据间关联展示的网络图、circos和桑基图等,且仍在持续更新中。云工具使用均有配套的视频教程、SOP文档等,这里选取个别使用频率较高的云工具做使用方法展示。
3.1排序分析β多样性的主要展示方式之一为排序分析,其核心思想是通过投影的方法进行降维,使我们能够理解复杂的高维数据,最终在2/3维层面上进行数据展示,物种组成、丰度或进化关系更相似的样本在图上的距离更近。不同排序方法并没有绝对的优劣之分,选择最能帮助您阐明生物学问题的结果即可。根据排序分析是否有环境因子约束,可分为非约束性排序:主成分分析(Principal Component Analysis, PCA)、主坐标分析(Principal Coordinate Analysis, PCoA)和非度量多维标度(Non-metric Multi-dimensinal Scaling);约束性排序:典范对应分析(Canonical Correspondence Analysis, CCA)和冗余分析(Redundancy Analysis, RDA)。另外根据排序基于的模型不同,又可分为线性模型(Linear Model)和非线性模型(Non-linear Model)(单峰模型)。表1 不同排序分析方法异同
(https://www.omicstudio.cn/tool/25)PCA直接读取物种丰度数据计算欧氏距离进行排序,如果数据很不均匀需先进行数据转化,一般进行Hellinger转化再计算距离矩阵。由于云工具模块不同排序分析可调整参数是比较类似的,因此以PCA为例详细介绍工具的使用。
Step2:初始图形默认x轴和y轴分别为PCA1和PCA2;您可选择展示不同的主成分(如y轴选择PCA3),但目前x轴和y轴标题并不会自动改变,需下载数据获取所选主成分的解释度并在其他参数部分进行修改;
(https://www.omicstudio.cn/tool/24)PCoA不同于PCA是读取不同距离矩阵进行排序分析,不同距离算法聚类效果会有差异。Bray-Curtis距离考虑物种的有无和丰度、Jaccard距离仅考虑物种的有无、Unweighted UniFrac距离考虑物种的有无和进化关系、Weighted UniFrac距离则同时考虑物种的有无、丰度和进化关系。
(https://www.omicstudio.cn/tool/23)NMDS与PCoA相同都是读取样本的距离矩阵进行排序分析,但其不依赖于相异系数的数值而是排序(秩次排序),所以称为非度量多维标度;NMDS排序分析的坐标轴并没有如解释度的权重意义,其通过stress判断能否很好的反映原始数据的排序,一般认为是可以stress<0.2接受的结果。
(https://www.omicstudio.cn/tool/65)RDA/CCA是最常见的限制性排序方法,前者基于线性模型,由PCA结合多元回归分析;后者基于单峰模型,是CA/RA和多元回归的结合。RDA/CCA方法的选择,基于DCA(Detrended Correspondence Aanlysis)分析第一轴的大小,大于4选择CCA、3-4之间RDA和CCA均可、小于3则选择RDA;我们的云工具会主动提示您选择何种排序方法。
3.2线性判别分析LEfSe(https://www.omicstudio.cn/tool/60)LEfSe(Linear discriminant analysis Effect Size)分析可以进行两组或多组差异分析,寻找组间具有统计学差异的生物标志物(Biomarker)。其分析方法是:首先采用Kruskal-Wallis检验分析多组间显著差异类群;再利用Wilcoxon检验检查上步差异类群在两组间的差异性;最后用线性判别分析(LDA)评估差异显著的类群的影响力(LDA score),获得最终的Biomarkers。
3.3箱线图Boxplot(https://www.omicstudio.cn/tool/1)箱线图是数据统计分析最常用图形之一,目前在微生物组学研究中多用于α多样性、特定菌群/功能基因的丰度分布展示。箱体从上到下依次为:最大值、上四分位数、中位数、下四分位数和最小值,其他离群值以点形式体现。
3.4网络图(https://www.omicstudio.cn/tool/64)Microbiome微生物组概念涵盖了微生物和周围环境,微生物会受到环境因素的影响,如温度、pH和营养物质等;物种之间也存在复杂的相互关系,包括竞争、捕食、重组和协同进化等;另外微生物和宿主之间也会相互影响,在宿主的发育、代谢和免疫中发挥重要作用。基于高通量测序我们获取了不同生境中复杂的微生物群落构成,想要很好理解这些生境中微生物-微生物、微生物-环境之间的相互作用关系非常困难。Network网络理论在包括微生物群落的很多复杂系统中存在普遍的适用性。网络图的主要要素为节点“Node”和边“Edge”,Node一般通过不同形状、颜色和大小等属性表征不同丰度OTUs或其他分类群、环境指标或功能分类等;Edge一般连接两个Nodes,根据是否方向性分为“有向图”和“无向图”,有向图可反应点的次序;两个Node之间可连接不止一条Edge,不同Egde可通过方向性、线型、颜色和粗细等属性不同关联关系。
Step1:上传数据分为无分组和有分组两类,可通过分组文件对Nodes代表的分类群进行更高分类层级的表征等。Data1/2列为关联两两关联的Nodes;rho列为相关性系数,如Pearson/Spearman相关性,绝对值越大相关性越高;pvalue列为相关性系数的显著性;relation列为正相关positive/负相关negative;name列为分类群/环境因子等名称;group列为分类群更高分类层级注释、Node数据类型等。
Step2:修改参数调整网络图;数据处理部分可以进行关系对去重,并设置相关性系数和pval阈值;点参数和边参数部分可对颜色形状、形状/类型、大小/长宽进行调整;常用设置部分有两个关键参数:布局:可调整Nodes的整体分布;另可选择是否绘制有向图,如选择则默认箭头方向Data1到Data2,相关性网络图为一般不选择;高级功能部分还可修改Node和Edge属性上传绘图。
相关阅读
最近发Cell的肿瘤微生物组,你都了解吗?| 微生物专题
一步一图详解最新的SRA数据上传方法(内含常见报错解决方法) | 微生物专题
除了SRA,数据上传国内的GSA也是极好的(详尽版操作指南)
所见即所得,绘图高规格联川云平台,让科研更自由