查看原文
其他

小姐姐告诉你2秒钟的PCA图2分钟就能学会| 生信快闪

运营部-LFY 联川生物 2022-05-21

最近我们推出了一系列小姐姐专题微信稿,在后台收获了很多留言。在开始今天的专题之前我们先来介绍我们的小姐姐——吕枫烨同学。

她于2016年加入联川生物,从事生物信息分析工作已经超过3年,目前是联川生物云平台的负责人之一。擅长R语言和各种统计做图分析。日常工作除了搭建云平台和售后外,还是R语言培训的主力讲师之一,编写各种教材和培训材料有几万字。你们现在拿到的结题报告里,95%的图都是用她写的代码画的,是不是很厉害呢?

小姐姐教你下载史上最全信号通路基因列表 | 生信快闪

小姐姐教你如何做FC值计算 | 生信快闪

小姐姐告诉你如何画韦恩图 | 生信快闪

不同样本的差异通路如何绘制热图?| 生信快闪

云工具地址:http://www.lc-bio.cn/overview/32?tools=PCA_16s_V3.0



分析需求
在进行微生物组的PCA分析时,有时会出现变量少于样本数的情况,如下示例文件。对于这种情况,PCA分析一般会报错,联川云工具针对这种情况开发了微生物组PCA,当变量少于样本数时自动转换算法,从而进行PCA分析。

输入文件如图,变量少于样本数的意思就是,行数少于列数。一列对应图上的一个点:注意把您要展示的信息放在列的位置,如果在行的位置上,直接在excel表格中做一个“转置”处理即可。

分析步骤

图片解读PC1、PC2等都是实际不存在的东西,它是在空间中找到一个平面,所有点到这个平面的距离之和最短,如图就是这个平面,图上的点就是空间中的点在这个平面上的投影。同理,点也可以投影到一条线(一个维度)上,如PC1。根据贡献度大小降序排列就分成了PC1、PC2......。贡献度指这个维度对于数据整体的解释能力。由于做了降维处理,势必损失掉一部分信息,保留原数据特征信息越多的维度就是贡献度越大的维度,所以一般我们只观察PC1和PC2。图中的R值和P值分别用于计算组间相关性和差异显著性,专用于微生物组,如果不需要,可以在作图红框处选择“隐藏”

数据解读第一二列分别是分组和样本信息,后续列是每个维度的信息,列名记录了该维度的贡献度。表格中的数据就是它们在图上对应的位置,如,C_2样本的PC1是0.04,PC2是0.02,对应图上的代表C_2这个点的x轴坐标位置是0.04,y是0.02。


相关阅读

小姐姐教你下载史上最全信号通路基因列表 | 生信快闪
小姐姐教你如何做FC值计算 | 生信快闪
小姐姐告诉你如何画韦恩图 | 生信快闪
不同样本的差异通路如何绘制热图? | 生信快闪2020年又有大动作,联川生物云平台开放注册!
联川云平台的“武林秘籍”
是谁的小眼睛还没看全新的联川生物云平台

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存