给你安排一个懂生信的工具人(七):在线版相关性分析
“给你安排一个懂生信的工具人”这个系列我们一直致力于给大家制作或分享一些去代码化的生信工具,以方便非生信专业的科研人员将科研时间集中花费在生物学问题上。学习的同时也欢迎大家关注公众号“Biomamba 生信基地”:忙里偷闲,简单地写了个PCA(Principal Component Analysis)在线分析的工具,有需要的小伙伴可以文末点击原文链接或通过这个链接访问:
https://biomamba-online-tools.shinyapps.io/PCAshiny/
B站同步播出:https://www.bilibili.com/video/BV1334y197Pw?p=5
首先你需要把自己的数据存为csv文件,如果你还不知道自己的文件如何转换成csv格式,请看这里:
工具的用法就很简单了,无需任何操作,上传你的文件即可:
今天的背景介绍可能相比前几个工具来说会比较少,用起来先。我们简单了解一下PCA的意义即可:1、简化运算:应用PCA就可以在尽量多的保持变量所包含的信息又能维持尽量少的变量数目,帮助简化运算和结果解释 。2、去除数据噪音。3、利用散点图实现多维数据可视化 。4、我们在合并冗余原始变量得到主成分过程中,会发现某些原始变量对同一主成分有着相似的贡献,也就是说这些变量之间存在着某种相关性,为相关变量。同时也可以获得这些变量对主成分的贡献程度。对基因表达数据可以理解为发现了存在协同或拮抗关系的基因。5、以上是官话,PCA最核心目的就是降维,帮你把成千上万个变量浓缩到几个PC的维度,从而观察各样本的数据之间是否存在差异。如果从PCA的角度来看数据分布差别不大,那么下游的差异分析其实显得不太有必要,over。
最近发现后台中有一些消息我没能及时看到并答复,微信后台中超过48h后便不允许回复读者消息,这里还是再给大家留一下答疑的扣扣号,方便大家随时交流:1913507043。微信号可以点击喜欢作者后自动回复里有。欢迎大家向我咨询或者提供建议。大家可以阅读完这几篇之后添加我:如何搜索公众号过往发布内容
答疑公约
笑一笑也就算了