其他
难者不会,会者不难
做任何事情,都要有方法。
如果你知道做某一件事情的最佳方法。那么,你会觉得很好做,一点也不难。
困难的事情对于一般人来说,难以解决是因为不懂,而对于会的人或行家来说,一点不难。
我们《生信技能树》一直都有转录组产品线的明码标价的生物信息学数据分析服务
因为咱们《生信技能树》公众号的小伙伴绝大部分都是会多种ngs数据处理的,甚至是单细胞等热点数据分析都不在话下,所以就有按捺不住的小伙伴会冷嘲热讽的说咱们《生信技能树》的转录组产品线的明码标价的生物信息学数据分析服务简直就是抢钱,一个简单的差异分析和富集分析就800块钱了。大家手上都是有成熟的流程和代码,其实也就是跑了一下代码,十几分钟的事情。如果是需要理解图表的生物学含义,就需要看我六年前的表达芯片的公共数据库挖掘系列推文即可;
解读GEO数据存放规律及下载,一文就够 解读SRA数据库规律一文就够 从GEO数据库下载得到表达矩阵 一文就够 GSEA分析一文就够(单机版+R语言版) 根据分组信息做差异分析- 这个一文不够的 差异分析得到的结果注释一文就够
为十几分钟的代码付费800是否是抢钱呢?
那就回归到今天的主题了:《难者不会,会者不难》,也许这样的标准分析确实是在内行人看来含金量不高,但是对生物信息学门外汉来说确实了不得的成就。如果真的要以内行人眼光看每件事情,哪怕是fastq数据处理拿到表达量矩阵也是写好的流程,自动化运行个把小时即可。
但是如果你真的要从零开始学它,不下苦功夫是不太可能的。我那么多学徒那么多实习生都是这样过来的,比如最近连载的:转录组数据分析实战,目录如下所示:
(零):RNA-seq流程前的准备——Linux与R的环境创建 (一):上游数据下载、格式转化和质控清洗 (二):上游数据的比对计数——Hisat2+ featureCounts 与 Salmon (三):在R里面整理表达量counts矩阵 (四):差异分析前的准备——数据检查 (五):差异分析——DESeq2 edgeR limma的使用与比较 (六):GO、KEGG富集分析与enrichplot超全可视化攻略 (七):GSEA——基因集富集分析 (八):GSVA——基因集变异分析 (九):PPI蛋白互作网络构建(上)——STRING数据库的使用 (十):PPI蛋白互作网络构建(下)——Cytoscape软件的使用 (十一):WGCNA加权基因共表达网络分析——关联基因模块与表型
但是如果你点进去看具体的每个笔记,阅读量确实是少的可怜,其实真正肯下苦功夫的人并不多。如果你愿意学,我们也欢迎,马拉松课程随时为你敞开大门,七天后就是一个月的钉钉群在线直播互动授课:
数据挖掘(GEO,TCGA,单细胞)2022年5~6月场,快速了解一些生物信息学应用图表 生信入门课-2022年5~6月场,你的生物信息学第一课
你可以系统性的学到生物信息学常见图表制作以及其生物学意义,我在 25张图带你玩转表达量差异分析思路, 列出来过:
图1:表达芯片的质量控制 图2,3,4 差异分析火山图和热图 图5,6,7,8 挑选到的上下调基因各自的PPI网络图 图9,10 上下调PPI网络图的子网络 图11,12,13, 14 上下调基因与各自的MiRNA关系图和转录因子关系图 图15,16 上下调核心基因的生存分析 图17,18 上下调核心基因的肿瘤和对照表达差异 图19,20 上下调核心基因的肿乳腺癌亚型表达差异 图21 看核心基因的突变全景图 CbioPortal 网页工具 图22 看核心基因的蛋白表达情况 human protein atlas (HPA)网页工具 图23 看核心基因的TNBC亚型生存情况 图24 看核心基因的quantitative PCR实验验证 图25 看核心基因与免疫浸润关系
最后,你觉得下面的图表难吗?