甲基化450k芯片数据的处理和分析软件汇总
上一期我们已经介绍了肿瘤相关的甲基化高通量数据,我们得出的结论是当前甲基化芯片数据的存储量占有绝对优势。既然如此,我们本期介绍甲基化450k芯片数据的分析软件和方法。(当然最新的850k芯片也类似)总的分析流程跟普通的表达谱芯片分析相差不大,包括质控,背景校正,标准化,下游的差异分析和富集分析等。
接下来我们总结下现有的分析软件及其在分析流程上的功能覆盖如下图,虽然illumina公司自带了一款分析软件,不过很贵哦,而且受制于人,我们当然更喜欢自由免费的了,Bioconductor平台上有诸多免费开源的软件,而且你总能使用最新的算法,实时更新,不过使用者需要有一点点R语言的基础。
这里我们重点介绍这5个功能比较强大的综合性软件
Methylumi:以R语言为基础用于分析450k芯片数据,支持MIAME (Minimum Information about a Microarray Experiment)信息,内置了一个叫做noob(normal-exponential convolution using out-of-band probes)的标准化方法,该软件能够转换R对象,很好的兼容其它分析软件。
Minfi: minfi包类似于Methylumi,是一个综合的分析包,虽然不提供一个能一次性完成整个分析流程的函数,但该软件包还是提供一个完整分析流程所需的各个模块。该软件更新分析方法速度快,还内置了Genome Studio(illumina公司提供)的标准化和预处理方法。质控部分可提供一些图片和一个HTML的质控报告。
wateRmelon:该软件包提供了15种标准化方法的借口,支持IDAT文件和txt文件的导入,同样的,该软件能很好的兼容其它分析软件包。
ChAMP: 这是一个功能非常强大的包,用户友好度非常高,对于编程能力不强的生物医学背景人员非常有利,它内置了其它软件如minfi,进行了很好的整合,自动化程度很高,用户只需要使用很简单的函数就能完成整个分析流程,提供一体化函数,简单的说就是有一种用户友好型的软件,通过个人的使用经验,该软件也有一个不足,就是安装比较困难,原因是该软件很多功能是建立在其它软件包之上。值得一提的是,在学习该软件的过程中,认识了ChAMP包的维护者Yuan Tian博士(http://www.picb.ac.cn/compsysg/Member/Member.php),现在是中科院的博士,很感谢他为我解答了很多困惑。后续我会专门介绍这个包在使用上的一些注意事项。
RnBeads:这是一个综合的分析软件包,在2014年发表在Nature Methods上,一个显著的亮点是,提供一体化函数rnb.run.analysis(),就是能够一次性完成整个分析流程的函数,这对像小编这种生物医学背景的同学可是个大福利哦。可以提供PCA,MDS的分析,USUC接口,ENCODE注释,以及其它的数据可视化功能,差异分析是基于limma包。
从以上的总结,对于编程能力不强的小伙伴,小编极力推荐后两款软件,自动化程度很高,业界良心啊,当真是可以说是学术界的一股清流了,君不见作为医学生的小编当年刚学写代码的惨状,惨不忍睹啊。
好了,这一期就先扯到这里吧,大家心里有数了吧,最近在医院外科实习,忙得不可开交,下期我们话不多说了,直接上代码吧!
参考文献
Analysis pipelines and packages for Infinium HumanMethylation450 BeadChip (450k) data Methods. 2015 Jan 15;72:3-8. doi: 0.1016/j.ymeth.2014.08.011
Review of processing and analysis methods for DNA methylation array data. Br J Cancer. 2013 Sep 17;109(6):1394-402. doi: 10.1038/bjc.2013.496.
欢迎关注生信人
点击以下「关键词」,查看往期内容:
TCGA | 小工具 | 数据库 |组装| 注释 | 基因家族 | Pvalue
基因预测 |bestorf | sci | NAR | 在线工具 | 生存分析 | 热图
生信不死 | 初学者 | circRNA | 一箭画心| 十二生肖 | circos
舞台|基因组 | 黄金测序 | 套路 | 杂谈组装 | 进化 | 测序简史