斯坦福大学统计系教授带你玩转微生物组分析
Susan Holmes
Susan Holmes是斯坦福大学统计系教授,在微生物组领域造诣极深,编写过一系列优秀的分析工具,如DADA2 https://www.bioconductor.org/packages/release/bioc/html/dada2.html 、phyloseq https://www.bioconductor.org/packages/release/bioc/html/phyloseq.html 、Shiny-phyloseq https://joey711.github.io/shiny-phyloseq/
等,而且开发了一系列开放课程,方便同行学习,并致力于推广可重复计算。实验室主页:http://statweb.stanford.edu/~susan/
截止2018年5月29日,Susan Holmes已经发表文章207篇,引用9950次。其Google学术主页链接如下,可查看发表文章列表
https://scholar.google.co.jp/citations?user=Z5Zjy6cAAAAJ&hl=en&oi=ao
主要作品简介
1. 微生物组可重复分析R包
phyloseq: an R package for reproducible interactive analysis and graphics of microbiome census data
PJ McMurdie, S Holmes
PloS one 8 (4), e61217
本文虽然只发表在PloS one上,但不到5年引用1233次。是R平台上微生物组分析可视化非常优秀的流程,而且一直在更新维护(最新为2018年4月23日版本,支持最新的R 3.5.0),喜欢用R分析的伙伴不容错过。包不能治百病,只能解决作者定义好的套路,自己要做出非常个性的结果,仍需要有独立思考和解决问题的能力。
McMurdie and Holmes (2014) Shiny-phyloseq: Web Application for Interactive Microbiome Analysis with Provenance Tracking. Bioinformatics (Oxford, England) 31(2), 282–283.
隔年又推出了phyloseq的网页版本 https://joey711.github.io/shiny-phyloseq/ ,方便没有代码操作基础的伙伴使用,真心太貼心了。
2. 微生物组数据统计方法讨论
Waste Not, Want Not: Why Rarefying Microbiome Data Is Inadmissible.
PJ McMurdie, S Holmes
PLOS Computational Biology 10 (4)
本文2014年发表于PLOS Computational Biology,主要讨论测序的原始reads counts,抽样数据,以及比例数据在统计中的取舍、Power等,对这方面的疑问的小伙伴欢迎阅读此文,应该会给你答案。
3. 非聚类OTU算法dada2
DADA2: high-resolution sample inference from Illumina amplicon data
BJ Callahan, PJ McMurdie, MJ Rosen, AW Han, AJA Johnson, …
Nature methods 13 (7), 581
2016年发表于Nature methods,可见此方法有多强势,一年多被引211次。敢直接向Robert Edgar叫板、拍砖。引起了扩增子分析非聚类算法领域的快速发展。对这方面不了解的朋友,欢迎阅读我们之前的文章。
课程推荐
而且作者致力于软件和教程的推广,在其中主页上有很多经典的课程。
http://statweb.stanford.edu/~susan/courses/
统计系的老师,当然课程偏统计。想深造的人去好好学学。要问我生统学好有什么用,反正我认识的几个国外生统毕业的博士,都没有做博后,就直接在国内外一流研究机构拿到了职位。
可重复计算
作者同时还注重可重复计算的实现,和方法的共享。如下文提供了全部的分析代码和讲解,供同行学习交流。
孕妇微生物组的时空变异
这是作者2015年发表在PNAS上的文章,引用182次。
DB DiGiulio, BJ Callahan, PJ McMurdie, EK Costello, DJ Lyell, A Robaczewska, CL Sun, DSA Goltsman, RJ Wong, G Shaw, DK Stevenson,
SP Holmes, and DA Relman
Temporal and spatial variation of the human microbiota during pregnancy PNAS 2015 ; published ahead of print August 17, 2015, doi:10.1073/pnas.1502875112
原文PDF:http://www.pnas.org/content/pnas/early/2015/08/12/1502875112.full.pdf
可重复计算R脚本和数据:http://statweb.stanford.edu/~susan/papers/PNASRR.html
同时大学还提供了实验数据的永远保存地址:https://purl.stanford.edu/hg140kw6221 严格管理和配套设施很重要
本研究分为Vaginal、Stability和Delivery三部分。
如本文以第一部分进行讲解
孕妇阴道微生物组分型
先下载数据 PregnancyClosed15.Rdata 至工作目录,再右键另存Rmarkdown至工作目录。
再用Rstudio打开Rmd运行,并参照如下网页版教程学习。
http://statweb.stanford.edu/~susan/papers/Pregnancy/PNAS_Vaginal_Analysis.html
猜你喜欢
10000+:肠道细菌 人体上的生命 宝宝与猫狗 梅毒狂想曲 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊
文献阅读 热心肠 SemanticScholar Geenmedical
16S功能预测 PICRUSt FAPROTAX Bugbase Tax4Fun
写在后面
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外150+ PI,1500+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读