查看原文
其他

宏基因组理论教程1宏基因组简介

宏基因组 宏基因组 2022-03-28

之前分享的加拿大生信网出品的《宏基因组分析教程》,有1万多位朋友阅读,有近2000多小伙伴下载了课程PPT。

但不知有多少小伙伴真正仔细学习过。收藏是没有用的,只有真正多学几遍才有收获

对于英文原版教程,很多新人有看不懂,学不会的问题。宏基因组团队针对这套教程进了翻译,同时结合最近的研究进展对内容进行了更新,方便广大同行入门者学习。

教程大纲

  1. 简介-定义、方法和数据库

  2. 扩增子-微生物群落多样性

  3. PICRUSt-16S预测功能基因

  4. 宏基因组分类学-分类和分箱

  5. 宏基因组功能-数据库与通路

  6. 宏转录组-数据、分类学和功能

  7. 生物标记挖掘

同时我们还分享整套最新中文教程的PPT,方便大家学习、记录笔记和提取有用的素材。

想要获得整套课程PPT的小伙伴,只需分享本文至朋友圈,截图发送到公众号后台,即可获得下载链接。


课程视频原始链接:https://www.youtube.com/watch?v=s_MnbWohcBM&feature=youtu.be

理论7节,包括基础知识、扩增子、宏基因组、宏转录组和差异分析。

在本课程结束后,你要学会以上内容。




培养组学,如 法国马赛的Didier Raoult团队, 美国华盛大学(密苏里圣路易斯)Jeffrey I. Gordon, 国内军科院的杨瑞馥团队。
宏基因组热点,表观遗传也是热点,两者结合会有无限的宝藏。纽约西奈山医学院的房刚老师做这方面,两个NB,中山大学骆观证在6mA的研究也发表过Cell。
细菌特有的6mA可区分株,质粒的来源。这面方易汉博陈老师m6A的研究曾经发表在22分干细胞杂志封面,





人类肠道参考基因集是华大的作品,一作覃俊杰目前是谱元基因创始人,新三板上市公司。要注意肠道细菌细胞数量与人体相近。



弗雷德里克·桑格( 1918年8月13日-2013年11月19日),是一位英国生物化学家,曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。
Staden Package最早的序列分析工具箱。至今仍可用。
生于菲利宾,生信学家,创立了数据库和查询标准,创立了氨基酸字母缩写。极大的降低了数据存储量。
Margaret Dayhoff :计算生物学,建蛋白和核酸数据库标准,单字母缩写AA即它发明。


为什么我要提T4,PhiX噬菌体。它有什么应用?提示,在测序中的作用,尤其是扩增子领域。增加序列的多样性,保证序列的质量和产出。如Hiseq2500产出80G,需要混入25-33%的PhiX再测序。


终于有网络了,建立了数据库查询系统。
Walker, T.A. and N.R. Pace. (1983). 5.8S ribosomal RNA. Cell 33:320-322.
Stahl, D.A., D.J. Lane, G.J. Olsen, and N.R. Pace. (1984). The analysis of hydrothermal vent-associated symbionts by ribosomal RNA sequences. Science 224:409-411.发表了几十篇CNS,和JBC,己发表文章267篇。
当年测个序,建个树发CNS,但没有现有的数据和设备,应该比现在发CNS还要难。当年JBC和CNS区别并不大,结果现在变成了一个是千青+博导;另一个是博士是否可以毕业的差别。

毛细管电泳测序已经自动化,91年施密特完成了16S的克隆和测序;95年流感嗜血杆菌测序完成;98年乔·汉德尔斯曼是提出宏基因组概念,耶鲁大学分子学生物学和发育生物学教授,研究土壤中的微生物和昆虫的肠道。但从90年代早期开始,她同时投身于推动女性和少数群体参与科学的运动。Illumina成立,

综合90s年代定义为基因组元年,细菌基因组,也提出了宏基因组的概念。并致力于测序技术研究。

1999年提出了自动分析ITS来研究微生物多样性的方法 Automated approach for ribosomal intergenic spacer analysis of microbial diversity and its application to freshwater bacterial communities


以色列技术研究所的Oded Béjà,在海洋宏基因组中发现视紫质基因;EM,nature X 2
2001年出现Microbiome这个词,2011年Microbiome杂志成立。办成了一个连续3年9分的杂志,近期南土所褚老师发表了一篇;
加州大学,伯克利分校的环境科学政治管理部的Jill Banfield最早的宏基因组、宏转录组和宏蛋折组的研究
Pat Schloss 扩增子分析软件3巨头之一,帕特 施洛斯(n. (德)城堡;宫殿),Mothur作者(DOTUR定义OTU和SONS比较): University of Michigan in the Department of Microbiology & Immunology. http://www.schlosslab.org/papers/ ,发表论文90篇,共享PDF原文,投稿预印本、Github源代码、数据SRA链接(PRJ项目主页),以及Google Scholar页统计引用,2013年起分享代码近40篇文章。https://github.com/SchlossLab/Kozich_MiSeqSOP_AEM_2013


Jessica Green
照片来在其Ted演讲,俄勒冈州立大学, http://pages.uoregon.edu/green/ ,2012年ISME发表建筑环境中微生物,2014年手机个性微生物,教室微生物组,微生物组影响因素;有比较著名的Ted演示,我们被微生物包围,设计环境微生物组。Rob Knight原科罗拉多大学,现在加州圣地亚哥,https://knightlab.ucsd.edu/ ,详见最新综述,Nature综述:大佬手把手教你分析菌群数据





RNA无法确定物种组成相对比例 ,谁知道为什么?休眠的菌不表达或极少;不同菌丰度差异,同种菌不同个体差异,无法定量物种。



https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-016-0976-y ,metadata数据,生态数据同行不公开的较多,不清楚。PacBio有10%的错误率,不仅有测错,还可能有插入、缺失等。而Illumia平均千分之一,主要是置换错误,一般长度准确。
嵌合体与底物DNA量,PCR循环数等有关。


比对至 reference base,但不同引物差异极大,可比性不强。引物评估
同一条件即可。不同条件方法,DNA提取,保存方式等,可能造成假阳性



Human urge to classify


large-scale community-based critical assessment of protein function annotation  难定义覆盖度、准确度的界限



Silva是目前更新最快,最全的数据库,有很多小工具如引物评估;
Greengenes是目前使用最广泛,唯一支持全面功能注释的数据库。



国外还是离我们很遥远,网速很慢,网页都半天打不开,不太好用。


国外还是离我们很遥远,网速很慢,网页都半天打不开,不太好用。芝加哥阿贡实验室建立。优点是参考数据库齐全。

  • RefSeq - protein database, type organism, function, feature

  • GenBank - protein database, type organism, function, feature

  • IMG - protein database, type organism, function, feature

  • SEED - protein database, type organism, function, feature

  • TrEMBL - protein database, type organism, function, feature

  • SwissProt - protein database, type organism, function, feature

  • PATRIC - protein database, type organism, function, feature

  • KEGG - protein database, type organism, function, feature

  • eggNOG - protein database, type organism, function, feature

  • RDP - RNA database, type organism, function, feature

  • Greengenes - RNA database, type organism, function, feature

  • LSU - RNA database, type organism, function, feature

  • SSU - RNA database, type organism, function, feature

  • ITS - RNA database, type organism, function, feature

  • Subsystems - ontology database, type ontology only

  • NOG - ontology database, type ontology only

  • COG - ontology database, type ontology only

  • KO - ontology database, type ontology only


主要有人体各部分的16S和宏基因组数据,人体菌群地图;iHMP,关于功能,主要包括怀孕与早产,炎性肠病IBD,2型糖尿病,


通路数据库;抗生素抗药性数据库,整合蛋白数据库,


猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外2000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存