查看原文
其他

基因组学基础知识大汇总 | DNA大类专题

实验中心-LXM 联川生物 2024-03-27

1. 基因

带有遗传信息的DNA片段称为基因,是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。组成简单生命最少要265到350个基因。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性)。其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传信息的表现。


 

2. 基因组

基因组一词系由德国汉堡大学H.Winkles教授于1920年首创。最初是由GENs和chromosOME组成为“genome”,用于表示生物的全部基因和染色体组成的概念,是指生物的整套染色体所含有的全部DNA序列。现在一般认为,基因组即指生物所具有的携带遗传信息的遗传物质的总和,包括所有的基因和基因间区域。基因组的结构主要指核酸分子中不同的基因功能区域各自的分布和排列情况,其功能是储存及表达遗传信息。不同种类生物储存的遗传信息量迥异,其基因组的结构和组织形式也不同。


  • 真核生物基因组

核基因组:细胞核内所有遗传物质的总和;线粒体基因组:线粒体携带遗传物质的总和;

叶绿体基因组:叶绿体携带遗传物质的总和。真核基因组由一条或多条线性DNA染色体组成。除了细胞核中的染色体外,真核生物的细胞器如叶绿体和线粒体都有自己的DNA和染色体,因此,也有“线粒体基因组”和“质体基因组”的说法。与它们来源的细菌一样,线粒体和叶绿体都含有环状染色体。与原核生物不同,真核生物具有蛋白质编码基因的外显子 -内含子组织和一定数量的重复DNA。

  • 原核生物基因组

染色体:原核细胞内主要的遗传物质;

质粒:是独立于细菌染色体的自主复制的环状双链DNA分子。能稳定地独立存在于染色体外,并传递到子代,一般不整合到宿主染色体上,通常编码毒素和耐药性等相关基因。原核生物和真核生物基因组由DNA组成。

  • 病毒基因组

病毒颗粒携带的遗传物质

  • 基因组学

所谓基因组学就是对所有基因进行作图(包括遗传图谱、物理图谱、转录图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。简而言之,就是在基因组水平上研究基因结构和功能的科学。基因组学研究的内容包括基因的结构、组成、存在方式、表达调控模式、基因的功能及相互作用等,是研究与解读生物基因组所蕴藏的生物全部性状的所有遗传信息的一门新的前沿科学。1986年美国科学家Thomas Roderick首次提出了基因组学的概念,但随着1990年人类基因组计划启动才开始真正有系统地研究基因组、解码生命,并由“后基因组计划“的实施推动其发展。


3. 基因组学历程

基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响  。基因组学还包括基因组测序和分析,通过使用高通量DNA测序和生物信息学来组装和分析整个基因组的功能和结构。基因组学同时也研究基因组内的一些现象如上位性(一个基因对另一个基因的影响)、多效性(一个基因影响多个性状)、杂种优势(杂交活力)以及基因组内基因座和等位基因之间的相互作用等。基因组学的进步引发了以发现为基础的研究和系统生物学领域的一场革命,促进了对大脑等最复杂生物系统的理解 。基因组学与转录组学、蛋白组学和代谢组学一起构成了系统生物学的组学(omics)基础 。


  • 1865年孟德尔发表豌豆杂交实验结果,提出了遗传学的两大遗传规律:分离定律、自由组合定律,并提出了“遗传因子”学说。



  • 1915年美国生物学家摩尔根创立了现代遗传学的基因学说 。

  • 1944年美国细菌学家艾弗里首次证明DNA是遗传信息的载体。

 


  • 1953年美国生物学家沃森、英国生物物理学家克里克建立 了DNA的双螺旋结构模型,并提出了DNA的复制机制,生物学研究从此进入了分子生物学时代。

 


  • 1958年克里克最初提出中心法则:DNA→RNA→蛋白质。它说明遗传信息在不同的大分子之间的转移都是单向的,不可逆的,只能从DNA到RNA(转录),从RNA到蛋白质(翻译)。

  • 1971年美国病毒学家特明、美国病毒学家巴尔的摩发现 了“逆转录酶”,揭示了生物遗传中存在着由RNA形成DNA   的过程,发展和完善了“中心法则”。

 


  • 1983年美国生物化学家穆利斯发明利用“聚合酶链反应法 ”(PCR)。

 


  • 1990年“人类基因组计划”正式启动,生物学研究进入基因组学时代。

  •  2000年中、美、日、德、法、英6国科学家联合宣布成功 绘制出人类基因组草图。

 


  • 2001年以后,随着功能基因组学、蛋白质组学的兴起,生物学研究进入后基因组学代。


4. 基因组学分类
功能基因组学

功能基因组学是分子生物学的一个领域,它试图利用基因组项目(如基因组测序项目)产生的大量数据来描述基因(和蛋白质)的功能和相互作用 。功能基因组学侧重于基因转录、翻译和蛋白质-蛋白质相互作用的动态变化,与基因组提供的DNA序列或结构等静态信息截然相反。功能基因组学试图从基因、RNA转录本和蛋白质产品三个水平上回答有关DNA功能的问题。功能基因组学研究的一个关键特征是它们对这些问题的全基因组方法,通常涉及高通量方法,而不是传统的“个案基因”方法。

基因组学的一个主要分支仍然关注于对各种生物体基因组的测序,但全基因组的知识为功能基因组学关注各种条件下基因表达的模式创造了可能。涉及到的最重要的工具是芯片技术和生物信息学 。

 


结构基因组学

结构基因组学试图描述由给定基因组编码的每个蛋白质的三维结构 。这种基于基因组的方法允许通过实验和建模相结合方法高通量进行蛋白结构鉴定。结构基因组学与传统结构预测的主要区别在于,结构基因组学试图确定基因组编码的每一种蛋白质的结构,而不是专注于一种特定的蛋白质。随着全基因组序列的公开,通过实验和建模相结合的方法可以更快完成蛋白质结构预测,特别是由于大量测序基因组和以前解析蛋白质结构的公开,使得科学家可以根据已有同源物的结构对蛋白质结构进行建模。

结构基因组学涉及到大量的结构鉴定方法,包括利用基因组序列的试验方法、基于已知同源蛋白质的序列或结构同源性基础上的建模方法、或基于没有任何已知结构同源性蛋白质的化学和物理特性的建模方法。与传统的结构生物学相反,结构基因组学来确定的蛋白质结构常常(但并不总是)先于对其功能的了解。这对结构生物信息学提出了新的挑战,比如要从蛋白质的三维结构中确定其功能 。

 


表观基因组学

表观基因组学是研究表观基因组,即生物体中所有表观修饰的遗传物质的学科 。表观遗传修饰是对细胞DNA或组蛋白的可逆修饰,在不改变DNA序列的情况下影响基因表达。两个最具特征的表观遗传修饰是DNA甲基化和组蛋白修饰。表观遗传修饰在基因表达和调控中起着重要作用,并参与许多细胞过程,如分化/发育和肿瘤发生。直到最近,通过基因组高通量分析,才可能在全基因组范围研究表观遗传学 。

 


宏基因组学

宏基因组学是研究直接从环境样品中提取的遗传物质的元基因组的学科 。宏基因组学也称为环境基因组学、生态基因组学或群落基因组学。传统的微生物学和微生物基因组测序依赖于培养的克隆培养物,而早期的环境基因测序克隆了特定的基因(通常是16S rRNA基因),从而获得自然群体的多样性。这些工作表明,绝大多数微生物的多样性被基于菌落培养的方法所遗漏。宏基因组使用“散弹枪”测序或大规模平行焦磷酸测序,可以无偏好地获得样本群体中所有微生物成员的基因信息。由于宏基因组学能够揭示此前被隐藏的微生物多样性,它为观察微生物世界提供了一个强有力的工具,其结果有可能彻底改变对整个生命世界的认知  。

 


5.基因组学应用

随着各项技术的发展,基因组学的研究手段也日趋多元化,以测序为主的基因组学研究的开展越来越普遍,其应用在人类社会发展的各个领域,动植物育种、群体遗传进化研究、遗传图谱、核心种质资源基因组遗传多样性研究以及快速准确检测突变位点研究等方面。

1. 群体遗传进化研究

在物种基因组已知的情况下,对种内群体不同个体进行基因组重测序,可以在全基因组水平上发现群体内个体之间的差异,基于群体变异信息可以研究群体的遗传结构、基因交流情况、物种形成机制以及群体进化动态等生物学问题。此外,利用全基因组重测序有助于快速发现与动植物重要性状相关的遗传变异,缩短育种周期

2. 农作物培育

科学家们在利用基因工程技术改良农作物方面已取得重大进展,基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在开发可以生产出能够防病的疫苗和食品的农作物。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法,需要七、八年时间才能培育出一个新的植物品种,基因工程技术使研究人员可以将任何一种基因注入到一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。

3. 构建遗传图谱

在过去的20多年,大量的科研工作聚焦于通过数量性状位点( quantitative trait loci,QTL)分析,探索不同农作物复杂农艺性状(如产量)的遗传基础。然而,几乎所有研究都基于低通量的分子标记(如RFLP和SSR)所构建的连锁遗传图谱,这些图谱大都因分子标记密度较低而不能提供准确和完整的控制性状QTL的数目和座位信息。新一代测序技术的应用带来基因组序列数据的大幅增长,为更有效进行基因作图和全基因组范围的基因分型策略提供了机遇,并可在此基础上构建出超高密度的遗传图谱。

4. 核心种质资源基因组遗传多样性研

核心种质是种质资源的核心子集,它们最大限度地保存了整个资源群体的遗传多样性,同时代表了整个群体的地理分布。对核心种质资源进行重测序,可以深入了解其基因遗传多样性,同时对于促进种质交流、利用和管理具有重要的学术和实用意义。该研究已成为动植物分子遗传育种重要组成部分。

5. GWAS研究

全基因组关联分析(genome-wide association study,GWAS)由 Risch等于1996年首先提出,可以在全基因水平上对复杂性状的遗传变异进行关联分析。该技术不仅在人类医学研究中被广泛应用,同时也已成为动植物分子遗传育种研究的有效方法。随着测序技术的飞速发展,基于全基因组重测序的GWAS研究成果也逐年增加。世界上最大的医学研究团体 Wellcome Trust下属病例对照协会( WellcomeTrust Case. Control Consortium WTCCC)对约1400个患病人群和约3000个正常人群进行了联合GWAS研究,通过病例对照比较检测到24个位点与6种疾病关联。由于第一次采用具有较好基因组覆盖度的SNP芯片对人类复杂性状进行GWAS研究,Visscher等将此作为人类复杂性状的GWAS研究的开端。随后GWAS研究已经涉及身高、体质、糖尿病、精神分裂症和血压等超过500个复杂疾病关联的6000多个变异位点被发现。目前,对作物如水稻、玉米、大豆等均进行了一系列大规模资源群体重测序及其GWAS分析,这些研究获得了大量与重要农艺性状关联的SNP位点或受到强烈选择的位点,这些位点均是全基因组选择育种等的重要分子辅助信息。

6. 快速准确检测突变位点

正向遗传突变、适应进化和表型筛选是创制理想性状新变异有机体的有力工具和途径,而这些突变往往不能轻易地用传统遗传学技术鉴定出来。新一代高通量大规模测序技术在拥有参考基因组的情况下,可以快速和准确地得到这一突变体的基因组信息,进而鉴定突变位点

7. 外显子组和目标区域测序

外显子组( exome)是一个物种基因组中全部外显子区域的总和,它是蛋白质编码基因行使其功能最直接的序列数据集。通过高通量测序技术进行外显子组测序,能够直接发现与蛋白质功能变异相关的遗传突变。目标区域深度测序是指对感兴趣的特定基因组区域进行捕获和高通量测序(外显子组测序也属于目标区域测序的一种类型)。可以将感兴趣的基因组区域定制成特异性的探针,通过这些特异性探针与基因组DNA进行杂交,富集基因组目标片断,最后将捕获到的基因组DNA进行高通量测序。相比于全基因组重测序,外显子组或目标区域测序更加经济和高效,能够检测到全基因组测序错过的小变异。目前,在医学基因组学研究领域,外显子组和目标区域测序技术已经应用到寻找人类各种疾病相关的致病基因和易感基因研究,而且在动植物研究中已有报道。

8. 基因工程药物

基因工程药物,是重组DNA的表达产物。基因工程药物研究的开发重点是从蛋白质类药物,如胰岛素、人生长激素、促红细胞生成素等的分子蛋白质,转移到寻找较小分子蛋白质药物。这是因为蛋白质的分子一般都比较大,不容易穿过细胞膜,因而影响其药理作用的发挥,而小分子药物在这方面就具有明显的优越性。另一方面对疾病的治疗思路也开阔了,从单纯的用药发展到用基因工程技术或基因本身作为治疗手段。


相关阅读高分文章中都在用的找核心基因的神器—WGCNA你确定不了解下吗?
人全基因组重测序和全外显子测序的比较
常规分析找不到差异基因?GSEA分析了解一下



点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存