查看原文
其他

组学专题-基因组学

梅零落 生信菜鸟团 2020-02-03

组学

基因、基因组及基因组学的基本概念

基因组学的分支

基因组测序项目

研究基因组学的意义

组学

研究细胞、组织或是整个生物体内某种分子(DNA、RNA、蛋白质、代谢物或其他分子)的所有组成内容,称之为“组学”(-omics),"-omics"术语代表了对怎样思考生物学和生物体系工作方式的重新定位。组学研究包括对基因组及基因产物(转录子组和蛋白质组)的系统生物学研究,随后必然要上升到细胞机制、分子机制和系统生物学的水平。由于基因组的信息是用来发现和解释具有普遍意义的生命现象和它们的变化、内在规律和相互关系,因此,学科的交叉合作就成为必然,同时基因组的复杂性必然导致多学科的引进和介入,例如,各种生物学科、医学、药学、计算机科学、化学、数学、物理学、电子工程学、考古学和地质学等。

基因、基因组及基因组学的基本概念

基因

基因是1909年丹麦植物学家W.Johannsen根据希腊文单词genos(birth,给予生命)创造的。现代分子生物学的基因概念通常认为是:基因是储存和表达某一多肽链信息或RNA分子信息所必需的全部核苷酸序列,是生物体传递和表达遗传信息的基本单位。

基因组

基因组一词系由德国汉堡大学H.Winkles教授于1920年首创。最初是由GENs和chromosOME组成为“genome”,用于表示生物的全部基因和染色体组成的概念,是指生物的整套染色体所含有的全部DNA序列。现在一般认为,基因组即指生物所具有的携带遗传信息的遗传物质的总和,包括所有的基因和基因间区域。基因组的结构主要指核酸分子中不同的基因功能区域各自的分布和排列情况,其功能是储存及表达遗传信息。不同种类生物储存的遗传信息量迥异,其基因组的结构和组织形式也不同。

  • 真核生物基因组

    • 核基因组:细胞核内所有遗传物质的总和;

    • 线粒体基因组:线粒体携带遗传物质的总和;

    • 叶绿体基因组:叶绿体携带遗传物质的总和。

  • 原核生物基因组

    • 染色体:原核细胞内主要的遗传物质;

    • 质粒:是独立于细菌染色体的自主复制的环状双链DNA分子。能稳定地独立存在于染色体外,并传递到子代,一般不整合到宿主染色体上,通常编码毒素和耐药性等相关基因。

  • 病毒基因组

    • 病毒颗粒携带的遗传物质

基因组学

所谓基因组学就是对所有基因进行作图(包括遗传图谱、物理图谱、转录图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学,简而言之,就是在基因组水平上研究基因结构和功能的科学。基因组学研究的内容包括基因的结构、组成、存在方式、表达调控模式、基因的功能及相互作用等,是研究与解读生物基因组所蕴藏的生物全部性状的所有遗传信息的一门新的前沿科学。1986年美国科学家Thomas Roderick首次提出了基因组学的概念,但随着1990年人类基因组计划启动才开始真正有系统地研究基因组、解码生命,并由“后基因组计划“的实施推动其发展。

基因组学的分支

根据基因组学的定义,基因组学包括结构基因组学、功能基因组学和比较基因组学。

1.结构基因组学

通过基因组作图、核苷酸序列分析,研究基因组结构,确定基因组成、基因定位的科学。

  • 基因组测序

    目前DNA测序每次反应仅能读取不到1000bp的长度。已知最小的细菌基因组为580 000bp。人类基因组为30亿bp。因此,首先将整个基因组的DNA分解为一些小片段,然后将这些分散的小片段逐个测序,最后将测序的小片段按序列组装。

  • 基因组作图

    在长链DNA分子的不同位置寻找特征性的分子标记,绘制基因组图。根据分子标记可以准确无误地将已测序的DNA小片段锚定到染色体的位置上。

2.功能基因组学

利用结构基因组学提供的信息和产物,在基因组系统水平上全面分析研究基因功能的科学。

  • 进一步识别基因以及基因转录调控信息;

  • 弄清所有基因产物的功能,这是目前基因组功能分析的主要层次;

  • 研究基因的表达调控机制,研究基因在生物体发育过程以及代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图。

3.比较基因组学

比较研究不同生物、不同物种之间在基因组结构和功能方面的亲缘关系及其内在联系的学科。

  • 通过研究不同生物、不同物种基因组结构和功能上的相似及差异,可以勾画出一张详尽的系统进化树,而且还将显示进化过程中最主要的变化所发生的时间及特点。据此可以追踪物种的起源和分支路径;

  • 可以分析了解同源基因的功能;

  • 通过对序列差异性的研究有助于认识大自然生物多样性的产生基础。

基因组测序项目

基因组制图

对于真核生物,可以考虑以染色体为单位把基因组简单地、自然地分成几个部分。因为染色体是由一条双链DNA分子构成的,所以染色体代表了基因组制图的第一个层次。通过对人类染色体的吉姆萨(Giemsa)染色可以重复性地获得约500条不同的条带。这些带型图谱可以被用来绘制每一条染色体的细胞学图谱(cytological map)并且提供了一种低分辨率的机制来区别染色体的不同部分。通过核型分析可以发现某些可以导致遗传病的染色体异常,其中染色体多拷贝就容易被发现,如唐氏(Down)综合征就是由21号染色体整个或部分染色体三体造成的,Klinefelter`s综合征患者带有三条性染色体(XXY)。

遗传图谱

遗传学图谱表示的是两个DNA元件之间的距离,是根据两者间发生重组的频率而定的。染色体的第一张遗传学图谱是由Alfred Sturtevant用Thomas Morgan(Morgan,1910)收集的果蝇杂交的数据建立的。Sturtevant在减数分裂中选用的是特别容易观察的表型以区别于其他基因(通过重组事件)。试验获得的信息可以用于确定基因间的位置-紧密连锁的基因物理学上的位置也很近,而这些连锁很弱的基因在物理学上的位置距离很远Sturtevant建立了一个果蝇的X染色体上六个基因位置的遗传学图谱(Sturtevant,1913)。通过类似的技术,很多物种的很多表型明显的基因都绘制了遗传学图谱。

物理图谱

基因组的物理学图谱是由直接分析基因组DNA序列得到的遗传标记(genetic markers)组成的图谱,而不是通过分析重组事件得到的。通过遗传学图谱,可以建立基因组中每个染色体的物理学图谱。此外,在缺乏完整的序列信息的情况下许多不同的技术已经被用于建立物理学图谱。

  • 限制性图谱restriction map):对基因组DNA或分离出的染色体进行限制性酶切能产生大量的片段,这些片段在琼脂糖凝胶电泳后成为连续的一片,而不是分离的条带。但是,某些限制酶,如NotⅠ,有一个比较长的识别序列,它很少能在人类的DNA序列中找到。即使使用像NotⅠ这样切点稀少的限制性内切酶,像这些为小DNA片段而绘制的基因组限制性酶切图谱,还是非常困难的。限制性图谱虽然提供了高度可信的片段的顺序和对距离的估计,但是只完成了少数人类染色体。

  • 辐射杂交图谱radiation hybrid maps):辐射杂合系通常是指携带另一种物种(如人类)的相对较小的DNA片段的仓鼠细胞系。用X线照射人类的细胞将引起DNA内的随机断裂并产生片段。随着X线照射剂量的增加产生的片段大小减小。虽然所用的辐射水平足以杀死人类细胞,但是通过将辐射的细胞和仓鼠的细胞在体外融合,可以挽救断裂的染色体片段。

  • STS图谱:序列标记位点(sequence tagged site,STS)是一段DNA片段,长100-200bp,使由已知的DNA序列作为引物并通过PCR技术得到的。该序列可以与基因组中的相应序列杂交而“标记”其位点,STSs可以由以前克隆的基因或其他任意的非基因序列产生。已经克隆的进入基因文库的基因组DNA片段能够基于它们所含的STSs排序。

人类基因组计划

美国科学家于1985年率先提出人类基因组计划,1990年正式启动,美国、英国、法国、德国、日本和中国科学家都参与了这一预算达30亿美元的人类基因组计划。之后,2000年6月26日,六国科学家共同宣布,人类基因组草图的绘制工作已经完成。在这场规模宏大、影响世界的基因测序项目落幕后,全球内陆续又有不同国家竞相开展各自的基因组测序计划

寡核苷酸测序

1975年,Fred Sanger和Alan Coulson发明了一种直接的DNA测序方法。称为plus-minus法,这种方法由合成的放射性标记的寡核苷酸作为引物,利用DNA聚合酶合成一段可用电泳和放射自显影技术进行分析的DNA片段。这种技术曾被用来检测噬菌体Φ174基因组的全部共5386bp的序列。

基因组测序

尽管测序可以在基因组DNA上直接进行,但是通常是进行大规模操作的,因为进行测序反应需要合成大量的不同的寡核苷酸引物。因此,基因组DNA片段必须先克隆入载体,接着每个片段都可用自动测序法进行测序。接下来的问题是如何把各个载体中的小片段重构出原来的完整的基因组序列。这里简单提一下:

  • 克隆序列重叠群

  • 全基因组鸟枪测序

  • 分级鸟枪法

研究基因组学的意义

基因组学的研究以及涉及到生物学、医学、生物技术、制药工业、社会经济、生物进化、伦理、法律及社会等众多领域。尤其在人类疾病基因的研究方面,显现和发挥着十分重要的作用。

  • 单基因病疾病基因研究,如血友病等

    • 人类基因组计划使我们了解基因组序列;

    • 现在采用定位候选克隆方法,极大地提高了发现疾病基因的效率;

    • 定位候选克隆,通过遗传分析等方法将疾病基因定位到染色体区段上;

    • 对人类基因组图上该区段内的基因进行功能分析,并筛选出疾病基因,为这些疾病的基因诊断和基因治疗奠定了基础。

  • 多基因病疾病基因研究,如心脏病、糖尿病、癌症等

    • 比单基因病困难,是目前疾病基因的重点和难点;

    • 用比较基因表达谱的方法识别疾病状态下基因的激活或抑制。

  • 癌症基因组解剖学计划(cancer genome anatomy project,CGAP)

    • 1996年癌症基因组解剖计划开始;

    • 主要由美国癌症研究所(National Cancer Institute)


【文末福利】这里推荐一个关于基因组学的学习视频,点击以下链接或者点击阅读原文即可到达。

http://open.163.com/movie/2010/1/3/8/M6S8NS5PR_M6S8R9838.html(麻省理工学院的公开课)

参考文献

(1)《基因组学》 主编:宋方洲

(2)《基因与基因组分析》 著者:Richard J Reece

(3)基因谷:基因与人类基因组计划

还有更多文章,请移步公众号阅读

如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。

如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存