基因组的退化
点击上方“高科技与产业化”可以订阅哦
文 /唐元华
基因组——生命的程序
人类基因组项目从1990年10月开始到2003年4月结束,测序了一个人的基因组。这个项目动用了美国、英国、日本、法国、德国和中国的近万名科研人员。有多达20多个研究所参与,直接花费约30亿美元。该项目与“原子弹计划”和“人类登月计划”并称为人类的三大工程项目。但我认为它的意义甚至超越前两个项目,因为人类可以不要原子弹,也可以不上月球,但我们的基因组却是每个人都有的。“人类基因组项目”关乎到我们每一个人的生命,与我们所有人都息息相关。
生命的本质是一个由程序控制的物理和化学过程。基因组就是这个程序,它掌管着地球上的一切生命,从细菌到人类。简单来说,生命就是一个程序在时间与空间两个维度上的展开。这个程序的内容就是基因组,也就是 DNA序列。基因组是由4 个字母写成的长序列,adenine, cytosine, guanine, thymine,简称 A、C、G、T。 如同所有的计算机语言都是由0、1两个字符写成的一维序列,所有的生命程序都是由ATGC 四个字母写成的序列。这个信息是一维的,不是二维的,更不是三维的。这是一个特别的语言,它拥有自己的语法、句式、和规则。
退化论基本观点
物种的基因组在不断改变。每次复制过程都会引入一定数量的变异。这一代到下一代的变异频率由 DNA修复机制中的蛋白组的效率确定,但它不是0。对高度复杂的系统,随机变异绝大多数是有害的。每个人的基因组中都遍布这些有害变异。退化包括两个方面:种群的退化,是人类的胚系基因组随其在地球上的繁衍代数的积累不断出现和散布各种变异;个体的退化,是个体的基因组随其在地球上的生活年代也会不断出现和散布各种变异。
逐渐退化的物种有可能会毁灭,也有可能稳定到一种形式,这个形式可较长期地生存。基因组继续地退化,对其种群存在危害不是太大,虽然其平均生存周期与原始的物种不能相比。
基因组群体退化下的人类现状
自第一对人在地球上出现之日起,退化的宿命便悄然开启。我们每一次繁衍都引进了新的随机突变。它或“好”或“坏” 地改变了基因组(“好”和“坏”从对于环境适应的角度来说的)。如果就源代码来说,任何突变都或多或少破坏了原始的基因组。生殖细胞的每一次分裂都引起新的随机突变。我们的生殖基因组就如同一份被不断复制的原声版CD,经过几千次复制后,每个人拿到的版本都充满了错误。当然,错误太大的复制品没有遗传下来的可能(比如胎儿的流产以及儿童的早夭)。现在的基因组充满了各种有害变异,绝大多数不能让人立即致命,但会让人的生命周期大大缩短,并让人晚年生活饱受折磨。部分突变作为恶性突变(例如CFTR突变、Huntington突变、BRCA1/2突变),虽没在生命繁殖初始结束生命体,但会让人在壮年时饱受痛苦。
基因组退化下的个体现状
从胚胎受孕那刻开始,他(她)的个体程序就已注定是一个充满错误的程序。他(她)身上大约有300万个变异,其中至少有1000个会引起功能变化,这是基于我们目前的认知而言的。未来,随着我们对基因组认知的增加,这个有害变异的数目会不断地增加。
我们身体上体细胞的每一次分裂,都会引起新的随机突变。这些突变或多或少更进一步破坏了父母给予的基因组。还是以上的CD复制机制来说明,复制早期产生的错误会在后期的子细胞群体里面共同携带。当然,错误太大的细胞,通过程序性自杀(apoptosis)已自杀成仁了。我们出生后,生殖细胞又经历了几十次复制。所以我们的基因组在几百万个变异之上又积累了几千乃至数万个变异。这个变异数目的差异是因为DNA 复制与修复机器的变异。一旦这些基因产生变异,细胞每次分离产生的变异数目就不是100个而是几千,几万个。所以,DNA复制与修复机器的变异是产生癌症的原始动力。它们会大大加速基因组退化。
真的有“进化论”吗?
在人类的种群层次上,从人类产生以来是没有进化的,有的只是退化。在个体的层次上,进化更加不可能。我们经常听说哪个家庭生下了畸形的孩子,但从来没听说哪个家庭生下一个超人,他或者会飞或者长出羽毛。因为这不可能。如果连染色体的数目都不对,比如唐氏综合症儿童, 那他就更是基因组退化的见证。我们的体细胞染色体(somatic chromosome)只能是一对,不可以是一个,也不可以是三个,否则就是退化也就是遗传疾病。这种染色体层次的变异只会导致多种功能的破坏,而不是人类的进化。
人类基因组的退化
如果基因突变不发生,那物种间的同伴将会没有区别。所以简单的适应性的变化是生命的程序所允许的。程序中设计了这些微调区域,有时候是有意识地将可塑性写在基因组之中。比较典型的可调整区域就是新抗体的产生。新的抗体是随着外界环境的变化而不断调整的。这种可调性就是写在基因组之中的。这些基因组的可调性导致的个体多样性,不是进化,而是系统设计在内的微调功能。另一个典型的多态系统是HLA基因。但我们目前不清楚它在种群内存在的功能。
人类所有遗传疾病都是由基因组的退化引起的,这些疾病大约有6千多种。而且新的疾病还在不断地被发现之中。亨廷顿综合症(又称舞蹈症)就是人类基因组退化的很好例证。亨廷顿基因能够指导机体合成相应亨廷顿蛋白。这个蛋白的具体功能至今还不清楚,但它对于神经细胞的健康非常重要。亨廷顿基因中存在一段重复的部分,这部分被称为三碱基重复(CAG重复)。在基因复制过程中,这段重复序列可能引起基因长度的改变。一系列CAG密码子会导致谷氨酰胺(glutamine, Q)长链的生成(poly Q)。当poly Q区域超过特定的临界值(大约30个),这个蛋白的功能就开始逐渐丢失,从而导致疾病症状显现。但是为什么是3个字母的重复,而不是2个或者4个?其实这些变异也是有可能产生的,但它们没有被遗传的可能性。它们会导致流产,因而不能够在人群中流传。
遗传疾病中有一个概念叫奠基者效应,就是在人群中的某一个变异最初都来自于一个人。 南非区域的白人许多源于1652年着陆的一艘移民船只。这艘船上有一个携带亨廷顿基因缺陷的荷兰人。 现在南非白人患上亨廷顿病的大部分人都能追溯到这个个体。不同国家的亨廷顿病发病率差别很大。由奠基者效应导致的亨廷顿舞蹈症分布情况如下:委内瑞拉的马拉开波湖区域每10万人中有700人;南非海岸边的毛里求斯岛屿每10万人中有46人;塔斯马尼亚岛每10万人中有17.4人。在大部分欧洲国家,这种疾病的流行性范围为1.63~9.95/10万人。在亚洲,亨廷顿舞蹈病的发病率只有0.1/10万人。
人类的常见基因缺陷
表1给出人类最常见的退化基因。这些基因中的突变属于两大类,一个是“获得停止”(stopgain), 一个是 “移码” (frameshift)。这两类变异的共同特征是导致蛋白编码的截断。所以这些变异导致了蛋白质的截断,生产出来的蛋白不完整,不能正常工作。表1中有三个跟嗅觉相关的基因。说明我们很多人的嗅觉有缺陷。当然,这也不是什么大的缺陷。
从表1中我们能够看到,人类的基因组总体上是退化的。有很多的基因,在各个种族中,都有很高的变异频率。同时,各个种族又有自己独特的一些变异。
其它重大疾病的遗传因素
除了癌症,我们在老年的时候会受到许多疾病威胁,包括心血管疾病、肿瘤、脑血管疾病、神经类疾病、消化道疾病和分泌系统疾病等。这些疾病都与个人的基因变异相关。表3列出了一些典型的、常见的基因变异,它们所导致的疾病类型,以及他们在世界人口(ExAC_All)和华人人口(FD_Exome)中的发生频率。可以这样说,人群中没有哪一个人是完美的。绝大多数人都包含明显遗传缺陷,这些缺陷会在进入老年的时候给我们带来许多疾病。
关于长寿基因,其实,并不存在什么特别的长寿基因。一个人如果比较幸运,没有继承导致重大疾病的变异,就可以更加长寿。比如,他如果没有心血管疾病的风险,那他的体质就会相对健康;他如果没有导致阿滋海默以及帕金森症的基因变异,那他就有可能在80岁的时候,还保持健康的头脑和敏捷的行动。
作者单位:首度基因
更多版权声明:
本微信公众号所发表之文字、图片等,版权归《高科技与产业化》编辑部所有。授权合作请联系hitech@mail.las.ac.cn
内容请订阅《高科技与产业化》杂志
地址:北京市海淀区中关村北四环西路33号(100190)
电话:010-82627674
传真:010-86267674
邮箱:hitech@mail.las.ac.cn
网址:
全年12期,58元/期,全年订价696元
邮发代号:82-741
刊号:ISSN1006-222X CN11-3556/N