查看原文
其他

祖源科普 | Y 染色体溯源

输出知识的 23魔方祖源 2020-10-14

为什么通过 Y 染色体溯源


人类有 23 对染色体,其中 22 对是常染色体,1 对是性染色体。22 对常染色体在遗传给下一代的时候会进行基因重组(Recombination)。这一重组就像我们把两副扑克牌放在一起洗,同样的 108 张牌又重新组成了两副新牌。


而这 22 对常染色体随着一代又一代的重组,携带的信息就逐渐消失了,就像牌洗了很多次后,已经完全看不出第一副牌的痕迹,即遗传多态性将祖先的信息完全湮灭了。



因此,基于重组的基因关系最多只能往上追踪 10 代,如果想要追踪更久远的祖先印记,就需要依靠最后一对染色体——性染色体。



通常情况下,男性的性染色体是 XY,女性是 XX。Y 染色体和 X 染色体是决定性别的染色体。而男性特有的 Y 染色体非常特别,它只剩下 21 个活跃基因,且只进行一项工作——制造男性。因此 Y 染色体是由男性祖先一代代遗传下来的,无论历经多少代,都不会因多态性消失,是名副其实的「祖传染色体」。


既然 Y 染色体是由男性代代相传的,那同样也可以通过它一直向上追溯祖先的印记。研究发现,全世界的男性通过 Y 染色体检测都可以放到一个 Y 染色体分化树上,共同追溯到同一个男性祖先。而构建起这棵 Y 染色体分化树的枝丫,就是 Y 染色体上的突变(Y-SNP)。




如何通过 Y 染色体溯源


虽然 Y 染色体在遗传的过程中没有发生重组,但是每一代传承过程中都可能产生一些「错误」,即单个位点的碱基被替换,这些「错误」就是突变。



突变位点的频率非常稳定,平均来说 3 代人就会产生一个突变,从这一特性上可以把它理解为分子时钟。简单来说,同一祖先在不同时期的两个后代,只要对比两人 Y 染色体的基因有多少个位置差异就可以算出两个人相差多少代。这个算法叫溯祖理论(Coalescent theory)。


下面我们举例说明一下这个神奇过程。假设有 A、B、C 三个人,他们 Y 染色体的基因代码分别如下:



如果我们要分析他们的共祖时间,需要进行以下步骤:


1. 先找到差异的基因位点。判断差异需要用 Y 染色体的参考基因确定,参考基因一般是古人 DNA 或黑猩猩等。如图所示,三人差异的基因位点分别命名为 S1、S2、S3、S4、S5,相同差异记入一个。



2. 将差异位点相似的分在一组。如图所示,B 和 C 的差异要小于 A 和 B、A和 C 的差异,可以判断出 B 和 C 应该有更近的共祖关系。



3. 根据分组的关系画出树形。 



通过现在人的基因数据,我们用最简单的办法恢复了基因的分化树。S3 位点代表了 B 和 C 的最近共同祖先,S5 位点代表了 A、B、C 的最近共同祖先,这些基因标志都是真实存在过的人。


B 距离 S3 只有 S2 一个位点变化,按照大概 3 代产生一个新的位点的规律,那么 B 和 C 的共同祖先应存在于 3 代之前。如果我们假设每 30 年产生一代人,那么他俩的共祖时间大约就是 90 年。


上面只是一个简单的示例,在实际计算中还需要考虑更多复杂的问题。


—END—





    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存