查看原文
其他

进化树专题(九)| 从DNA序列到分化时间——如何构建带分歧时间的进化树?

小林 凌恩生物 2023-06-15
关于带时间节点的系统发育树,先给大家看一个例子:分支带有物种的分化时间,并添加了分化时间的置信度范围(右图蓝色数字为分化时间)。图片引用自:Guo Longbiao#, Jie Qiu#, …, Lianyang Bai*, Longjiang Fan*. Echinochloa crus-galli genome analysis provides insight into its adaptation and invasiveness as a weed. Nature Communications, 2017.Haibin Xu#, Jingyuan Song# , ..., Xiaoquan Qi3,* and Shilin Chen*. Analysis of the Genome Sequence of the Medicinal Plant Salvia miltiorrhiza .Molecular Plant, 949-952, June 2016.

分化时间是当前宏观进化分析的一个热点,以某一个或某几个特定类群的化石时间作为参照,通过基因序列间的分歧程度以及分子钟来估计分支间的分歧时间,同时计算系统发育树上其它节点的发生时间,从而推断相关类群的起源和不同类群的分歧时间。

根据分子钟理论,基因序列中密码子随着时间的推移以几乎恒定的比例相互替换,即具有恒定的演化速率,两个物种之间的遗传距离将与物种的分化时间成正比。我们通常采用单拷贝基因家族中的四重简并位点来估算分子钟(替换速率)以及物种间的分化时间,密码子中的四重简并位点由于第三碱基不改变所编码的氨基酸,属于中性进化,其中中性替换速率一般用每个位点每年的变异数来衡量。

利用贝叶斯统计或其他方法估计物种分歧时间的程序很多,如R8S、MCMCTREE、MULTIDIVTIME、BEAST等,通过不同的策略将化石时间信息整合到一个系统发育树中,从而计算得到Divergence time Tree。

下面我们对构建Divergence time Tree的方法和步骤做一个简述:

01构建系统发育树

利用单拷贝基因的CDS或PEP序列构建系统发育树,推荐PhyML或Mrbayes 。因为ML树和贝叶斯进化树对核苷酸 / 氨基酸替代模型的选择非常敏感,故在进行进化树或分化时间构建之前,需对核苷酸 / 氨基酸替代模型进行选择(进化树专题(四)| 进化模型选择的那些事儿 )。

构建获得 newick格式的进化树,如下例子:



02获得fossil calibration time

那如何查两两物种间的化石分化时间?

通过网站http://www.timetree.org/ ,该网站根据多篇文献支持提供两两物种间的分化时间,并给出置信度范围,单位是Mya(million years ago)。另外一个可以查询分化时间的网站是https://fossilcalibrations.org/ ,可以互相参考。

在已经构建好的树中添加化石时间,主要形式是 '>0.22<6.75','>'后接分化时间的最小值,'<'后接最大值,如下实例:

当样本比较多时,要考虑不同距离的节点,只有一个节点估算的可能不准确,可以提供三到五个的节点(物种)的分化时间。



03分歧时间估计

这里主要介绍3种程序:


1. 使用 r8s(https://sourceforge.net/projects/r8s/)估计分歧时间,速度很快,一般时间<10min

准备配置文件r8s.ctl:

运行程序:

 

2. 使用 multidivtime(https://brcwebportal.cos.ncsu.edu/thorne/multidivtime.html) 估计分歧时间,时间~5hours

-> 先利用PAML baseml估计分支的核苷酸频率、转换/颠换率等参数

 


-> 再利用paml2modelinf将baseml输出文件转换为estbranches输入文件

-> 利用estbranche对树分支长度进行最大似然率估计

输入文件是前一步的输出结果

-> 运行multidivtime进行分歧时间估计

利用前一步的输出,准备配置文件divtime.ctl,运行程序


3. 使用 PAML mcmctree(http://abacus.gene.ucl.ac.uk/software/paml.html) 估计分歧时间,强烈推荐,时间~20hours

准备配置文件 mcmctree.ctl

运行程序:



04结果展示

计算完成后,就获得了带分歧时间的进化树了~~

当然这只是最基本的例子,后续可以对进化树进行一系列美化操作。整个过程还需要自己操作一遍,毕竟实践出真知~~~


[参考资料]:

https://brcwebportal.cos.ncsu.edu/thorne/multidivtime.html

http://abacus.gene.ucl.ac.uk/divtimes/index.html

 

往期精彩


 

凌恩生物成立于2014年,专注组学技术在科研领域的应用与研究。公司成立以来,技术团队参与的项目成果成功发表在《Nature》《Cell》《PNAS》等国际顶端学术期刊。

秉承“以客户需求为本,为客户创造价值”的服务宗旨;以高品质、高效率的技术服务,用心打造凌恩品牌,助力您的成功

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存