用在线RaxML构建系统发育树
前面有期内容给大家分享了一文读懂进化树,但如何构建一个专业且美观的进化树呢?相信有很多读者都会用MEGA软件进行系统发育树的构建,Mega是一款简单易用的系统发育分析软件,也被国内外期刊引用很多次,得到了大家的认可,但是有没有更为专业的系统发育树构建软件呢?今天将给大家介绍一种更为专业的建树方法用RaxML构建系统发育树。RAxML 是德国慕尼黑大学Dr. Stamatak 开发的一个系统发育树构建软件,它采用的是最大似然法进行系统发育树的构建,可以运行大规模的碱基序列的计算处理。
RAxML 有本地版本以及在线版本,本地版下载链接:https://sco.h-its.org/exelixis/web/software/raxml/index.html
本文将以在线的RAxML为例进行讲解:
测试数据及结果和相关处理软件已经上传至百度网盘:http://pan.baidu.com/s/1i5cPyXB 密码:b23t
注:所有红色字体部分的结果都是本文测试数据所展示的结果
构建进化树的方法常见有:
Distance methods (距离法)
UPGMA (unweighted pair group method with arithmetic means)
Fitch-Margoliash
Neighbor-joining
Discrete character methods (独立元素法)
Parsimony
Maximum likelihood
下面将一步一步教大家进行系统发育树的构建
首先要用在线的MAFFT进行Alignment
值得一题的是此软件也是发在MEB上的一篇神文,多个版本历史被引用几万次,MAFFT第7版于2013年发表已经引用破5000;主页 https://mafft.cbrc.jp/alignment/software/,在各种系统的版本,适合所有人可用。
在线版地址:https://mafft.cbrc.jp/alignment/server/index.html
上传fasta序列文件到文本框中(All_Lentitheciaceae_LSU_sequence.fasta)
UPPERCASE / lowercase: 选择 Same as input
Direction of nucleotide sequences: Help 选择 Adjust direction according to the first sequence (accurate enough for most cases)
Output order: 选择 Same as input
添写接收结果的邮箱,最后点击Submit
我们将邮件中的结果打开链接,选择fasta格式,复制新页面中内容粘贴至文本编辑器中另存为一个.fasta的文件(All_Lentitheciaceae_LSU_Aligned.fasta).
用Mesquite格式转换
这个软件 48 31683 48 15232 0 0 3093 0 0:00:10 0:00:04 0:00:06 3092压之后可以直接点击运行(文件己存些百度云链接中,需要Java环境支持)
File—open file—选Fasta(All_Lentitheciaceae_LSU_Aligned.fasta)—OK—输出 .nex的文件(All_ALIGNED.nex)
然后选File—export—Phylip(DNA/RNA)—OK—参数选择序列最长字母数—导出.phylip格式的文件(All_ALIGNED.phy)。
PHYLIP介绍
PHYLIP是一个包含了大约30个程序的软件集,基本囊括了系统发育分析的所有方面,而且是免费软件,如上面提到的DNADIST和PROTDIST。根据谷歌学术检索,该软件目前已经被引用了3万次(3个常用版本),非常强大。其处理DNA序列的软件和处理蛋白质序列的软件不同:用最大节约法构建进化树时,DNA序列采用DNADIST软件,蛋白质采用PROTPARS软件;用距离法构建树时,DNA采用DNADIST软件,蛋白质采用PROTDIST软件;用最大似然法构建树时,DNA采用DNAML、DNAMLK,蛋白质采用PROTML或PROTMLK软件。
在线进行系统发育树构建:
进入ATGC网站 http://www.atgc-montpellier.fr/
我们选择左端Online programs,新页中选择PhyML,如下图
上传上一步得到的PHYLIP format文件(All_ALIGNED.phy)
选择建树模型:(如果前期得到了用Jmodeltest的树的模型可以在下列选项中选择一个模型),如果前期没有筛选模型选择GTR; Number of random starting tree: SPR
Tree Searching: 如果没有给定的树选择:BIONJ,no
Branch Support: Fast likelihood-based method:no Perform bootstrap:1000, yes
然后输入你任务的名字以及接收结果的email地址。
最后你就能把你的结果打包下载啦,这其中最有用的文件就是RAxML_bestTree.All_ALIGNED_result,这个树文件啦~
最后进行树的查看与编辑
可以用Figtree (免费软件)查看并编辑树的软件
树的编辑与美化都是依据个人喜好,大家可以用Figtree, Adobe Illustrator, Photoshop 等多种软件按自己的需求进行树的编辑与美化。
本人审美以及美化水平都处于地平线以下水平,具体把你的进化树做到多美观大家可以多参考好期刊上的文章照葫芦画瓢,这里我就不一一给大家展示了,仅给大家提供Figtree 的下载链接,供有需要的小伙伴下载,美化与编辑是一个细致活,只要花点时间一定能拿到一颗完美的系统发育树。
猜你喜欢
写在后面
为促进读者交流、加速科学问题解决,我们建立了“宏基因组”专业讨论群,目前己有八百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论。问题不私聊,帮助同行。
学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”