利用基因组学技术研究微生物,有时候需要从微生物的基因组中获取某些特定的基因序列或者是部分序列片段,那么这时就需要对基因序列进行部分提取。
TBtools就是一种简单易操作,适合大众化的基因序列提取的小工具,本期我们就如何使用TBtools中Fasta Tools完成对基因或蛋白质序列的部分提取和大家作一个简单的展示。具体操作方法猛戳上方视频哦~01 Fasta Extract (Recommended)
(序列片段提取)
打开Fasta Extract (Recommended)的主页面,先在Input里导入一个fasta格式的文件,DNA或蛋白质序列均可(这里用的是蛋白质序列),导入完成后点击右边的Initialize完成初始化,随即在相应的路径中生成该序列的一个FA和一个FAI文件,如下图所示。
指定输出路径用于输出结果,在输出列表中使用键盘上的Tab键将序列ID、起始位置和终止位置隔开,如下图。
02 Fasta Extract or Filter(Quick)
(序列片段提取或过滤)
打开Fasta Extract or Filter(Quick)的主页面,先在Input里导入一个fasta格式的文件,选择输出路径和文件名称,在ID输入栏中写上ID号、想要提取的起始位置(1)和终止位置(20),右边的Extract和Filter是和下面的Match及Contain功能相组合的,这里就分别演示Extract与Contain和Filter与Match的组合功能。首先是Extract与Contain的组合,如下图所示。
接下来是Filter与Match的组合,如下图所示。
那么从图中看出,该功能过滤掉了原始序列中的描述信息。03 Fasta Extract (Basic)
(根据序列ID提取Fasta序列)
该功能是根据序列ID提取其中几条序列,所以开始前需要准备一个有多条序列的fasta文件。打开Fasta Extract (Basic)的主页面,导入一个符合要求的fasta序列文件(这里导入的是大肠杆菌DSM 30083的cds序列文件)。选择输出路径和文件名称,在输出列表中写上想要提取的几条序列的ID,如下图所示。
点击Start后,生成如下小窗口,点击Copy Info即可将提取序列信息全部复制。
打开输出文件,看到想要的序列按照设定被提取出来,如下图所示。
04 Fasta Subseq (Basic)
(Fasta序列提取片段子集)
该功能的目的在于批量获取基因序列片段,例如要获取输入的fasta序列中某几个基因的片段,如何操作,该操作适应于我们想从一个微生物的全基因组序列中提取我们想要的几条基因序列。打开Fasta Subseq (Basic)的主页面,导入一个基因组序列文件(这里导入的是大肠杆菌DSM 30083的基因组序列文件)。选择输出路径和文件名称,在输出列表中写上基因ID、批量提取的基因序列的起始位置和终止位置,如下图所示。
结果如下所示,可以看到三条基因序列按照设定被提取出来。
简单好用fasta序列处理小工具,同学们快用起来吧!更多精彩内容快来加入我们吧,独乐乐不如众乐乐~
PS:公众号后台回复“TBtools”,即可获得最新软件安装程序哦~
凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。
凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。
关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!