查看原文
其他

TBtools系列课程——你想要的Fasta序列处理小工具我都有(三)

小施 凌波微课 2023-06-15
学生信,做分析,就上凌波微课

TBtools Fasta序列处理小工具实操(
前两期课程中,我们分享了TBtools软件处理Fasta序列小工具实操,包括序列片段的提取、序列ID名称的过滤、根据序列ID从文件中提取所需的序列、序列长度和GC含量统计、对序列进行反向互补等,关于具体操作见视频见凌波微课|TBtools最全的Fasta序列处理小工具(一)以及凌波微课|TBtools最全的Fasta序列处理小工具(

此外,将Fasta格式转换成Table格式,多条序列文件分割或者合并,或者从一个基因组文件中找出自己想要研究的某个片段。无需任何命令行,通过TBtools软件Sequence Tookit工具包能够轻松处理,提高研究效率。

本期内容就专门针对这些问题进行分享,具体的操作见上方的视频~
 
09

Fasta to Table Convert

Fasta格式与Table格式之间的相互转换
打开格式转换的主页面,Input中导入一个fasta格式的序列文件,选择好文件生成的路径和文件名,系统开始就默认Fasta格式转为Table格式,所以直接点击Convert即可。

打开生成的文件,即可看到Fasta格式的序列被成功地转换在Excel表格中,如下图所示。

如果想直接看结果还可以点击右边的Output TextArea,这样结果就直接呈现了,如下图所示。

那么要再将Table格式转换成Fasta格式,就只需要导入刚刚生成的Excel表格即可。为了方便观察我这里就选择显示在下方列表中,点击Convert就可以看到Table格式序列被转换成以>开头的Fasta格式了,如下图。


10

Merge or Split

Fasta序列文件的合并与分割
打开序列文件合并与分割的主页面,首先来看Fasta序列文件的合并。在输入栏中导入分别导入多个(大于两个)Fasta文件,并选择相应的输出路径和文件名,点击Start,如下图所示。

打开生成的文件,即可看到,序列文件被成功合并在一个文件里,如下图。

那么Fasta文件的分割,主要是针对一个有多条Fasta序列的文件进行的,所以我们导入一个这样的文件,并设置好分割后文件所到的路径和文件的前缀名。在设置参数时,可依据自己所需进行设定。比如这里的Split into指数值,具体要和下方的设置结合,我暂设为3。下方的分割模式一共有三种,第一种Record Per file意思是按照分割后每个文件中含有上方设置的数来分割;第二种Number of File意思是按照设置数分割成多少个文件,这里即分割成3个文件;最后一种Size(KB) per file意思是按照每个文件3KB大小对原文件进行分割。因此,大家可按照自己所需要的选择对应模式进行分割。为了方便展示,我这里就暂选择第二种分割模式,设置好后点击Start,如下图所示。

打开对应路径,可看到生成的三个分割好的FA文件,点开每个文件发现原始文件却被成功分割成现在的三个文件,结果如下图。

 

11

基于ID模式的操作

基因最长代表转录提取和序列模式定位器
首先看基于ID模式的基因最长代表转录提取,这个功能是帮助我们在一个有多条序列的Fasta文件中找出序列最长的那条。打开主页面,先导入一个有多条序列的fasta文件,设定输出路径和文件名,点击Start。打开生成的文件,看到只一条很长的序列在其中,即为原文件中最长的那条序列,结果见下图。

然后来看下基于ID序列的模式定位器的操作,此项功能旨在一个基因组文件中找到自己感兴趣的某条基因片段加以研究。在该功能的主页面先导入一个基因组序列文件,下方的选择标红区即输入想要定位的目的基因片段,这里我随机选取了基因组文件中某条片段。下方的小按钮开始都是默认选中,第一项是寻找基因组中与目的基因片段重叠的,第二项是忽略大小写字母,以及所允许定位基因片段的最大长度,大家可以根据自己所需进行修改。设定好输出路径和文件名,点击Start,如下图。

结果如下,该目的基因片段位于基因组文件序列的第490位碱基到第560位碱基处。

简单好用fasta序列处理小工具,同学们快用起来吧!更多精彩内容快来加入我们吧,独乐乐不如众乐乐~


参考文献

TBtools-an integrative toolkit developed for interactive analyses of big biological data. Molecular Plant, 2020.


往期精彩

凌波微课|TBtools最全的Fasta序列处理小工具(二)

凌波微课|TBtools最全的Fasta序列处理小工具(一)

凌波微课|基因家族分析(二)——如何高效绘制基因组家族结构图谱

凌波微课|基因家族分析(一)——如何高效筛选基因组家族成员

凌波微课|TBtools系列课程——火山图绘制技能,Get

凌波微课|TBtools系列课程——Venn图、花瓣图,任你选择!

凌波微课|TBtools系列课程——解锁Heatmap绘制新姿势

凌波微课|NCBI数据批量下载,你会了吗?

凌波微课|蛋白结构域如何分析?试试Pfam在线注释

凌波微课|还不会序列比对?试试本地BLAST

凌波微课|Blast的升级版?没错,就是本地blast+

凌波微课|进化树构建之多重序列比对利器——mafft软件

凌波微课|SnapGene带你自定义绘制小基因组图谱

凌波微课|CGView——给你一个定制化的基因组图谱!

凌波微课|高颜值Seqlogo图,我也会做!

凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(二)

凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(一)


凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。

关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存