查看原文
其他

凌波微课|基因家族分析(一)——如何高效筛选基因组家族成员

Young 凌波微课 2023-06-15
 学生信,做分析,就上凌波微课!
基因组家族成员筛选鉴定实操

基因家族是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。同一家族基因可以紧密排列在一起,形成一个基因簇;但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。

基因家族成员的归类


第一,序列高度相似的序列,互为同源基因,即归属为一个基因家族(即拷贝数目多于一)。

第二,从结构域的角度来说,具有保守结构域(某个或多个)的序列,即为某个基因家族的序列。

基因家族成员鉴定方法


方法一,针对已经收录在Pfam数据库(http://pfam.xfam.org/)中的基因家族(例如NBS基因家族)。从Pfam数据库下载获取基因家族隐马可夫(hmm)模型,根据结构域通过Hmmer3软件(http://eddylab.org/software/hmmer3/)进行基因家族成员筛选。具体筛选方法可参考往期视频凌波微课|蛋白结构域如何分析?试试Pfam在线注释)。

方法二,针对还没有hmm模型的基因家族。从NCBI Protein数据库获取参考基因家族蛋白序列,通过blast比对筛选同源基因;根据已有文献获取可信度高的序列,通hmmer3构建hmm模型,在基于保守结构域进一步筛选。

NBS类基因属于植物抗病基因家族中最大的一类。本次课程中以NBS基因为例,筛选拟南芥(Arabidopsis thaliana)中抗病基因家族。具体操作方法猛戳以上视频~

环境变量设置


将hemmer完整的程序执文件夹路径(C:\Users\dell\Desktop\Online\TBtools\gen

e_family\hmmer-3.0-windows)添加到PATH路径之后,在任何地方都可以直接使用程序名运行程序,而不必使用完整的路径名。

计算机 →属性 →高级系统设置 →环境变量 → PATH中添加系统变量或用户变量。
 
Step1


Step2

Step3

基因家族成员筛选命令参数


1、通过hmmer软件进行蛋白结构域比对。
hmmsearch.exe .\NB-ARC.hmm .\GCF_000001735.4_TAIR10.1_protein.faa > At_NBS.out.txt
左右滑动查看

2、通过blast进行蛋白序列比对,关于blast软件具体使用方法请参考以前的微课(本地blast和本地blast+)。

#构建参考蛋白序列格式化,构建比对数据库
formatdb -i .\NBS_ref_protein.fasta -p T -o F
#blastp蛋白序列比对 
blastall -p blastp -i .\GCF_000001735.4_TAIR10.1_protein.faa -d .\NBS_ref_protein.fasta -e 1e-5 -m 8 -o blast_out.txt

左右滑动查看

3、通过hmmer软件构建蛋白序列hmm模型,再进行蛋白结构域比对(建议在linux系统下进行)。

#隐马可夫模型hmm之前首先进行参考蛋白序列比对
#通过mafft软件精选序列比对,具体使用方法请参考以前的微课(进化树构建之多重序列比对利器——mafft软件) 
#通过hmmbuild构建hmm模型
hmmbuild NBS_ref_example.hmm NBS_ref_example.align.fasta
#通过hmmsearch软件进行蛋白结构域比对
hmmsearch NBS_ref_example.hmm GCF_000001735.4_TAIR10.1_protein.faa > out.txt

左右滑动查看

PS:基因家族分析是应“凌波微课交流群”中@东林桃花心木老师建议准备的课程,用到的软件比较多,对于文章中提到的软件操作不清楚的同学们可以参考我们的往期视频。

再次感谢@东林桃花心木老师的宝贵建议,欢迎大家加入“凌波微课交流群”,有实用的软件或者分析内容推荐给我们,我们会筛选并准备相应的实操课程哦~独乐乐不如众乐乐~


再PS:公众号后台回复基因家族即可获得相应软件安装包以及示例数据的下载链接哦~


往期精彩

凌波微课|TBtools系列课程——火山图绘制技能,Get!

凌波微课|TBtools系列课程——Venn图、花瓣图,任你选择!

凌波微课|TBtools系列课程——解锁Heatmap绘制新姿势

凌波微课|NCBI数据批量下载,你会了吗?

凌波微课|蛋白结构域如何分析?试试Pfam在线注释

凌波微课|还不会序列比对?试试本地BLAST吧

凌波微课|Blast的升级版?没错,就是本地blast+

凌波微课|进化树构建之多重序列比对利器——mafft软件

凌波微课|SnapGene带你自定义绘制小基因组图谱

凌波微课|CGView——给你一个定制化的基因组图谱!

凌波微课|高颜值Seqlogo图,我也会做!

凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(二)

凌波微课|一节课让你学会MEGA构建系统发育进化树并美化(一)

凌波微课|蛋白结构域如何分析?试试Pfam在线注释







END



凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。

凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。


关注我

发现更多精彩

关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存