如何查询目标基因的序列 | 转录调控专题
在设计目标基因RT-PCR引物、构建过表达载体、siRNA与shRNA设计、同源性分析等都很多场景会用到基因(转录本、CDS)的序列,在这里我们介绍四种常用的查询基因(转录本)序列的方法。
2)查询结果包含众多信息,在External Ids部分包含NCBI Entrez ID和Ensembl ID;
3)链接到NCBI,下载转录本序列;
4)链接到Ensembl 数据库,进入下载序列界面;
5)选择所需序列(cDNA或CDS),下载即可。
进入https://www.ncbi.nlm.nih.gov/,在左侧下拉菜单选择“Gene”
2)搜索基因:可输入基因ID(NCBI Gene ID即GI号)或基因名(蛋白名)进行查找。以“SMAD4”为例,结果如下:
3)找到目标基因(注意物种),人SMAD4,即第一个,点击查看
4)找到RefSeq,进入转录本详情页
5)在详情页点击FASTA可以查看FASTA格式的RNA序列,此页面包含对RNA序列的注释
6)进入FASTA页面,获得RNA序列
如果需要获得CDS序列信息,可以返回上一页,在页面中查询CDS区间注释。
2)选择对应物种,查询人的SMAD4,选择第一个(如果是基因ID或转录ID,一般ID本身具有种属性)
3)进入详情页,选择Sequence模块,进入序列下载页面
4)选择需要下载的序列类型,填写相关参数下载即可。
在ensembl的序列下载页面中可以选择下载目标基因的cDNA(转录本)序列、CDS序列、氨基酸序列、UTR序列、内含子序列或基因组DNA序列,以满足不同的分析需求。比如在预测动物miRNA的靶基因时,通常会取目标基因的3’UTR序列进行预测;在RT-PCR引物设计时通常以cDNA序列或CDS序列作为参考模板。下载页面同时提供下载序列中是否包含往上游(5' Flanking sequence)或下游(3' Flanking sequence)延伸n个碱基(默认600 bp)序列的参数设置;如果不需要,需要将其设为0。
另外在此页面,可以下载目标基因上游的DNA序列,比如下载目标基因上游2-3k的序列,以预测哪些转录因子可能调控目标基因的转录。
4)测序分析结果通常转录组测序中会包含转录本序列文件,可以直接从测序结果中的序列文件(fasta文件)中基于转录本ID(一般转录本ID对应唯一序列)、基因ID或基因名查询序列。对于那些新组装的RNA序列,在任何数据库中是查询不到的,只能在分析结果中查询序列。如果有生信基础或代码基础,也可以直接基于基因组DNA序列文件和基因组注释文件(gtf)提取相关基因的序列。
微量m6A测序揭开共转录逆向调控组蛋白修饰机制 | m6A专题
收藏再看!120分钟视频+上万字问题解答=circRNA大佬!(内含整理一年资料合集免费领取)
点击下方图片进入云平台资料汇总:
所见即所得,绘图高规格联川云平台,让科研更自由