查看原文
其他

LncRNA保守性和可靠性分析 | 分析技能

Piccolo 联川生物 2022-05-21

伙伴们请注意:第一期生信营培训营招生已经结束啦,本期学员20人已招满,如有需要可联系小编预留下期报名信息哦(名额太抢手了,小编也没想到这么快就招满啦)

LncRNA的研究正在如火如荼地进行,越来越多的lncRNA被发现,并且越来越多的lncRNA数据库被建立并完善。

在分析lncRNA过程中,很多老师会遇到两个问题:

1. 对于已知的lncRNA,想预测lncRNA的保守性,比如在人和小鼠中某条lncRNA是否保守(当然我们知道lncRNA是很不保守和很不稳定的)。

2. 很多老师现在会做lncRNA测序,会有许多新预测的lncRNA,那么我们知道基于生物信息学预测会有许多假阳性的数据,如果挨个用q-pcr或者克隆的方法进行验证,肯定太耗费时间。当然,实验验证肯定是要的,但是在实验之前,我们如何判断某条lncRNA可靠性?我想很多老师都知道去跟已经报道的lncRNA比对一下不就好啦!Bingo!


今天我们就基于一个很强大的lncRNA数据库——NONCODE进行lncRNA保守性分析以及lncRNA同源性分析。

一、针对一条已知的lncRNA(被NONCODE收录),例如lncRNA-ATB.

打开:

输入需要查询的lncRNA名称:


点击Search之后出现如下页面:


点红框的转录本ID后出现如下页面,可以看到这个转录本的基因ID:


点击这个基因ID,会出现如下页面:


此页面包含以下模块:

1. Transcripts in Gene:此基因包含的lncRNA的转录本信息

2. Expression Profile:此lncRNA在各组织中的表达情况,并有统计柱状图展示

3. Conservation Info:此为lncRNA的保守性信息

4. Disease related:疾病相关信息,某些lncRNA是被预测或者证实与疾病相关的

那么这条lncRNA的相关信息都已一一呈现,我们所关注的保守性信息也在Conservation Info出现,示例图如下:

如果在某一物种中有保守的lncRNA信息,则会加粗显示,如上图。


二、如果是测序获得的某一条新的lncRNAlncRNA,并且此物种没有系统全面的数据库,前提是必须要有序列(废话,做了测序了,肯定有序列的),我们也可以通过NONCODE进行保守性分析:

点击主页面的BALST选项:


点击之后出现如下页面,把序列粘贴进去(也可以上传fasta文件),点击Search:


搜索一条lncRNA序列大概只需要10秒钟,得到如下结果:

大家是不是觉得很熟悉,这结果跟NCBI中blast的结果类似,最左边就是按照跟我们需要blast的序列相似度从高到低排序得到的结果,其中Score和E-Value就是我们blast中常见的打分值和E值(打分值越高、E值越小越可信)。


接下来就是复制相似度最高的那条lncRNA的ID,记住,复制的时候不要包含小数点和后面的数字,例如NONHSAT168138.1只复制NONHSAT168138,再去NONCODE进行查询相关信息,根据同源的lncRNA大致判断此条lncRNA的可信度以及功能。这样可以为我们后续的验证实验以及文章写作提供有力保障啦!


当然了,小编不得不说一句,lncRNA存在易降解、表达丰度低的特点,在筛选验证的时候除了利用数据库先佐证一下(比对不上数据库的并不一定是假阳性的,比对上的就是提高了真阳性率),还是要尽量选择表达丰度高的噢!


这周我们的分析技能小课堂就结束啦~

想知道更多分析技能文章吗?

想了解更多详情吗?

长按下方二维码,回复“分析技能”,马上获取常用数据分析技能。

Piccolo(运营部)丨文案

媛&荧丨编辑

图片及视频来自网络,侵删


相关阅读:

散点图的正确打开方式 | 分析技能

文献管理神器Endnote教程三——创建文献数据库 | 分析技能

文献管理神器Endnote教程二——软件布局和界面 | 分析技能

文献管理神器Endnote教程四——编辑参考文献格式(一) | 分析技能

四海八荒都适用的分析技能,你还不赶快报名!

欢迎转载,请注明出处:本文转载自联川生物公众号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存