查看原文
其他

选哪个lncRNA的哪段设计引物?RT-qPCR验证,我要百发百中!

2017-10-20 小丫 嘉因生物

前几年是lncRNA测序时代,最近进入了后lncRNA时代,人们都在研究lncRNA的功能和调控机制。


去年4月,小丫写了这篇帖子,得到的评价是“看透了lncRNA验证,但描述得不够清楚”。最近又遇到有人问这个问题,就把这帖子拿出来,重新编辑,力求逻辑更顺畅,把脑中所想传达给更多的人。





问题的提出


lncRNA-seq获得了大量差异表达lncRNA,要做RT-qPCR验证。


选哪个lncRNA?选变化倍数大的?表达量高的?


选lncRNA的哪段设计引物?跟其它基因有重叠怎么办?






总体原则


1. 用跟测序同一批次的RNA样品做RT-qPCR;


2. 按lncRNA类型排序,优先选择lincRNA(基因间的lncRNA),和位于其他基因intron区的lncRNA;与其他基因exon有重叠的lncRNA,可选择其中无重叠的区段;


3. 按表达丰度TPM排序,优先选择前50%的lncRNA;按变化倍数排序,优先选择前50%的lncRNA;

注:具体限制多少TPM或变化倍数,由整体测序深度和差异表达基因的数量决定,保留排在前面的一半左右,自己斟酌;


4. 一定在测序结果里看到明显变化的峰的位置设计RT-qPCR引物;


为什么遵循以上原则?下面逐个解析。






解决方案


一、Sample准备


RT-qPCR验证sequencing结果,是用一个技术平台验证另一个技术平台的结果,所以,除了所使用的技术平台不同以外,其他条件都要尽量相同,其中最重要的就是样品一定要相同


测序和RT-qPCR,要求来自同一管RNA。如果要做RT-qPCR时需要再次提取RNA,那么退而求其次,要来自跟测序样品同一批次的细胞或同一块组织


具体可以这样操作,分两种情况:


  • 如果送RNA到测序公司。自己提取RNA,一半RNA送公司测序,保留另一半RNA,冻存于-80,最好存液氮,或者反转录后存cDNA。

  • 如果送细胞或组织到测序公司。由测序公司提取RNA,要求测序公司将剩余的RNA返还。


测序分析结果回来了,用跟测序同一批次的RNA样品做RT-qPCR。


如果用来做RT-qPCR的样品跟测序不是同一批次,那么你验证的就是两层面的叠加:技术平台间的差异 + 生物学重复间的差异。如果结果不一致,就搞不清楚是技术造成的差异,还是生物学重复的不一致。



二、不能选哪种lncRNA


先说什么样的lncRNA不能选来做qPCR验证。


用链特异性Strand-specific技术建库的lncRNA-seq,能够区分来自正义链和反义链的转录本,而普通的RT-qPCR无法区分来自不同链的RNA。


因此,不能选与其他基因exon重叠的lncRNA,否则,RT-qPCR结果就混合了两个基因的表达量。


最好选择基因间的lncRNA,即lincRNA,跟其他基因没有重叠。


其次选择位于其他基因intron区域的lncRNA


再次,如果lncRNA的一部分与其他基因的exon重叠,另一部分不重叠,就选不重叠的那部分。



三、选哪个lncRNA


表达量高的优于表达量低的,更容易做RT-qPCR,Ct值更低,结果更可靠;另外,表达量高的基因,其差异表达筛选时的准确性更高。


表达量用丰度TPM来衡量,点击链接查看详情:



由于测序和RT-qPCR原理不同,所以sequencing和RT-qPCR计算出来的变化倍数不可比,只要变化趋势相同就算结果一致



四、选哪段


到IGV里查看wig文件,哪个区段峰高,并且在组间变化明显,就选哪段设计PCR引物。


lncRNA某些区域可能看不到read,这可能是以下原因导致的:1. 基因有不同isoform,在你的样品里可能只表达其中一种isoform;2. PCR或测序偏好;3. 基因结构注释有问题。


RNA-seq计算lncRNA表达量和筛选差异基因时,用的是lncRNA全长read counts的总和,不代表每个区段都有表达或表达差异。因此,选择高峰所在的区段做qPCR,能保证万无一失。






举例子


在IGV里面打开wig文件,在IGV里逐个搜索满足上述原则的lncRNA,查看read分布。



栗子一


下图这个lncRNA位于基因间区,有不同的isoform,其中一些exon的read counts较多,如图中三个较高的蓝色峰,且在两个样品间有明显的变化,这三个峰所在的位置就适合设计引物。




怎样拿到序列呢?

点击IGV里的这个小图标,然后在你感兴趣的区段左边点一下鼠标,右边点一下鼠标,就出现红色的那一段了,在红色区域点右键,copy sequence,粘贴到你的引物设计软件里,就OK啦!



栗子二


对于链特异性建库的lncRNA-seq数据,每个sample有Forward和Reverse两个track,分别代表正义链和反义链,你能看到两条链上转录出来的不同的转录本。


下图这个lncRNA位于一个蛋白编码基因的antisense(箭头标明转录方向),虽然gene结构注释认为lncRNA位于内含子区域,但其下游仍有较多的read分布,可能是基因结构注释的问题。


我标出红色的区域跟另一个基因的exon没有重叠。


这里的四个track,分别是第一个sample的Forward和Reverse,和第二个sample的Forward和Reverse。两个sample的Reverse间有明显的差异,可用来设计引物。






最后,哪个软件设计引物


推荐primer3,http://primer3.ut.ee,简单高效。

Product Size Ranges限制为80-150,其余全部默认。我的经验是它设计出来的第一对引物就好用。




下面的帖子可能对你有帮助:








想用ChIPATAC实验研究感兴趣的基因?想整合ChIP-seq、ATAC-seq、eCLIP-seq、RNA-seq数据寻找线索?找嘉因生物吧!从实验、测序,到多种数据整合分析,为您一站式解决。(点击文中蓝字了解详情)




嘉因生物公众号定位:客户共性问题解答,生信学习资源导航,高通量 54 28215 54 15287 0 0 3986 0 0:00:07 0:00:03 0:00:04 3986实验导购 | 为您提供高通量实验-测序-分析-验证一站式解决方案


电话:021-61539657

Email:marketing@rainbow-genome.com
地址:上海市杨浦区赤峰路65号同济科技园1号楼611室

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存