LncRNA的特点及分类 | lncRNA专题
本期专题将围绕lncRNA的特点及分类展开,主要介绍Sense lncRNA、 Intronic lncRNA 、Bidirectional lncRNA、Antisense lncRNA、Intergenic lncRNA这几类lncRNA。
快来和小编一起开启学习模式吧~
研究背景
lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,有文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程。lncRNA的这些调控作用也开始引起人们广泛的关注。
西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰罗尼亚理工大学(UPC)的研究团队最近在eLife杂志上发表研究指出,长链非编码RNA在新蛋白演化中起到了重要的作用,它们在细胞中有着不为人知的重要功能。长链非编码RNA是指长度超过三百个核苷酸的RNA分子,其没有编码蛋白的阅读框。在细胞内lncRNA的丰度约占到70%至98%,有些lncRNA甚至长达几千bp。虽然lncRNA没有编码任何蛋白质,但它们的表达在不同组织和发育阶段依然具有特异性,这说明lncRNA具有重要的生物学意义。绝大多数lncRNA位于细胞核,它们对应的DNA区域有的与蛋白编码基因重叠,有的位于基因之间或者内含子中。由于lncRNA似乎没有承担什么生物学功能,它们曾被认为是一种“进化噪声”。现在西班牙的研究人员通过新测序技术向人们展示,许多这样的转录本也有机会翻译成为蛋白。这一发现旋即引起了激烈的争论。
lncRNA特点
lncRNAs通常较长,具有mRNA样结构,经过剪接,通常在5’端有一个7mC的帽子,3’端可以带polyA也可以不带polyA的尾巴。分化过程中有动态的表达与不同的剪接方式。
有组织特异性与时空特异性,不同组织之间的lncRNA表达量不同,同一组织或器官在不同生长阶段,其中的lncRNA表达量也会变化。如有人针对小鼠的1300个lncRNA进行研究,发现在脑组织中的不同部位,lncRNA具有不同的表达模式。
调控多样性,lncRNA可从染色质重塑、转录调控及转录后加工等多种层面实现对基因表达的调控。lncRNAs启动子同样可以结合转录因子,如Oct3/4,Nanog, CREB, Sp1, c-myc, Sox2与p53,局部染色质组蛋白同样具有特征性的修饰方式与结构特征。
序列上保守性较低,只有约12%的lncRNA可在人类之外的其它生物中找到。
哺乳动物蛋白编码基因占总RNA的1%,长链非编码RNA占总RNA的比例可达4%-9%,这些长链非编码RNA是基因功能研究的又一座宝库。目前发现的许多lncRNA都具有保守的二级结构,一定的剪切形式以及亚细胞定位。
它们在基因组上相对于蛋白编码基因的位置,可以分为5种:正义链(sense)、反义链(antisense)、双向(bidirectional)、内含子间(intronic)、基因间(intergenic),其所在的位置与其功能有一定的相关性。
链非编码RNA(lncRNA)是一类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。
结构不同进行分类
lncRNA与exon有overlap。这些lncRNAs是编码蛋白质的基因转录变异体,他们重叠与已知基因相同的基因链。大多数的lncRNAs缺乏蛋白质翻译的开放阅读框(ORF),而这类lncRNA包含一个开放阅读框,与编码基因有相同的起始密码子,但不能编码蛋白质的原因可能是介导衰变(NMD)限制mRNA的翻译并使终止密码子提起翻译。或是ORF上游有两个ORF,其中一个终止另一个ORF的翻译。
内含子lncRNA,大多数的内含子lncRNAs具有相同的组织表达模式和相应的编码基因,可使编码基因稳定转录或调节编码基 因的可变剪接。
双向lncRNA 与编码基因的上游的1kb内的头对头的区域。这类双向lncRNA与对应的编码蛋白有相似的表达模式。表明他们共享双向剪切。这种模式使得lncRNA可以“打开”染色质促进相邻编码基因的表达。
相比于正常的转录本,能减少更少的可变剪切。
定位于距离编码基因至少1kb的基因间区。参与细胞周期调控、免疫监视与胚胎干细胞多能性等功能。
相关阅读推荐