lncRNA介绍专题:一文带你了解lncRNA
背景
分类分析流程生物学功能lncRNA数据库大全lncRNA研究
非编码RNA,根据其长度的不同可分为长链非编码RNA和短链非编码RNA。转录本序列长度在200 bp 以上的非编码RNA 通常被称为长链非编码RNA(long non-coding RNA,lncRNA)。
目前,lncRNA的发现主要是通过以下三种途径:
传统的遗传学手段(如Xist、H19、HOTAIR以及植物中的HID1等);
芯片方法(如乳腺癌、胰腺癌、肝癌等癌症相关的lncRNA等);
高通量RNA-seq方法鉴定(新的lncRNA等)。
lncRNA与细胞周期和分化、发育、生殖、性别调控、衰老以及多种人类疾病密切相关。lncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。文献研究表明,lncRNA参与了X染色体沉默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,这些调控作用也开始引起人们广泛的关注。
分类
许多lncRNA都具有保守的二级结构,剪切形式以及亚细胞定位,这种保守性和特 异性表明它们是具有功能的。但lncRNA的功能相对于microRNA和蛋白质的功能来说更加难以确定,因为目前并不能仅根据序列或者结构来推测它们的 功能。根据它们在基因组上相对于蛋白编码基因的位置, lncRNA可以分为五类:
(1)Antisense lncRNA (反义lncRNA),
(2)Enhancer lncRNA (增强子lncRNA),
(3)Large intergenic noncoding RNA (lincRNA),
(4)Bidirectional lncRNA (双向lncRNA),
(5)Intronic transcript lncRNA (内含子lncRNA)。
分析流程
生物学功能
lncRNA可通过与DNA/RNA结合或与蛋白结合而行使其功能。一些lncRNA实际上是某些调控RNA(如microRNA或piwi RNA)的前体。与miRNA不同的是,lncRNA没有一种普遍的作用模式,它以许多不同的方式来调控基因表达和蛋白合成。研究发现,一些lncRNA参与了基因调控的基本过程,包括染色质修饰和结构以及直接的转录调控。基因调控可能以顺式(cis)或反式(trans)发生。lncRNA的转录后功能包括调控RNA加工事件,如剪接、编辑、定位、翻译和降解。
对于lncRNA在胚胎发育中的作用,Broad研究院的Mitchell Guttman曾这样描述,维持全能性的蛋白和促进分化的蛋白就像战士。它们各司其职,但需要一些东西来协调他们的行动。lincRNA则被认为是队长,带领不同蛋白,协同作战。
随着研究的深入,参与发育过程的lncRNA也不断被发现。据《Cell》杂志报道,麻省理工学院等机构的研究人员发现了一种新型的长链非编码RNA,称为勇敢的心(Braveheart,简称Bvht),它在哺乳动物发育过程,心血管发育谱系维持方面发挥了重要作用。而Whitehead研究所的科学家也发现了10个在脂肪细胞发育中扮演重要角色的lncRNA。
lncRNA数据库大全
lncRNA数据库对于lncRNA的研究很关键,因为它有可能揭示一个全新的由RNA介导的遗传信息表达调控网络,从不同于蛋白质编码基因的角度来注释和阐明基因组的结构与功能,并为人类的疾病研究和治疗提供新的思路和方法。同时,新一代测序技术的发展也为鉴定lncRNA的计算机方法提供了强大的支持。(ps:后期我们将选择其中一些数据库进行详细的介绍,请保持关注。)
1. Noncode
NONCODE v4是一个全面的综合注释数据库,数据由二代高通量测序技术产生,涵盖所有类型ncRNAs,(除了rRNAs and tRNAs)。NONCODE的优势之处在于其ncRNA注释,提供编码能力评估,位置信息,表达信息和潜在功能以及共表达等信息。另外它还对先前的基因芯片数据重注释,以获得更多的lncRNA表达信息。
http://www.noncode.org
2. LncRBase
LncRBase是一个基于特征序列(如CGIs和重复序列)来分析IncRNA功能的注释数据库。2015年11月,LncRBase收录了83201个鼠的和133361个人类的ncRNA转录本,分析内容包含“lncRNA-ncRNA互作”或“Alu repeat elements”结果。
http://bicresources.jcbose.ac.in/zhumur/lncrbase/
3. lncRNome
lncRNome是专门收集人类lncRNAs信息的知识数据库,包括疾病、表达、生物功能和表观遗传等相关信息。
http://genome.igib.res.in/lncRNome/
4. NRED
NERD是一个发育和分化相关的基因芯片数据库,包含各种组织特异表达的lncRNA。用户可以在特定的器官,部位和细胞中查询lncRNA的表达情况。
http://nred.matticklab.com/cgi-bin/ncrnadb.pl
5. C-It-Loci
C-It-Loci收录了来自人类、鼠和斑马鱼的组织特异性IncRNA数据库。它考虑了lncRNAs序列的保守性,能使用物种间保守性区域或位点来识别相关lncRNAs。
http://c-itloci.unifrankfurt.de
6. Co-LncRNA
Co-LncRNA提供了lncRNAs共表达、GO注释和KEGG通路的富集分析结果。数据主要来自细胞系和人类样本的RNA-Seq实验数据。
http://www.biobigdata.com/Co-LncRNA/
7. LNCipedia
LNCipedia是一个人类lncRNA转录序列和结构的注释数据库,使用二级结构信息建立了一个标准统一的分类和命名体系。lncRNA信息包含编码能力评估,预测开放阅读框和二级结构等信息。
http://www.lncipedia.org
8. LncRNA2Function
LncRNA2Function是一个lncRNA功能注释的数据库。LncRNA2Function注释了来自GENCODE数据库的lncRNAs,结果包含通路注释和GO注释。
http://mlg.hit.edu.cn/lncrna2function/
9. lncRNABase (starBase) v 2.0
Starbase是一个lncRNA与其他分子相互作用的数据库。主要使用CLIP-seq和CLASH等实验数据来支持mRNAs,miRNAs,RNAs,蛋白质和其他各种类型的ncRNAs之间的相互作用。
http://starbase.sysu.edu.cn/mirLncRNA.php
10. lncRNAdb
LncRNAdb是一个真核生物的lncRNA综合数据库。数据库包括特异的序列结构信息,如转录本、基因组位置、表达、亚细胞定位和保守位点以及相关的功能和疾病。
http://www.lncrnadb.org
11. fRNAdb
fRNAdb结合了SRE和CGI信息以及表观遗传学数据(甲基化、组蛋白修饰),以提高lncRNA的准确性。
http://valadkhanlab.org/database
12. Linc2Go
Linc2Go是一个lncRNA的功能注释数据库,它基于ceRNA假说,即假设lncRNAs与microRNAs相互作用来抑制mRNA的转录,从而预测lncRNA功能。
http://www.bioinfo.tsinghua.edu.cn/liuke/Linc2GO/
13. ChIPBase
在哺乳动物中存在大量高度保守的lncRNA,这些lncRNAs可能具有调控细胞功能的作用。coding/non-coding gene co-expression(CNC)预测是一种基于网络拓扑和特征来预测lncRNAs可能的功能。
ChIPBase使用染色质免疫沉淀结合深度测序(ChIP-seq)数据来连接lncRNAs与表观遗传因子,并且整合了转录因子(TF)-lncRNA、TF-miRNA TF-miRNA-miRNA和TF –ncRNA等调控关系。
ChIPBase结合转录因子结(TFBS)的组织特异表达谱来预测TF与lncRNAs作用关系,来阐释其在转录调控,染色质重塑和组蛋白修饰中的关键作用。
http://deepbase.sysu.edu.cn/chipbase/
14. lncRNASNP
lncRNASNP是一个SNPs对lncRNA以及结合miRNA能力的影响的信息数据库。LncRNASNP提供结合位点,自由能能和互作的结合分值。此外,LncRNASNP提供了单个SNPs对lncRNA的二级结构影响的可视化示意图。
http://bioinfo.life.hust.edu.cn/lncRNASNP/
15. LncRNADisease
LncRNADiseas是收集各种实验验证的与lncRNA相互作用的信息数据库(蛋白质、RNA, microRNA,DNA…),通过对疾病的聚类和序列的保守性(SNP的分布密度)来预测lncrna与疾病的相关性。
http://www.cuilab.cn/lncrnadisease
16. Lnc2Cancer
Lnc2Cancer是人工收集1500多篇已发表的论文,提取了531个lncRNAs与86种癌症相关的1057个作用关系。数据库包含lncRNA在癌症中的表达水平(上升或下调)。
http://www.biobigdata.com/lnc2cancer/home.jsp
lncRNA相互作用分析
17. ncFANs v2
ncFANs是一个用于注释基因芯片中包含lncRNAs的分析平台,它通过蛋白与lncRNAs共表达(CNC)网络来注释lncRNAs的功能。
http://www.bioinfo.org/ncfans/
18. lncRNAtor
lncRNAtor是一个包含表达谱,ncRNA-蛋白结合和进化分值和编码能力注释的LncRNA序列的数据信息平台。LncRNA-蛋白结合是lncRNAtor一个特有功能。此外,lncRNAtor提供了一个器官、癌症、药物、组织和发育阶段等RNA-Seq数据的整合分组。
http://lncrnator.ewha.ac.kr/index.htm
19. lncPro
lncPro工具是一个为数不多的专门用于预测lncRNAs和蛋白质相互作用的工具。与lncRNAtor通过使用差异表达数据来确定结合作用不同,lncPro是使用机器学习的模型,通过对lncRNA二级结构、氢键倾向和范德瓦尔斯力进行计算,从而对lncRNA-protein配对关系进行预测。
http://www.bioinfo.org/NPInter/lncPro.htm
20. DIANA-LncBase
DIANA-LncBase是一个用于分析lncRNAs在人类和鼠中的生理和病理的影响。通过ORF方法来识别lncRNAs,并且显示lncRNA-miRNA互相作用。最后,使用序列保守性、人类lncRNA和蛋白质转录本对其进行功能注释。
http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=lncBase/index
21. lncRNAMap
lncRNAMap的是一个人类lncRNAs全面整合的数据库。lncRNAMap提供lncRNA沉默干扰后的信息。从公开的siRNA文库或siRNA-target的深度测序数据来预测miRNAs和siRNA的靶lncRNAs。
http://lncrnamap.mbc.nctu.edu.tw/php/
22. TF2LncRNA
TF2LncRNA工具月用于评估TFs与lncRNAs之间的相关性。使用超几何检验对ENCODE数据库中的ChIP-seq数据进行基因本体(GO)或通路富集的统计评估。对于lncRNA-TFs查询,使用Benjamini-Hochberg法对于p值的统计校正。
http://mlg.hit.edu.cn/tf2lncrna/index.jsp
23. TANRIC
lncRNAs作为癌症关键分子的作用不断认识,TANRIC包含大量RNA-Seq数据集,允许通过生物学意义和药物敏感对lncRNAs临床研究进行探索。使用20种癌症的表达谱包含TCGA和和其他独立的数据集(共计8000多个样本),TANRIC包含lncRNA的生物分子及临床信息之间的关联分析并且支持可视化,例如,热图和聚类。
http://ibl.mdanderson.org/tanric/_design/basic/index.html
24. LongTarget
LongTarget是一个来预测lncRNA-DNA结合motifs和结合位点的工具。按照6个Hoogsteen和18个反向Hoogsteen规律来分析lncRNA和DNA序结结合并预测TFO和TSS。
http://lncrna.smu.edu.cn
lncRNA研究
1.最新研究
(1)Enhancer-associated long non-coding RNA LEENE regulates endothelial nitric oxide synthase and endothelial function
https://www.nature.com/articles/s41467-017-02113-y
eNOS expression is dynamically regulated both transcriptionally and post-transcriptionally by various stimuli. Here the authors identify an enhancer-associated lncRNA (LEENE) that is co-regulated with, and enhances eNOS expression.
Yifei Miao, Nassim E. Ajami […] Zhen Chen
18 January 2018
Nature Communications 9, 292
(2)TPGLDA: Novel prediction of associations between lncRNAs and diseases via lncRNA-disease-gene tripartite graph
https://www.nature.com/articles/s41598-018-19357-3
Liang Ding, Minghui Wang […] Ao Li
18 January 2018
Scientific Reports 8, 1065
(3)The lncRNA GATA6-AS epigenetically regulates endothelial gene expression via interaction with LOXL2
https://www.nature.com/articles/s41467-017-02431-1
LncRNAs influence endothelial cell function via a number of mechanisms. Here the authors show that the lncRNA GATA6-AS regulates endothelial gene expression through interaction with the nuclear deaminase LOXL2, with functional consequences on endothelial-mesenchymal transition and angiogenesis.
Philipp Neumann, Nicolas Jaé […] Stefanie Dimmeler
16 January 2018
Nature Communications 9, 237
(4)Allele-specific repression of Sox2 through the long non-coding RNA Sox2ot
https://www.nature.com/articles/s41598-017-18649-4
Tobias C. Messemaker, Selina M. van Leeuwen […] Harald M. M. Mikkers
10 January 2018
Scientific Reports 8, 386
(5)Silencing of the lncRNA Zeb2-NAT facilitates reprogramming of aged fibroblasts and safeguards stem cell pluripotency
https://www.nature.com/articles/s41467-017-01921-6
The efficiency of somatic cell reprogramming is lowered by ageing. Here the authors show that the transcription factor Zeb2 and its long non-coding RNA Zeb2-NAT are expressed at high levels in older fibroblasts and their inhibition increases reprogramming efficiency.
Bruno Bernardes de Jesus, Sérgio Pires Marinho […] Maria Carmo-Fonseca
08 January 2018
Nature Communications 9, 94
(6)RNA-DamID reveals cell-type-specific binding of roX RNAs at chromatin-entry sites
https://www.nature.com/articles/s41594-017-0006-4
RNA-DamID, a novel approach to detect lncRNA–genome interactions in vivo with high sensitivity and accuracy, demonstrates that the initial targeting of lncRNAs in the Drosophila dosage-compensation complex is cell-type specific.
Seth W. Cheetham & Andrea H. Brand
18 December 2017
Nature Structural & Molecular Biology 25, 109–114
2.疾病相关
(1)与癌症相关
LncRNAs | 疾病类型 | 参考文献 |
---|---|---|
BC1 | 多种癌组织中均发生上调 | Chen et al. 1997;lacoangeli et al. 2004 |
BCMS | B细胞癌 | Wolf et al. 2001 |
DD3 | 前列腺癌 | Bussemakers et al. 1999 |
NC612 | 前列腺癌 | A.P.Silva et al.2003 |
PCGEM1 | 前列腺癌 | Srikantan et al. 2000 |
H19 | 肝癌和乳腺癌 | Looijenga et al. 1997;Lottin et al. 2002 |
MALAT-1 | 非小细胞肺癌、肝癌等 | Ji et al. 2003;Lin et al. 2006;Yamada et al. 2006 |
HIS-1 | 骨髓性白血病 | Askew et al. 1994 |
HOST2 | 卵巢癌 | Rangel wt al. 2003 |
OCC1 | 结肠癌 | Pibouin et al. 2003 |
SRA | 乳腺癌 | Lanz et al. 1999 |
(2)与神经系统疾病相关
LncRNAs | 疾病类型 | 参考文献 |
---|---|---|
BC200 | 阿兹海默症 | Lukiw et al. 199 |
DISC2 | 精神分裂症 | Millar et al. 2000,2004;Blackwood et al. 2001 |
PSZA11q14 | 精神分裂症 | Polesskava et al. 2003 |
IPW | Prader-Willi综合症 | Wevrick et al. 1994 |
ZNF127AS | Prader-Willi综合症 | Jong et al. 1999 |
RAY1/ST7 | 自闭症 | Vincent et al. 2002 |
(3)其他类型疾病
LncRNAs | 疾病类型 | 参考文献 |
---|---|---|
22k48 | DiGeorge综合症 | Pizzuti et al. 1999 |
DGCR5 | DiGeorge综合症 | Sutherland et al. 1996 |
COPG2IT1 | Russell-Silver综合症 | Yamasaki et al. 2000 |
MESTIT1 | Russell-Silver综合症 | T.Li et al. 2002;Nakabayashi et al. 2002;Sonkoly et al.2005 |
H19 | Beckwith-Wiedemann综合症 | Soaraao et al. 2004 |
LIT1 | Beckwith-Wiedemann综合症 | Niemitz et al. 2004 |
参考内容
1.誉衡基因, 生命中的lncRNA
2.MedSci, 带你全面认识长链非编码RNA
3.弗雷赛斯, 最全长链非编码RNA数据库介绍(全)
4.Johnny T. Y. Kung, David Colognori and Jeannie T. Lee. Long Noncoding RNAs: Past, Present, and Future. GENETICS 2013, 193(3):651-669.
5.https://www.nature.com/subjects/long-non-coding-rnas
6.Exiqon-What are lncRNAs?
猜你喜欢
还有更多文章,请移步公众号阅读
如果你生信基本技能已经入门,需要提高自己,请关注上面的生信技能树,看我们是如何完善生信技能,成为一个生信全栈工程师。
如果你是初学者,请关注下面的生信菜鸟团,了解生信基础名词,概念,扎实的打好基础,争取早日入门。