“三多”lncRNA有这3条经典分析思路
课程回顾
华大科技一年一度的春季培训开启全新模式 ——1小时线上课堂,专注解惑,在线回复,更接受量身定制,让老师们疫情防控、课题研究两不误!2月25日晚,华大科技技术支持工程师余佳临老师带来《1小时从数据到文章-lncRNA测序数据解析》,以下是课程精华,供大家参考。
lncRNA,科研人称“大三多”——数量多、类型多、连作用模式都非常多的大RNA,是非编码RNA中的明星之一。官方定义长度大于200bp且不具备编码能力的非编码RNA,统称为long non-coding RNA。严格且干脆的描述方式立刻将lncRNA与其他非编码RNA,如miRNA等兄弟姐妹区分开。
数量多
2007年,FANTOM (Functional Annotation of Mammalian cDNA)项目从1000个基因座中检测到近35000个lncRNA,这些RNA与普通的编码mRNA一样,同样包含完整的5'-capping,可变剪接后的外显子内含子组合以及标准的3'-tailing结构。自此,科研人员们逐渐意识到这类RNA的特殊性和复杂性。据不完全统计和估算,lncRNA中不包含多聚腺苷酸结尾的lncRNA大概占40%,总lncRNA可能是mRNA的4~9倍。2018年,GENCODE对人样本的分析和lncRNA的预测发现,人样本中一共检测到270,044个lncRNA。随着lncRNA编码能力预测软件的开发与更新,越来越多神秘的lncRNA正在浮出水面。
类型多
除了对编码能力进行检测,科研人员还会对lncRNA的来源进行界定,一般分为5种:Intergenic、Intronic、Sense、Antisense、Bidirectional。不同来源的lncRNA也有不同的功能,比如Antisense的lncRNA可能会影响其基因组位置上编码的mRNA发生可变剪接。这些lncRNA虽然整体保守性不如mRNA,但它们的核心区域和启动子等元件还是相对保守的,这使得lncRNA在快速适应环境的同时,能有效表达并找到自己的作用目标。
Latgé G, Poulet C, Bours V, Josse C, Jerusalem G. Natural Antisense Transcripts: Molecular Mechanisms and Implications in Breast Cancers. Int J Mol Sci. 2018;19(1):123. Published 2018 Jan 2. doi:10.3390/ijms19010123
作用模式多
不编码蛋白的lncRNA功能主要体现在“调(调)戏(控)”其他基因,“撩妹”技能可谓爆棚,既可以与蛋白质产生相互作用,又可以和DNA反向互补,甚至能直接与各类RNA结合,可谓是中心法则中全过程的参与者,存在感超强。
学者们习惯把lncRNA分成以下8大作用模式。
关于lncRNA参与蛋白修饰或者介导染色质重构的现象,大家可能比较陌生。上文说到,lncRNA可与蛋白质结合发挥作用。它们通过招募染色质重构和修饰复合物到特定位点,改变DNA/RNA甲基化状态、染色体结构和修饰状态,进而控制相关基因的表达。很多DNA/RNA甲基化突变与癌症等某些疾病发生有关,而染色质修饰状态的改变也通常会影响到某些基因的表达状态,最常见的是在启动子区域出现的H3K4me3、H3K9me2及H3K27me3修饰等,这些组蛋白修饰会改变染色质活性,从而促进或抑制转录,控制基因表达。
这类lncRNA中,最典型的是HOXC基因簇转录的lncRNA HOTAIR,它募集染色质修饰复合体PRC2(Polycomb-group proteins,一类使基因发生表观遗传的染色质重塑蛋白,是控制动物组织发育的重要因子),并将其定位到HOXD基因簇位点,改变该区域的染色质修饰状态,进而抑制HOXD基因表达。已有临床研究表明,在乳腺癌、结肠癌和肝癌等肿瘤组织中,HOTAIR表达水平与肿瘤转移、复发及预后效果紧密相关。肿瘤细胞中HOTAIR高表达会抑制某些肿瘤转移抑制基因,促进肿瘤恶化;反之,沉默HOTAIR则会使肿瘤细胞丧失转移能力。除了HOTAIR,还有其他一些lncRNA可以通过募集,对DNA/RNA和组蛋白的表观遗传状态进行修饰,如Xist、Air等。
如图,lncRNA就拉上了PRC2,精准定位到编码基因上游,招募PRC2介导H3K27me3修饰(组蛋白 H3 上的 K9 和 K27 的三甲基化,是一种基因表达的抑制信号)和基因表达。
据统计,人体有超过20%的lncRNA均能形成多硫抑制物复合体。而小鼠胚胎干细胞中表达的lncRNA中,有30%能与至少1条染色质形成复合体。
lncRNA到底如何分析?
1. 最经典的思路,找lncRNA靶作用的mRNA,看看这些mRNA与表型之间的关系。
结合归老师转录组方向的课程,我们不难知道,mRNA的表达和序列发生变化,是会影响编码蛋白的功能的。也就是说,如果lncRNA与mRNA抱团,那么lncRNA就间接影响了这些mRNA。所以,常见的文章中,除了统计lncRNA数目、长度、外显子个数以及种类,最重要的就是分析lncRNA靶作用的mRNA了。
常见的lncRNA与mRNA的作用方式,一般分成两类:cis和trans。其中cis是指lncRNA与mRNA有一定的位置关系,如上下游一定范围内,它们以近水楼台的方式影响附近的mRNA;而trans是指那些没有先天位置优势,但仍然锲而不舍想要发挥作用的lncRNA了。它们千里迢迢游荡到目标mRNA身边后,通过稳定的反向互补结构,结合上lncRNA(一般会通过RNAplex软件进行预测,并计算二者结合的自由能)。
如图,经典的分析中,会提供二者的表达水平是正相关还是负相关、这些mRNA的功能是什么等,来间接完成生物学故事推断。
ChenJ, Zhang C, Zhang N, Liu G. Porcine endemic diarrhea virus infection regulateslong noncoding RNA expression. Virology.2019;527:89–97. doi:10.1016/j.virol.
2. 既然lncRNA还可以与其他RNA结合,那会有全转录组的调控关系吗?
不错,在非编码行列中,有一类短小精悍的miRNA,它们长度只有18-30nt,但却能与mRNA结合,通常还起到抑制mRNA的作用。不凑巧的是明星三多lncRNA也能与miRNA结合。那如果lncRNA把自己奉献出来,给miRNA当活靶子,mRNA不就被解放了吗?这,就是传说中的ceRNA关系,即内源性竞争RNA。常见的全转录组调控关系,通常涉及lncRNA/mRNA/circRNA/miRNA,其中前三类RNA的成员身上均发现过miRNA的应答元件,可与miRNA相结合。
因此,常见的分析角度可总结为:1)纯lncRNA靶向mRNA的分析;2)miRNA加入混战的ceRNA分析;3)各类RNA的共表达co-expression分析。这些,在Dr.Tom系统中均可通过“关联转换”一键点击实现数据抓取,并利用关联网络/关联聚类直接出图。
3. lncRNA可以与蛋白质结合,那就意味着可以做靶向蛋白预测?
是的,结合lncRNA与蛋白的分析预测,找到lncRNA潜在的结合蛋白,注释蛋白功能,如果这类蛋白与表观调控因子,如转录因子、染色质重构蛋白、转录因子辅因子等有作用,甚至可以配合上WGBS(全基因组甲基化测序)、ATAC-seq(全基因组染色质开放性测序)、ChIP-seq(染色质免疫共沉淀测序),捕获受lncRNA影响的甲基化区域、组蛋白修饰等,来个多组学关联,完成生物调控的完整重现。实际很多研究也表明,DNA的甲基化与肿瘤之间有莫大关联,表观调控的作用甚至一定程度上超越了遗传变异。
围绕这三块,进行数据分析,相信您一定能出好文章!
3月课表
进入3月,华大科技春季培训依然如火如荼,明天(3月3日,周二)晚上,《10x单细胞RNA测序数据解析》将如期举行。以下课表收好了,不要错过干货满满的直播——
(以上课表仅供参考,以实际为准)
相关阅读
打扰了,情人节还喊你学习,这个线上系列课堂免费开讲,还可以定制主题
教程不用太多,能发SCI就够了 | 2020华大科技春季培训课程回顾+预告
请继续关注“华大科技BGITech”
科技君将持续为您提供精彩内容
如有问题,欢迎后台留言~~
▼