Nature|LINE-1在逆转录转座时的模板和靶位识别
转座子是一类能够在基因组上移动其位置的DNA序列。根据转座机制不同,可分为逆转录转座子(retrotransposon)和DNA转座子(DNA transposon)。逆转录转座子顾名思义,即先以DNA为模板进行转录产生mRNA,再以其为模板逆转录为DNA。逆转录转座子又包含LTR(具有长末端重复序列)和Non-LTR(不具有长末端重复序列)两大类,LINE家族就属于Non-LTR逆转录转座子。
人类LINE-1存在于约80-100个转座拷贝中,这些拷贝导致了100多种已知的疾病。LINE-1会编码一种结合RNA的ORF1蛋白和一种具有核酸内切酶(EN)和逆转录酶(RT)活性的ORF2蛋白。新的LINE-1插入由靶向引物逆转录(TPRT,target-primed reverse transcription)启动,其中目标位点缺口为cDNA合成产生了直接插入基因组的引物。LINE-1 ORF2p通过转座和假基因合成产生了超过30%的人类基因组,了解LINE-1的逆转录转座机制对于基因组研究和疾病治疗具有重要意义。
关于逆转录转座子的结构研究,之前哈佛大学张锋课题组和清华大学刘俊杰课题组就先后分别解析了家蚕R2和低等真核生物R2的电镜结构,但人源逆转录转座子由于样品制备存在困难而进展缓慢。
近日,加州大学伯克利分校的Kathleen Collins、Eva Nogales和Akanksha Thawani团队在Nature杂志发表了“Template and target site recognition by human LINE-1 in retrotransposition”研究文章。他们纯化了LINE-1 ORF2p蛋白,并解析了LINE-1与模板RNA结合以启动cDNA合成状态的3.2 Å冷冻电镜结构。他们的工作为人类基因组转座机制提供了见解,为基因治疗提供了借鉴意义。
他们首先表达纯化了较为均一的全长LINE-1 ORF2p蛋白,进而利用LINE-1 3’ UTR和Alu RNA等天然底物验证了LINE-1 ORF2p介导的TPRT重组。接下来,作者尝试解析LINE-1 ORF2p的结构。他们一开始试图利用冷冻电镜技术重构不带有核酸的LINE-1 ORF2p结构,但这并不成功,因此他们尝试引入RNA以稳定LINE-1 ORF2p的结构。他们先是引入了在3’端带有polyT的Alu AJh RNA,以模仿cDNA合成起始状态,但结果只能得到分辨率为4.4 Å的密度图。为了提高分辨率,他们引入了一段合成的RNA模板,这段RNA的5’端是茎环结构,而3’端是单链结构,包含了polyA序列,且还有一段单链DNA与部分单链RNA互补配对(图1)。通过对引入核酸的优化,他们得到了分辨率为3.2 Å的电镜结构,成功搭建了LINE-1 ORF2p和核酸复合物的原子模型(图2)。
图1
图2
通过原子模型可以发现,LINE-1 ORF2p的RT结构域由右手结构中的手掌和手指组成,之后是Thumb结构域,之前是NTE结构域,它们都与原核和真核逆转录转座子的RT相似。RT和Thumb结构域承载着从活性位点出现的RNA-DNA双链,在NTE结构域前面是EN结构域。CTS结构域与NTE和EN结构域一起,与靠近活性位点的模板RNA的polyA形成接触表面。他们将CTS和Thumb之间的区域标记为RBD结构域,该结构域与模板RNA和RNA茎环相连。蛋白质与RNA的相互作用使模板RNA弯曲形成“L”型结构。
LINE-1 ORF2p的RT活性主要是依赖众多侧链与核酸的相互作用(图3)。他们发现有约9bp的DNA-RNA双链通过与RT、Thumb和RBD结构域相互作用而被完全包裹。引物3’端的刚进入dTTP和ddG-13由典型的FADD序列和保守的芳香氨基酸定位,而刚进入dTTP与RT结构域三个残基形成氢键,这与其他Group II intron RT活性位点结构相似。但与其他Group II intron RT不同的是,出活性中心的RNA-DNA双链不仅与NTE和RT结构域相互作用,还与RBD结构域相互作用。
图3
他们提出可能存在一种“阈值”模型,即只有具有足够长的polyA序列,LINE-1 ORF2p才能结合模板并进入活性中心。为了确定最佳TPRT的polyA长度,他们设计纯化了具有可变polyA长度和3’序列的AJh RNA,并将其作为LINE-1 ORF2p的TPRT模板。他们发现小于15A的长度几乎无法产生的TPRT产物(图4),这些结果与基于结构的预测一致。另外,他们还观察到侧链与腺嘌呤碱基的相互作用分布在整个polyA序列上,这也包括特异性识别腺嘌呤碱基的相互作用,例如A-60、A-57以及A-55均能与特定氨基酸形成氢键。他们发现CTS结构域也有助于腺嘌呤特异性识别。
图4
他们还发现LINE-1的CTS结构域可能存在着新功能。模板RNA茎环和polyA区域主要由CTS结构域参与结合,既存在氢键也存在疏水相互作用。通过结构发现,Ile121和Ile122与RNA的相互作用导致其构象扭曲。他们进而构建了ΔCTS突变体(删除整个CTS 结构域)和ΔIH突变体(插入螺旋被带负电荷的残基取代),结果发现两者TPRT活性都显著降低,ΔCTS突变体靶位切割活性受损,这意味着CTS结构域的作用不仅仅是与模板RNA相互作用和解缠绕。他们还研究了RNA茎环结构可能有助于确定TPRT在模板RNA中的起始位置。
他们探索了其他RT家族的类CTS结构域是否也具有相似功能,结果发现在家蚕R2逆转录转座子和人端粒酶催化核心中存在着与核酸相互作用序列的遥远关系,但这些部分类CTS结构域是否与LINE-1中的CTS结构域具有相同的功能仍有待确定。
研究人员还研究了TPRT的目标位点的结构偏好,结果发现LINE-1的靶点是部分双链结构,具有长的单链5’悬垂,而EN切割位点位于单链/双链过渡附近的双链DNA上(图5)。这种最佳目标位点结构支持LINE-1 ORF2p的TPRT高效性。
图5
供稿 | 刘府金
责编 | 囡囡
设计 / 排版 | 可洲 王婧曈
微信号:FRCBS-THU
因扫码入群人员已满,可扫码添加中心官方微信号,管理员邀请入群
原文链接
https://www.nature.com/articles/s41586-023-06933-5
参考文献
参考文献
1. Wilkinson ME, Frangieh CJ, Macrae RK, Zhang F. Structure of the R2 non-LTR retrotransposon initiating target-primed reverse transcription. Science. 2023;380(6642):301-308. doi:10.1126/science.adg7883
2. Deng P, Tan SQ, Yang QY, et al. Structural RNA components supervise the sequential DNA cleavage in R2 retrotransposon. Cell. 2023;186(13):2865-2879.e20. doi:10.1016/j.cell.2023.05.032
3. Thawani A, Ariza AJF, Nogales E, Collins K. Template and target site recognition by human LINE-1 in retrotransposition. Nature. Published online December 14, 2023. doi:10.1038/s41586-023-06933-5
精彩回顾
精彩回顾
点击上方卡片
关注我们吧
THE END
我知道你“在看”哟