硬干货!!关于phasiRNA分析,你需要了解这些概念 | miRNA专题
phasiRNA作为小RNA的一员,广泛存在于各类植物以及它们的各种组织中,在物种进化、植物生长发育、响应生物和非生物胁迫中都扮演着重要的角色。
PhasiRNA初级转录本由Pol II (RNA polymerase II) 转录,随后miRNA (microRNA) 引导AGO 蛋白对phasiRNA初级转录本上的靶位点进行剪切,剪切后的phasiRNA 前体片段( 剪切位点的上游或下游片段) 继而被RDR6 (RNA-dependent RNApolymerases 6) 复制成双链RNA,双链RNA被DCL4切割成一系列首尾相接,具有一定相位的21-nt 或24-nt的小RNA,即phasiRNA。成熟的phasiRNA与AGO蛋白组装成沉默复合体,作用于靶基因,发挥转录后调控的功能(图1)。因此研究植物中众多phasiRNA 的合成通路以及它们调控靶基因表达的机制,有助于我们深入了解植物生长发育的调控网络。
图1:phasiRNAs的合成通路
联川生物phasiRNA的整个分析流程如图2所示。采用PhaseTank分析软件,能够系统、快捷地鉴定出phasiRNA,首先将测序数据比对到参考基因组上,过滤掉已注释为其他RNA 的序列,其次计算转录本的RSRP值,并取前5%的序列进行下游预测,然后确定phased cluster,进入计算phased得分系统,最后通过Cleave Land4软件进行预测 phased-triggered miRNAs或者phasi RNAs的靶基因,得到miRNA→TAS→tasi RNA→target genes这样的调控盒子,最终将整个phasiRNAs参与的复杂的调控体系描述出来。
图2:phasiRNA分析流程
这里我们引入一个全新的概念RSRP(相对 small RNA 产量):相较于平均水平该位点产生small RNA的能力。
计算公式:
N 为输入转录本的总数目
对于潜在可以产生 phasiRNA 的转录本,我们采取Axtell(2010)的方法来寻找 phased 位点,判定哪些位置产生phasiRNAs的可能性最大。
(1)将small RNA reads利用bowtie比对到整个参考序列上,记录能匹配上的 reads对应的位置,正负链,转录本名称和转录本染色体位置等信息;
(2)将所有匹配到负链的reads的位置匹配信息统一修正到正链对应的位置,因为有2nt的悬垂,所以所有匹配到负链的reads的位置信息通过加上2来修正到正链;
(3)将转录本上的每个位点如图3依次排入 21 个 bin 中(1→bin1, 2→bin2…21→bin21; 22→bin1, 23→bin2…42→bin21…),直到该转录本最后一个核苷酸位置;
(4)这样对于每一个转录本的所有位置都分配给 bin1-21,那么根据上面步骤(1)中reads 匹配的信息,可以找到匹配到每个bin位置的所有reads的丰度,将所有的丰度值相加得到该bin位置的总丰度。对于21个bin 位置,有21个丰度值,按从大到小依次排列后,取丰度最大 bin位置对应的转录本上的位点,作为该转录本上phased siRNA的产生位点。
图3:bin位置分配方法
结合PHAS基因的独特生成和作用方式,Fahlgren等人提出的 small RNA cluster 的概念(Fahlgren, Howell, et al. 2007; Zhang, Li et al. 2012),引入了 phased siRNAs cluster的概念,在cDNA前体上寻找产生phasi RNAs的cluster区域是通过phased位点reads匹配情况来决定的(图4)。它们之间需满足以下几个条件:
(1)因为该reads群是间隔21bp倍数的reads,根据他们匹配的位置从小到大排列为:P1,P2,P3…Pn;
(2)如果Pi – Pi-1 <= 84,且为连续4个reads以上,则将该转录本上满足该条件的最大连续 reads 区段作为 phasiRNAs cluster。
4:phased siRNA cluster的定义
Phased abundance、Phased ratio和Phased number这三个参数也非常重要,为phased score三大贡献因子,能使得结果更加准确。
Phased abundance:匹配到phased位点的reads总丰度。
Phased ratio:匹配到phased位点的reads丰度与匹配到该cluster上的所有reads丰度之比,也就是phased位点reads对整个phased cluster reads总丰度的贡献。
Phased number:匹配到 phased 位点的reads的个数。
参考文献:
Axtell, M J 2010. A method to discover phased siRNA loci. Methods Mol Biol 592: 59-70.
Fahlgren, N, M D Howell, K D Kasschau, E J Chapman, C. M Sullivan, J S Cumbie, S A Givan, T F Law, S R Grant, J L Dang, J C Carrington. 2007. High-throughput sequencing of Arabidopsis microRNAs: evidence for frequent birth and death of MIRNA genes. PLoS One 2(2): e219.郭清利. 基于高通量测序数据的黄瓜Small RNA识别和PhaseTank软件开发[D]. 西北农林科技大学,2014.朱成新,熊伟,莫蓓莘.植物中phasiRNA研究进展[J].生命科学,2018,30(08):831-839.
Nature:脂肪细胞的“叛徒”——脂肪细胞调控脂肪形成 | 10×单细胞案例解析
Hepatology:单细胞分析显示肝癌干细胞的异质性 | 10×单细胞案例解析
Nature Medicine:乳腺癌TIL单细胞测序分析揭示与改善预后相关的组织驻留T细胞亚型 | 10×单细胞案例解析
【10×单细胞应用解析】Science:儿童肾癌和成年人肾癌的不同发育起源