查看原文
其他

科研 | PNAS: 多顺反子基因在绿藻中的广泛表达

微科盟Sunshine 代谢组metabolome 2022-09-22

点击蓝字↑↑↑“微科享”,轻松关注不迷路

编译:微科盟Sunshine,编辑:微科盟Tracy、江舜尧。

微科盟原创微文,欢迎转发转载。

导读
多顺反子基因在原核生物中普遍存在,在真核生物中被认为是极其罕见的,而全长转录本异构体长读测序(Iso-Seq)的发展促进了其发展。利用Iso-Seq,研究人员发现了数百个核基因多顺反子在两个不同的绿藻物种中表达。本研究使用一系列独立的方法来验证多个蛋白质是从数百个位点的共同转录本翻译而来的。染色质免疫沉淀分析通过组蛋白H3标记上赖氨酸4的甲基化证实转录只从上游基因开始。对多腺苷化的[PolyA]尾巴和PolyA信号序列的定量检测证实,转录仅在下游基因之后结束。共表达分析发现,多顺反子位点内的开放阅读框架(ORF)几乎完全相关,与共享转录本中的表达一致。对于许多多顺反子位点,来自两个ORF的末端肽都是从蛋白质组学数据集中鉴定出来的,这与独立翻译是一致的。人工合成的多顺反子基因对在体外被转录和翻译,以概括从一个共同转录本产生的两种不同的蛋白质。莱茵衣藻(C.reinhardtii)、红绿藻(C.zofingiensis)和其他5个物种之间的顺反子基因对的保守性表明,这种机制在进化上可能是古老的,在绿藻谱系中具有重要的生物学意义。

论文ID


原名:Widespread polycistronic gene expression in green algae译名:多顺反子基因在绿藻中的广泛表达
期刊:Proceedings of the National Academy of Sciences of the United States Of America
IF:9.412发表时间:2021.02通讯作者:Sabeeha S. Merchant, Sean D Gallaher
通讯作者单位:美国加州大学洛杉矶分校

实验设计



实验结果


1.两种不同绿藻多顺反子表达的鉴定
作者对莱茵衣藻和红绿藻的mRNA长阅读、单分子序列进行分析,发现有数百个等位基因与两个或更多ORF重叠。经过广泛的人工筛选,这个列表被削减到莱茵衣藻的87个位点和红绿藻的173个位点,其中两个或更多的基因(最多6个)被发现与一个转录本相关。图1A和图1B分别显示了莱茵衣藻和红绿藻的双顺反子基因的测序数据。除了这些位点,还注意到许多其他位点,其中一个或多个ORF交替为多顺反子和单顺反子。对于莱茵衣藻,作者鉴定出完全多顺反子的位点和部分多顺反子的位点一样多,在这项研究中,他们将重点放在两个不同物种中专门的多顺反子转录本上,以评估它们是否代表真正的多顺反子基因。有几个标准确定了多顺反子mRNA的真实性。

图1 三种藻类的多顺反子位点视图
展示了来自单分子、mRNA长读测序(Iso-Seq)、mRNA短读测序(RNA-Seq)、蛋白质组(肽)的质谱分析以及带有H3K4me3下拉的ChIP-Seq分析(H3K4me3)的测序数据。每一项分析的数据都与三种远亲藻类的适当基因组组合进行了比对:(A)莱茵衣藻、(B)红绿藻和(C)盐藻。对于Iso-Seq、RNA-Seq由不同的颜色表示:正链为浅蓝色,负链为粉红色。A=红色,C=橙色,G=蓝色,T=绿色。对于基因模型,粗线表示ORF,中间线表示UTR,细线表示内含子。 2.多顺反子基因比单顺反子基因更小,间隔更紧密
首先,作者比较了候选多顺反子基因座和单顺反子基因座的性质。在莱茵衣藻中,上游ORFs和下游ORFs都明显小于单顺反子基因的ORFs。在红绿藻的上游ORF、下游ORF和单顺反子ORF中也观察到了类似的结果。然而,多顺反子转录本的结合蛋白编码能力(通过将一个多顺反子转录本编码的所有ORF的长度相加计算)与莱茵衣藻的单顺反子ORF相当,而大于红绿藻的单顺反子ORF。接下来,作者量化了共线基因的ORF间距离,并绘制了这些距离在单顺反子和多顺反子基因对中的分布。莱茵衣藻和红绿藻多顺反子基因对与其他共线基因对相比,差异显著。虽然多顺反子ORF的间距比其他共线基因更紧密,但uORF(发现于基因5’非翻译区的非编码ORF)在莱茵衣藻(中位数为139nt)和红绿藻(中位数为151nt)中被发现更接近其相应的初级ORF。 3.终止密码子的用法和阅读框架与单独的ORF一致
ORF由起始密码子和终止密码子描述。作者检查了多顺反子上游和下游基因终止密码子的比例,并将这些比例与单顺反子基因的比例进行了比较。近一半的ORF使用Opal终止密码子,多顺反子和单顺反子基因之间的差异很小,终止密码子的比例没有显著差异。如果阅读框之间的ORF间序列被均匀地分开,研究者则认为两个ORF在框架内。当作者评估上游ORF与下游ORF的相对阅读框时,发现约1/3的ORF在两种藻类的框架内。综上所述,这些模式反驳了终止密码子通读假说。
4.多顺反子位点的基因高度共表达,具有共同的启动子和多腺苷化的Poly(A)尾巴
真正的多顺反子mRNA应该来自最多5’端ORF上游的单个启动子,而人工多顺反子转录本将来自每个基因的独立启动子。首先,作者尝试利用染色质免疫沉淀和测序(ChIP-Seq)技术对多顺反子转录本的启动子区域进行定位,检测赖氨酸4在组蛋白H3(H3K4me3)上的甲基化。免疫沉淀测序读数的覆盖率与输入测序读数的覆盖率进行比较,并用于计算基因组中每个核苷酸的H3K4me3富集分数,作者将这些分数的分布绘制为单顺反子、多顺反子上游和多顺反子下游基因的箱式图(图2A)。多顺反子上游基因与单顺反子上游基因无显著差异。相比之下,多顺反子下游基因的平均得分明显较低。这一证据与这87个基因座仅在上游基因起始处发生的转录启动是一致的。其次,作者调查了与每个转录本相关的Poly(A)尾巴和多腺苷酸信号序列的出现情况。如果一对共线基因被表达为多顺反子转录本,那么下游的基因而不是上游的基因会有一条PolyA尾巴。根据这一逻辑,多顺反子基因对中的上游基因应该比相应的下游基因具有更少的多腺苷酸信号序列。莱茵衣藻最常用的信号是“UGUAA”。接下来确定红绿藻是否使用相同的多聚腺苷酸信号序列。同样的序列,UGUAA,在红绿藻中的频率是任何其他5-聚体的两倍以上。之所以使用这个宽泛的范围,是因为Iso-Seq数据表明转录本有大量可供选择的Poly(A)拖尾,可捕获转录本注释的3’端上游的假定的聚腺苷酸信号序列。带有多聚腺苷酸信号的基因片段被分成多顺反子上游、多顺反子下游和单顺反子基因(图2B和E)。作者给定这两个物种的鸟嘌呤(GC)相对含量,计算了在100nt的序列中偶然出现UGUAA5-mer的预期频率,图中用虚线表示。多顺反子下游基因中多聚腺苷酸信号的实际频率与单顺反子基因中的频率几乎相同;相反,在多顺反子上游基因中,多聚腺苷酸信号的频率显著降低,且低于或等于随机机会预期的频率。接下来,作者使用Iso-Seq数据来评估转录物多聚腺苷酸。紧接在8个或更多A的上游的100个核苷酸通过计算从未修剪的Iso-Seq读取中分离出来,映射到基因组,并相对于映射到相同位点的Iso-Seq读取的总数进行量化(图2C和F)。与莱茵衣藻的87个位点和红绿藻的173个位点表达带有单个Poly(A)尾巴的多顺反子转录本的观点一致,作者几乎没有观察到与上游基因3’端的聚(A)相邻的阅读片段(0.1%),反而观察到多顺反子下游基因的聚(A)相邻读数(85.6%)与单顺反子基因(86.8%)相当。接下来,从RNA-Seq数据集中分别估计了每个基因的转录本丰度。对于真正的多顺反子mRNA,预计上游和下游基因的丰度估计几乎相同。为了验证这一点,作者计算了皮尔逊相关系数(PCC)值,以比较广泛条件下多顺反子基因对转录丰度估计的相似性。为了比较,他们还计算了所有共线基因对的PCC值(图2D和G)。莱茵衣藻和红绿藻多顺反子基因对的PCC值中位数均为0.97。其余共线基因对的PCC值广泛分布于+1和-1之间,莱茵衣藻的中位数为0.02,红绿藻的中位数为0.003。根据这些结果,作者得出结论:莱茵衣藻的87个转录子和红绿藻的173个转录子是真实的,并且是唯一的多顺反子。

图2 多顺反子表达的证据
(A)用抗H3K4me3的抗体对莱茵衣藻DNA进行CHIP-SEQ,以确定转录起始点。(B)对于单顺反子、多顺反子上游和多顺反子下游基因,确定在每个计算注释的基因模型的最后100nt内存在UGUAA多腺苷酸信号序列。(C)Poly(A)尾巴是通过在Iso-Seq读数中出现8个或更多顺序A来鉴定的。将含Poly(A)的读数的覆盖率与每个基因模型的3’端1000nt内的Iso-Seq读数的总覆盖率进行比较。(D)确定共线性基因对,并计算每个基因对在红绿藻特定范围的RNASeq样本中的皮尔逊相关系数(Pcc)。(E)与B一样,对h的单顺反子、多顺反子上游和多顺反子下游基因的聚信号序列进行了分析。(F)对莱茵衣藻的聚(A)拖尾进行了单顺反子、多顺反子上游的分析,和多顺反子下游基因。(G)对红绿藻的单顺反子和多顺反子基因对的共表达进行了分析。 5.对上游和下游基因中的多肽进行鉴定,证实两个ORF都是翻译的
作者对上游和下游基因中的多肽进行鉴定,证实两个ORF都是翻译的。在证明了上游和下游的多顺反子基因被共转录成一个共同的mRNA后,他们想知道这两个ORF是否都被翻译了,所以他们查询了莱茵衣藻和红绿藻的蛋白质组学数据库,以确定与来自多顺反子mRNAs中任何ORF的蛋白相对应的肽。除了鉴定内肽外,作者还鉴定了N-端肽(N-末端Met不在预测的ORF中的Lys或Arg密码子下游)或C-端肽(C-末端残基与预测的ORF中的终止密码子相邻的那些)。图3A给出了一个来自Zofingiensis的多顺反子位点的例子,其中从上游ORF和下游ORF都发现了多个不同的肽。这些肽不仅证实了两个ORF在体内都被翻译,而且还证实了这两个蛋白是单独翻译的,上游ORF的C端肽和下游ORF的N端肽证明了这一点。考虑到所有的多顺反子位点,研究者从56%的上游ORF和56%的下游ORF中检测到至少一个明确指定的肽(图3B)。对于Zofingiensis,研究者从42%的上游ORF和52%的下游ORF检测到肽(图3C)。这比检测到的单顺反子表达蛋白的百分比要低:莱茵衣藻和红绿藻分别为72%和82%。然而,多顺反子表达的蛋白明显小于单顺反子蛋白,并且较小的蛋白质被检测到的频率比较大的蛋白质低。作者还检测了N-末端或C-末端多肽可以识别的多顺反子蛋白的百分比。在莱茵衣藻中,8%的多顺反子下游ORF检测到N-末端肽(单顺反子ORF为4%),7%的多顺反子上游ORF检测到C-末端肽(图3B)。在红绿藻中,5%的多顺反子下游ORF被N-末端多肽鉴定,4%的多顺反子上游ORF被C-末端多肽鉴定(图3C)。这些结果与两个独立ORF的独立翻译一致,而不是单个多肽的翻译后切割。

图3 蛋白质组学分析证实了多顺反子ORF的表达
用胰蛋白酶消化细胞裂解产物的质谱分析鉴定了莱茵衣藻和红绿藻蛋白质组中的多肽。(A)为了使用这种方法鉴定的多肽可视化,鉴定的多肽序列被“反向翻译”成电子计算机中的核苷酸序列,并被定位到适当的基因组。如图1所示,来自红绿藻的一个多顺反子基因对与基因模型相对照,绘制了肽和等位序列数据。突出显示了来自上游基因的一个C-末端肽和来自下游基因的两个N-端肽。(B)至少一个明确指定的单顺反子、多顺反子上游和多顺反子下游的基因产物被检测到。由N-末端或C-末端多肽检测到的基因产物的子集分别标记为“N-Term”(中心)和“C-Term”(右)。(C)对于单顺反子基因、多顺反子上调基因和多顺反子下调基因,从红绿藻检测到的蛋白质的百分比与B的描述完全相同。 6. 多顺反子翻译是体外重演的,可用于合成报告基因和可选标记
以上蛋白质组学数据验证了至少两种绿藻体内mRNAs的多顺反子功能。为了评估多顺反子mRNA是否可以在经典的体外系统中翻译,研究者构建了几个多顺反子基因对的编码结构,并将它们作为模板提供给体外转录和翻译耦合反应。小麦胚芽提取物的放射性标记翻译产物如图4所示。作者鉴定了与六个结构的ORF相对应的翻译产物对(与预测大小相差<20%),计算每对基因上游产物与下游基因产物丰度的比值,平均为1.6:1(最大值=3.5:1,最小值=0.6:1)。作为比较,含有脑心肌炎病毒(EMCV)内部核糖体进入位点(IRES)的双顺反子载体表达的基因产物比例为0.7:1。为了区分外源序列是否可以从这些mRNA翻译而来,作者用一个编码报告蛋白(mVenus,来源于黄色荧光蛋白)或一个药物选择标记蛋白(核糖体蛋白RPS14-EMR,它赋予药物依米丁耐药性)的基因替换了上游和/或下游的ORF。作者发现来自红绿藻JC02G12225/JC02G12220(图5)的多顺反子mRNA的上游或下游位置都能正确合成mVenus。同样,在莱茵衣藻中,双顺反子基因对的ORF间区域足以同时表达mVenus和RPS14-EMR(图5)。

图4 多顺反子基因的体外转录和翻译
根据相应的DNA模板合成对应于多顺反子转录本的RNA,并在含有放射性标记蛋氨酸(Met)的小麦胚芽提取物中进行体外翻译。产物用变性聚丙烯酰胺凝胶电泳分离,荧光显影。上游基因产物用白色三角形表示,下游基因产物用黑色三角形表示。多顺反子基因对及其预期大小以表格形式呈现。莱茵衣藻的基因鉴定以“Cre”开头,红绿藻的基因鉴定以“Cz”开头。

图5 外源报告蛋白和药物选择蛋白的多顺反子表达
蛋白质在体外从多顺反子转录本中翻译而来,与图4完全相同。泳道 1 中的蛋白是从作为对照的红绿藻双顺反子基因座的内源序列翻译的(与图 4,泳道 6 相同)。在泳道3和4中,该位点的上游 ORF 或下游ORF被黄色荧光蛋白衍生物 mVenus替换。在泳道2中,莱茵衣藻双顺反子位点(Cre10.g466000/Cre10.g465950) 的上游ORF和下游ORF均被mVenus和RPS14-EmR取代,这对药物依米丁产生抗性。
7. 类Kozak序列的作用
作者使用体外翻译系统来测试下游ORF的合成是否依赖于上游ORF的合成,而评估这一点的一种机制是修饰上游ORF的Kozak类序列。作者对与开放阅读框JAC02G35025相关的内源序列(ACA、CCT、GTC、ATG、CTG)进行了改造,使之更强或更弱(基于对红绿藻中所有Kozak类序列的计算分析)。内源序列产生上下游产物的比例为1:1(图6)。

图6 操纵上游类似Kozak的序列改变了表达式
合成了三个不同版本的红绿藻多顺反子位点,并进行了体外耦合转录和翻译,每个构建体都包含了对于基因 1 (Cz02g35025, 11.0 kDa) 和基因 2 (Cz02g35030, 49.0 kDa)来说相同的 ORF 和 ORF 间序列。构建体之间仅改变了靠近第一个起始密码子的核苷酸。泳道1中的构建物包含内源Kozak类序列,而泳道2和3中的构建体分别包含更强或更弱的Kozak类序列。
8.多顺反子位点在绿藻谱系中的保守性
当亿万年前分化的物种之间的遗传特征被保存下来时,这些特征很可能在这些物种的生理上发挥重要作用。鉴于多顺反子表达在两个叶绿体中普遍存在,希望确定这种现象是否延伸到这些物种之外。作者利用莱茵衣藻和红绿藻多顺反子位点编码的蛋白质序列作为查询条件,在其他5个绿藻物种中搜索候选多顺反子位点,这些基因座编码的蛋白质序列被用来搜索其他5个绿藻物种的候选多顺反子基因座。结果表明,这些多顺反子基因座编码的蛋白质序列与其他5个绿藻物种的候选多顺反子基因位点相同。系统发育树显示了这些物种之间的进化距离,在莱茵衣藻的87个多顺反子基因座中,有27个至少有另外一个绿藻物种具有一对共线ORF(同一链上的相邻ORF),与莱茵衣藻的相应对具有显著的序列相似性(比特得分≥30)(图7A)。来自莱茵衣藻的7个基因座在3个或更多物种中具有匹配性,其中多达24个基因座与研究中关系最密切的物种V.carteri相匹配。当使用来自红绿藻的序列作为查询时,173个多顺反子基因座中的42个在至少一个其他物种中相匹配(图7B)。在与莱茵衣藻和红绿藻的多顺反子ORF序列高度相似的其他共线性ORFs中的观察表明,这些ORF在这些物种的多顺反子转录本上表达。然而,来自另一个绿藻物种D.Salina的Iso-Seq数据证实,保守的共线ORF确实在4个位点的多顺反子转录本上表达。图1C显示了盐藻中的一个这样的双顺反子位点。作者对23个保守的位点进行表达序列标签(EST)分析,证实共线ORF存在于多顺反子转录本上。因此,对于一个位点的子集,似乎多顺反子的表达在绿藻谱系中的进化过程中已经保守了超过700My。

图7 其他植物中多顺反子位点的保守性
以莱茵衣藻和红绿藻多顺反子转录本上编码的一对蛋白质序列为查询序列,寻找其他绿藻物种中潜在的保守多顺反子位点。(A)莱茵衣藻和(B)红绿藻,其中每一行代表一个多顺反子位点,每一列代表一个不同的绿藻物种。 9.多顺反子表达的功能意义
多顺反子表达的功能意义鉴于多顺反子基因表达是保守的,从单个转录本表达两个或多个ORF的生物学意义可能是什么?多顺反子ORF是否功能偶联?相对于整个蛋白质组,更高比例的多顺反子转录本编码的蛋白功能未知。只有58个来自莱茵衣藻的多顺反子基因产物(33%)和25个来自红绿藻基因产物(32%)进行功能注释,并在Phytozome数据库中进行预测,在美国国家生物技术信息中心(NCBI)保守结构域数据库中,来自莱茵衣藻的77个多顺反子基因产物(44%)和来自红绿藻的167个多顺反子基因产物(43%)具有可识别的结构域。大多数多顺反子转录本(莱茵衣藻为83%,红绿藻为79%)编码一种或多种功能未知的蛋白质。其中许多“先驱”蛋白(即功能仍有待发现的新型蛋白)是保守的:约44%的莱茵衣藻和60%功能未知的红绿藻至少一种蛋白具有序列相似性。为了确定共转录基因产物之间是否存在可识别的功能联系,作者手动管理了52个多顺反子转录本,其ORF至少包含一个保守结构域。作者鉴定了几个可能参与核酸交易的多顺反子转录本,其中,REx1(Cre16.g683483/Cre16.g6834950)已在莱茵衣藻中进行了实验分析。在这个位点,一个转录本编码两种蛋白质,REx1-S和REx1-B,这两种蛋白质都参与DNA修复。两个ORF中较小的一个(Cre16.g683483)编码REx1-S,它与DNA修复/转录因子II(TFIIH)复合体的核心亚单位酿酒酵母TFB5具有序列同源性。这个ORF在目前的莱茵衣藻基因注释中没有注释,这在很大程度上依赖于在转录本中优先排序最长ORF的预测算法。莱茵衣藻的REx1双顺反子位点在红绿藻、C. subellipsoidea和V. carteri是保守的(图7A)。另一个例子是JC09G28170/JC09G28180位点,它编码两种可能与RNA降解有关的蛋白质。在JC04G11210/JC04G11215和Cre12.g513245/Cre12.g513254位点编码的蛋白质中的保守结构域暗示它们在细胞分裂中起作用。JC04G11215含有保守的SMC结构域,可能参与染色体分离。Cre12.g513254含有一个保守结构域,暗示它可能是参与DNA修复的金属β-内酰胺酶蛋白,Cre12.g513245可能作为后期促进复合亚单位蛋白,参与有丝分裂,CH19G07080/CH19G07100可能参与重组。JC19G07080含有GINS复合体蛋白Psf3的α螺旋结构域,Psf3是参与染色体复制的复合体的一个亚单位,而JC19G07100包含与Cre重组酶C端催化结构域相似的结构域。有一对蛋白质在不同的藻类物种中非常保守,在所研究的其他五种绿藻中,作者在其中四种都发现了它(图7A)。这个双顺反子位点编码两种可能在线粒体中发挥作用的蛋白质。莱茵衣藻和红绿藻中的SDHAF3样蛋白包括亮氨酸/酪氨酸/精氨酸(LYR)基序,该基序存在于线粒体(20)的附件或组装因子中,LYR基序在多顺反子表达蛋白中很常见。除了与Tom22类蛋白共表达的SDHAF3同源蛋白外,作者还鉴定了另外四个在双顺反子转录本上编码的LYR基序蛋白亚家族。其中三个亚家族在莱茵衣藻和红绿藻中都有多顺反子表达的同源基因。LYR基序蛋白是各种靶复合物的组装因子,已被认为参与调节线粒体呼吸以适应营养状态。双顺反子转录本中LYR基序蛋白的保守可能指向与藻类呼吸复合体组装有关的保守功能连接。


讨论


1.  多顺反子转录本的发现和验证
作者在这项工作中描述了在两种不同的绿藻中意外出现数百个多顺反子mRNA的原因,这是基于以下发现:1)两个或多个ORF被编码在一个转录本上,2)同一转录本中的两个或多个ORF被独立地翻译成蛋白质。关于第一点,作者最初利用Iso-Seq数据通过跨越两个或更多基因的长转录本的存在来鉴定多顺反子基因,然后通过多条独立的证据线来证实多顺反子基因(表一),包括H3K4me3标记,该标记为这些多顺反子基因对(图2A)、Poly(A)序列和仅在最多3‘ORF下游的多腺苷基化信号(图2B,C,E,和F)识别了这些多顺反子基因对的单个启动子(图2A),以及仅在最多3’ORF下游的Poly(A)和聚腺苷酸信号(图2B)。综上所述,这些数据反对对相邻基因的转录本进行人工融合。关于第二点,作者调查了全细胞蛋白质组,以证明同一转录本中的两个或更多ORF每个都被翻译成蛋白质。他们发现从一些ORF中捕获N-末端和C-末端的肽不利于ORF间序列的剪接以获得基因。此外还对多顺反子RNA中典型的ORF的小蛋白有新的认识。当多顺反子基因被用于体外耦合转录和翻译时,确实合成了两种蛋白质。在MOST 5‘ORF上操纵Kozak类序列导致的翻译产物比例变化不仅验证了它们的独立合成,而且为合成生物学应用中的工程选择打开了大门。表1 观察结果和方法摘要


2.  多顺反子表达的机制
在真核生物和感染它们的病毒中,有几种多顺反子表达的方法是已知的或假设的。EMCV等病毒多顺反子表达的机制是通过IRES。对于带有IRES的多顺反子mRNA,核糖体既可以组装在5’端,用于上游基因的翻译,也可以组装在ORF间区的IRES上,用于下游基因的翻译。作者不能排除在绿藻mRNAs中存在IRES的可能性,然而,用IRES预测工具分析莱茵衣藻和红绿藻多顺反子基因座的ORF间区发现,这些序列的IRES预测得分明显低于确定的IRES序列,并且与基因间序列的随机延伸相比,它们并不能作为IRES发挥作用。作者认为IRES的复杂二级结构可能是无效的,强化也可能抑制多顺反子表达的内源性机制。在小核糖核酸病毒中,多顺反子的表达是由一个“2A元件”介导的。这些元件通常用于表达载体,以从单个转录本产生多个蛋白质。在这些载体中,2A元件被克隆在ORF对之间的框架中,当核糖体通过生成的mRNA翻译时,它不能在2A元件的C末端形成肽键,而继续翻译转录本的其余部分。其效果是从单个mRNA分子翻译出两个或更多独立的多肽。在莱茵衣藻和红绿藻中,作者发现多顺反子ORF通常被一个或多个终止密码子分隔,此外,在2/3的情况下,ORF在框架外。此外,作者观察到许多多顺反子编码蛋白的N-末端和C-末端多肽(图5),并且改变上游ORF的Kozak-like序列会影响两个基因产物的比率。这些观察结果支持这样的模型,即从多顺反子转录本中存在两个或多个独立的ORF独立翻译。因此,作者排除了2A类元件是驱动绿藻多顺反子基因表达的主要机制。本文已经描述了另外两种机制,它们可以促进来自单个转录本的多个基因产物的表达。第一种被称为“终止后重新启动”,核糖体终止上游基因的翻译,但40S亚单位,如果不是整个核糖体,仍然与mRNA结合。如果附近有合适的起始密码子,核糖体可以重新启动第二个ORF的翻译。第二种机制,称为“泄漏核糖体扫描”,对起始密码子的核糖体扫描将以某一频率绕过上游ORF的起始密码子,而从下游ORF的起始密码子开始翻译。这两种模式,终止后重新启动和泄漏核糖体扫描,并不一定是相互排斥的,通过改变双顺反子结构中上游基因的Kozak类序列,作者在体外能够影响上下游基因产物的比例(图6),这表明起始密码子的序列背景是一个重要因素。如果翻译后重新启动是主要机制,那么改变上游ORF的Kozak类序列应该会影响这两种蛋白的整体表达,但不会影响它们的比例。在以前的工作中,研究人员将uORF(即位于基因5‘UTR的短ORF)的出现描述为可以抑制蛋白质合成的调节特征。在莱茵衣藻的CTH1位点,转录产物的扩展异构体有10个uORF,而翻译允许的异构体没有uORF,转录本是一个很差的翻译模板。带有uORF的基因在莱茵衣藻中很常见;近3/4的注释基因有一个或多个uORF。虽然uORF可能会抑制其对应的初级ORF的翻译,但它们显然不会取消翻译,否则,75%的基因将处于功能沉默状态。这表明莱茵衣藻有能力翻译其转录本中第一个起始密码子下游的ORF;这一特征很可能是基因表达的内在组成部分。如果莱茵衣藻和可能的其他叶绿素植物已经进化到翻译uORF下游的ORF,那么这种能力允许从同一转录本表达两个或更多ORF,证明了多顺反子在绿藻谱系中的表达与uORF现象是连续存在的。
3.  多顺反子表达的应用
绿藻已被推广为生产生物燃料、药品、疫苗和有毒物质修复的载体。这些工程中许多都依赖于多个转基因的表达(例如,在多步代谢途径中避免有毒中间体的积累)。在特定化学计量比中生产两种或两种以上蛋白质也是有用的,例如在需要等摩尔生产两种多肽的杂二聚体中。多顺反子基因表达可能是实现转基因表达目标的有价值的工具。图5描述了该工具在体外翻译系统中的适用性,可以在一个多顺反子结构中合成一个药物选择蛋白和一个报告蛋白。多顺反子表达在莱茵衣藻和红绿藻等物种中普遍存在的发现,对于那些试图在绿藻中设计转基因表达的人来说,应该是一个巨大的福音。用外源转基因替换上游或下游的ORF并不能消除多顺反子的表达,这一观察结果表明ORF本身对于多顺反子的表达本身并没有什么特殊之处。最后,通过改变上游基因的Kozak类序列,有可能影响两种翻译产物的比例,这些发现应该有助于加快藻类工程的进展。
4.与其他物种中多顺反子表达的比较
锥虫和线虫中的多顺反子表达需要每个ORF上游剪接前导序列的反式剪接。作者在莱茵衣藻和红绿藻的Iso-Seq数据中均未观察到反式剪接的证据。使用poly(A)选择的mRNA进行Iso-Seq方案,代表收集RNA时细胞中存在的所有成熟的多聚腺苷酸化mRNA;反式剪接,如果存在,当它们与基因组组装比对时,在Iso-Seq数据中转录本的5′端应该很容易观察到错配碱基。因此,本研究中描述的现象似乎与线虫和锥虫中描述的多顺反子表达完全不同。最近,研究者在几种真菌和树木棉花中观察到多顺反子的表达。在这两项研究中,多顺反子的表达都是“不完整的”,多顺反子位点也是单顺反子表达的。为了这项工作的目的,作者选择关注莱茵衣藻的87个基因座和红绿藻的173个基因座,观察到它们的表达完全是多顺反子的。然而,值得注意的是,研究者在莱茵衣藻中发现了至少87个额外的位点,在这些位点中既可以观察到单顺反子表达,也可以观察到多顺反子表达。在这些位点,部分Iso-Seq读数包括两个或多个ORF,但另一部分Iso-Seq读数较小,仅包括上游或下游ORF。这两个绿藻物种的部分和全部多顺反子位点的存在,使这项工作有别于以前在树木、棉花和真菌上的研究。随着在古生体的叶绿体中发现普遍存在的多顺反子表达,可以证明多顺反子表达在植物、动物和真菌中是重要的。而越来越明显的是,多顺反子表达在真核和原核基因表达中都扮演着重要的角色。


原文链接:  
https://pubmed.ncbi.nlm.nih.gov/33579822/

----------微科盟更多推荐---------- 


   免费生信作图平台——生科云




长按左侧二维码 

进入生科云

生科云所有分析工具可以免费使用,不收取任何直接或间接费用;您还可以在微信上联系微生态老师,随时获取免费的指导,帮助您解决分析时遇到的问题;专业的生信分析团队,持续添加、更新、优化生信云上的分析工具,集成多种生信分析流程,一键批量生成主流科研图,帮您节省时间,有更多的时间探究生物学意义。


----------微科盟精彩文章----------
 


科研 | 巴黎大学:乳腺癌细胞与前脂肪细胞共培养并暴露于环境污染物二噁英:对斑马鱼体内和体外的研究

科研 | Mol Brain:基于iTRAQ的蛋白质组学分析揭示甲状腺素用于治疗创伤性脑损伤的新证据


   
   

如果需要原文pdf,请扫描以下二维码,加助理获取




微科享期待与您交流更多蛋白组学问题

(联系蛋白组学老师即可申请入群)



请关注下列二维码

了解更多蛋白组学知识


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存