查看原文
其他

基因治疗药物(DNA药物及mRNA药物)设计专题 | 密码子优化原理、进展及其在基因治疗中的应用(中篇)

张爱龙 细胞与基因治疗领域 2022-06-21

目前全球生物医药产业发展处于快速上升期,后疫情时代的医药健康行业,迎来新一轮的变革与机遇,其中基因治疗药物(包括DNA药物、mRNA药物、小核酸药物及基因修饰的细胞药物)被认为是未来医药领域发展的“潜力股”,是目前最受关注的创新医药领域之一,随着越来越多的基因治疗产品的上市,以及基因治疗技术的快速发展,基因治疗产业即将迎来高速发展期。增强基因治疗药物的疗效,提高其安全性及降低药物生产成本无疑会促进基因治疗药物的产业化发展,通过密码子优化来提高基因表达量是满足上述目标常用的策略之一。密码子优化指的是改变基因的密码子来提高目的蛋白的表达量,目前产业界针对密码子优化策略,主要考虑的是密码子的偏好性、GC含量或mRNA稳定性等因素,而对翻译动力学,翻译后蛋白折叠等方面考虑的少;很多情况下也只是单单考虑基因的表达量,而对于基因表达的稳定性、安全性等考虑较少。随着生命科学、生物技术的快速发展,人们对于机体生理生化机制认识更加深入,这也为密码子优化策略提供了新的指导,例如除了考虑密码子偏好性外,还得兼顾密码子的协调性、密码子敏感性等因素,本系列文章共分三篇,依次发布,就密码子优化原理、进展及其在DNA药物和mRNA药物中的应用做一概述。

一、密码子偏好性
动物体内有20种氨基酸,却有61种密码子,虽然蛋氨酸 (Met) 和色氨酸 (Trp) 各由一个密码子编码,但剩余的18种氨基酸有两种或多种密码子编码,有的氨基酸有多达6种密码子编码,存在同一种氨基酸具有两个或更多个密码子的现象,即密码子具有简并性。编码同一氨基酸的密码子被称为同义密码子,生物体自然状态下编码同一氨基酸时使用同义密码子的频率是不同的,有的密码子很少使用,被称为稀有密码子,有的却使用非常频繁,且具有明显的物种特异性,表明同义密码子的使用具有偏好性。为了提高转基因的表达率,可根据密码子偏好性理论对目的基因进行优化,例如将低频使用的密码子替换为高频率密码子。一则报道显示密码子优化将蛋白表达率提高了1000倍以上(Protein Expr Purif. 2012;83(1):37–46.),当然,绝大多数的报道的密码子优化成功的案例,提高蛋白表达率在几倍到几十倍之间。

(图片来源:josephbonello.com)
基于密码子偏好性的优化策略是目前密码子优化方法中最常用的策略,也是密码子优化方法发展早期所采用最重要策略,即将目的基因中的稀有密码子替换为转基因宿主中高频密码子,该策略的理论基础是假定宿主中高频率的密码子对应着高丰度相应tRNA,高丰度相应tRNA会导致相对高的翻译效率,使蛋白质的合成速度加快,表现为蛋白产率的提高。基于上述理论的密码子优化策略在多肽、蛋白质药物,例如胰岛素、抗生素及其疫苗生产中发挥了积极作用。
此外,也有通过密码子去优化(codon de-optimization)来提高特定蛋白复合物产率的,例如来自一家瑞士生物制药公司的研究人员Magistrelli G等人为了提高双特异性κλ抗体(IgGκλ)的产率,通过密码子去优化降低高表达λ轻链的表达量,这种去优化主要通过选择CHO细胞中不常用的密码子(即稀有密码子)来实现。双特异性κλ抗体由两条重链和两条不同的轻链组成,一条轻链为κ链,另一条为λ链,当κ链与λ链表达比例失衡的情况下,双特异性κλ抗体的产率将会降低,主要生产的为IgGκκ或IgGλλ。未经研究人员优化产率前,转基因后的CHO细胞表达λ轻链的比例明显高于κ轻链比例,产物中主要是IgGλλ抗体,双特异性κλ抗体产率很低。经过密码子去优化,IgGλλ抗体产率明显降低,双特异性κλ抗体产率显著提高。(mAbs. 2017;9(2):231–9.)另外,也可通过密码子优化来降低表达包装质粒间的同源重组,降低野生型病毒的形成风险,提高基因治疗病毒载体的安全性。例如:R Wagner 等人构建了序列来源与人类免疫缺陷病毒 1 型 (HIV-1) 和猿猴免疫缺陷病毒 (SIV) 的嵌合gag-pol基因,并做了密码子优化,改变了原来的DNA碱基序列情况下,不改变编码的蛋白序列。经优化的gag-pol基因可以在没有 Rev 和 5' 非翻译前导序列的情况下有效表达gag-pol基因,包装出的慢病毒载体滴度及其活性不受影响。通过生物实验,未检测到gag-pol表达质粒和目的基因质粒载体之间的同源重组事件,与未优化前相比,其重组频率至少降低了约 100 倍(Hum Gene Ther. 2000 Nov 20;11(17):2403-13. )。
为了定量,研究人员已经提出了针对密码子偏好性的量化指标。Sharp PM 和Li WH 于 1987 年提出的一个经典指标,即密码子适应指数 (cAI),可以计算一组基因的密码子使用情况(Nucleic Acids Res 15(3):1281–1295)。cAI分析工具的工作原理为:高表达基因的序列作为参考,评估目的基因与参考基因序列的密码子使用频率的相符程度。若计算得到的CAI值较低,则推测目的基因在宿主细胞内的表达水平会较低,需要对目标基因进行密码子优化。现在也被用于从基因组序列数据中识别高表达的基因(Nucleic Acids Res. 15, 1281(1987).)。
受该cAI指数的启发,dos Reis M及其同事提出了 tRNA 适应指数 (tAI) 的指标(Nucleic Acids Res 32(17):5036–5044)。tAI指标假设某些基因组中的 tRNA 基因拷贝数与细胞中的 tRNA 丰度高度相关(Trends Genet 16(7):287–289)。目前大多数密码子优化软件中使用最多的参数为cAI与tAI。
虽然tAI是一个有价值的密码子偏性指标,但它通过tRNA基因拷贝数来预测细胞内tRNA浓度在方法某些特殊情况下可能不准确。从生理上讲,细胞内tRNA 的丰度是动态的,翻译率取决于其“供需”之间的平衡(Nucleic Acids Res 38(14):4778–4787),若某种情况下某一同义密码子使用频率过高,则可能使其被迅速消耗导致其丰度明显降低。为了准确解释 tRNA 的细胞动力学,Pechmann 和 Frydman 在 2013 年设计了归一化翻译效率 (normalized translational efficiency,nTE) 量表,该量表将细胞内tRNA丰度和密码子最优性之间的竞争考虑在内(Nat Struct Mol Biol 20(2):237–243)。2015年,Presnyak及其同事提出了一种度量方法,该方法利用酵母中密码子在转录本上出现的频率和mRNA半衰期之间的皮尔逊相关性推导出一个R值(R-value),即密码子使用频率与mRNA稳定性(半衰期)相关系数(CSC)(Cell 160(6):1111–1124)。
2016 年,Bazzini 及其同事在一篇研究mRNA密码子组成和翻译如何影响斑马鱼、非洲爪蟾、小鼠和果蝇的mRNA 稳定性的论文中提出了转录组中显著的氨基酸偏向性可能是由于同义密码子影响 mRNA 稳定性造成的,作者通过利用mRNA 半衰期与单个转录本中编码的氨基酸之间的Pearson 相关系数推导出氨基酸稳定系数 (amino acid stabilization coefficient,ASC) ,作为氨基酸最优性的一个定量指标(EMBO J. 35(9):2087–2103)。后续针对CSC和ASC指标的研究也证明密码子组成及其氨基酸组成都与mRNA稳定性有关。
2019年,Hia F等人发表针对人类细胞的研究结果显示,半衰期更长的mRNA富含更多第三位碱基为G或C的密码子(GC3),而半衰期短的mRNA含更多第三位碱基为A或U的密码子(AU3),表明GC3为最佳密码子,而AU3为非最佳密码子。此外,此研究数据显示GC3含量的增加会导致GC含量的增加,这表明GC3和GC含量也可以用作人类细胞中mRNA稳定性的评价指标(EMBO Rep 20(11):e48220)。
随着密码子偏好性研究的深入,开发出能够准确且简便的量化与mRNA 稳定性相关的指标至关重要。转录、翻译是一系列非常复杂的过程,有必要通过实验等手段进一步研究分析密码子偏好性与密码子最优性。

(图片来源:thoughtco)

密码子优化策略发展经历了从简单到复杂的一个过程,即最初将目的基因中密码子均替换为高频密码子的简单策略开始到目前更为复杂兼顾的更为全面的优化策略,例如兼顾密码子的协调性。这种将稀有密码子替换为高频密码子的密码子简单优化策略可能会带来一个意想不到的后果,即它可能破坏了重叠编码区的遗传调控信息,影响翻译延伸的局部速率,导致蛋白质构象的改变,蛋白构想的改变可能影响蛋白产物稳定性,干扰其活性,提高其免疫原性。
目前有大量证据表明,同义密码子变化,甚至个别密码子变化,可以显著改变信使核糖核蛋白颗粒 (mRNPs) 的形成、mRNA 二级结构、mRNA 稳定性、microRNA与其的结合、蛋白质有效折叠(Int J Biochem Cell Biol. 2015;64:58–74.71. MBO Mol Med. 2016;8(5):442–57.72. Nat Rev Mol Cell Biol. 2018;19(1):20–30.)。兼顾密码子的协调性策略就是考虑到mRNA翻译成蛋白质过程中,mRNA中一些区域是细胞试图保持缓慢翻译的区域,这些区域被认为对蛋白质折叠很重要,机体进化过程中,可能采用了密码子偏好性等因素来降低翻译过程中此区域蛋白的翻译速率,使得蛋白得以正确折叠。
二、密码子协调性
翻译效率可以由几个参数决定,例如同工 tRNA 的可用性、翻译起始效率和翻译延伸率等。翻译起始步骤被认为是蛋白质生产的限速步骤(Curr Protoc Mol Biol 125(1):e79. Proc Natl Acad Sci USA 116:15023–15032)。在原核生物中,蛋白翻译起始过程由起始密码子上游的 Shine Dalgarno 序列促进,而在真核生物中,该过程由包含起始密码子的 Kozak 序列引导。除此之外,开放阅读框 (ORF) 5' 端的密码子组成已被证明与 ORF 的其余部分存在明显差异(Nucleic Acids Res 43(1):13–28)。
研究表明,在编码区(CDS) 5′ 端存在一个“ramp”序列,位于起始密码子之后。因“ramp”序列的存在导致翻译效率在翻译起始阶段较慢,之后其速率加快。为何有机体会存在“ramp”序列,研究人员提出了一些假设,有人认为是细菌是为了降低翻译延伸速度,防止“核糖体交通堵塞(ribosomal traffic jams)”,有人认为是机体是为了降低mRNA二级结构。
一些影响翻译起始和延伸的调控信号位于编码区的 5' 端。Verma 及其同事研究表明,编码序列的核苷酸 7-15(肽上的 3-5)位点强烈影响翻译效率(Nat Commun 10(1):5774)。Bentele 及其同事的研究表明,细菌蛋白质编码序列的前 5-10 个密码子包含大量稀有密码子,以减少翻译开始时的 mRNA 折叠(Mol Syst Biol 9:675)。此外,Tuller 及其同事的研究表明,在初始 10 个密码子的下游位置 ~ 30-50位置处存在一个低翻译效率区域,细胞以较慢的翻译起始为代价,以减少后续翻译过程中的核糖体碰撞(Cell 141(2):344–354))。
除了上述ORF 5' 端富含稀有密码子情况的存在,其 3' 端富含稀有密码子的现象也有报道,研究人员推测,其3' 端稀有密码子的富集将使蛋白质在从核糖体释放之前有更多时间折叠,尤其对于折叠较为缓慢的蛋白质尤为重要,此外,在新生多肽的 C 端减缓或暂停翻译,还可以允许蛋白质辅因子或分子伴侣结合到新生多肽的近乎完整的序列上。也有研究人员提出 其3'端 稀有密码子可以作为 SsrA 标记信号(EMBO J. 2000;19:3762–3769.)。
Presnyak 及其同事研究表明,mRNA 半衰期与酵母中的最佳密码子含量相关,指定了CSC指标。在后续研究中,表明这种效应是由与核糖体结合的 Dhh1p 引起的, Dhh1p 可作为核糖体速度传感器,当因为稀有密码子的影响导致翻译速率降低,即核糖体移动减慢时, Dhh1p 与核糖体的结合增多,这将促进其mRNA 的降解。
有趣的是,在一项单独的研究中,Dhh1 的哺乳动物同源物 DDX6 的丢失并未导致 mRNA 稳定性和翻译水平之间的相关性发生变化,而是导致 microRNA 目标基因的表达产物增加。进一步的分析显示,在 DDX6 丢失后转录本的稳定性与密码子组成无关,这表明 DDX6 不会将 mRNA 稳定性与哺乳动物细胞中的密码子优化联系起来(Elife 7:e38014.)。另外,Courel 及其同事在哺乳动物细胞中的研究表明,DDX6 靶标是富含 GC 的 mRNA,它们富含最佳密码子而不是非最佳密码子。此外,该研究报告说,基因的 GC 含量影响人类细胞中 mRNA 的降解,富含 AU 和富含 GC 的 mRNA 通过不同途径降解。富含 GC 的 mRNA 通过 XRN1 从 5' 端降解,而富含 AU 的 mRNA 定位于 P 体(P-bodies),在那里它们以 3' 到 5' 的方式被 PAT1B 降解(Elife 8:e49708.)。还研究了 GC含量 以及 GC3 含量对 mRNA 表达和稳定性的影响。在对人体细胞的研究中,与 GC 含量的增加相比,GC3 含量的增加明显增加了 mRNA 稳定性和翻译效率(EMBO Rep 20(11):e48220.)。
三、密码子敏感性:

Johan Elf 等人研究发现,tRNA 的可用性在不同的生长和压力条件下会发生显着变化,当有几个同功受体tRNA“读取”同义密码子时,其中一些密码子的“读取”频率对氨基酸缺乏(氨基酸饥饿)非常敏感,tRNA与氨基酸结合能力随氨基酸浓度降低呈现快速降低状态,而其他密码子的翻译速率对氨基酸饥饿可能非常不敏感,tRNA与氨基酸结合能力随氨基酸浓度降低呈现缓慢降低状态,也就是说在氨基酸缺乏等压力条件下,不同的tRNA与对应氨基酸的结合能力强弱变化不同,表明密码子具有敏感性,基于这一发现,人们提出了饥饿状态下的CAI指数,可以用于识别细胞在饥饿条件下的必要表达基因(Science. 2003 Jun 13;300(5626):1718-22)。此外,Sibylle E Wohlgemuth 等人的试验结果也表明了密码子具有敏感性,并根据 tRNA 可用性估算密码子翻译率,展示了 tRNA 在整个大肠杆菌基因组翻译过程中敏感性的动态变化(Nucleic acids research 41.17 (2013): 8021-8033.)。

在氨基酸浓度及tRNA浓度充足的情况下,一般认为,蛋白的翻译速度与对应tRNA浓度、氨基酸浓度呈正相关性。但在氨酰化tRNA合成反应底物氨基酸缺乏的情况下,相应的氨酰化tRNA合成受阻,氨酰化tRNA将成为蛋白的合成的限速因素。由于密码子的频率与密码子敏感性之间没有对应关系,高频密码子也许敏感性较高,这种情况下当对应的氨基酸缺乏时,其对应的氨酰tRNA的浓度会相对很低,这样反而限制了蛋白的合成。而密码子优化过程中基于传统CAI的理论,倾向于将基因中的低频和中频密码子替换成高频密码子,这样在蛋白合成初期明显提高氨基酸利用率的情况下,也容易导致蛋白合成后期对应氨基酸的缺乏,若优化策略中替换后高频密码子同时又是高敏感密码子,这将会导致蛋白合成速率降低,不利于蛋白持续高效的合成。然而,若此时对应的同义低频率密码子同时又是低敏感性密码子,那么在对应氨基酸缺乏情况下,可能其可用性并不低,反而可能高于高频密码子,这时相比高频密码子,其同义低频密码子反而能够提高蛋白质的合成速率。

基于密码子敏感性的优化策略还未广泛用于密码子优化中。目前,只报道了原核生物中密码子的敏感性研究数据,未见在它物种中的研究数据。不过,随着密码子敏感性研究的深入和相关数据的进一步完善,相信不久将来,密码子敏感性理论将在蛋白表达优化方面得到有效推广。

四、调整基因序列

(1)CpG 含量

不同物种基因组的CG含量是不同的,同一物种,基因组不同位置的DNA片段CG含量也不同,例如CG平均含量约为40%的人类基因组中,某些DNA片段上CG含量可高达60%以上,而在另一些区域则只有33%左右。这种CG含量的差别,在基因表达的调控和基因突变上可能扮演着重要的角色,人们将DNA中富含双核苷酸“CG”的区域,称为“CpG岛”(CpG island),该序列在细菌、病毒基因组中出现的频率较高,平均每16对核苷酸出现一次;而在脊椎动物基因组的出现频率则大大降低。脊椎动物免疫系统通过识别CpG特征结构来识别微生物DNA并产生针对抗原的免疫反应。Barbara A Konkle 等人(Blood. 2021 Feb 11;137(6):763-774)以AAV8为载体在开发血友病B基因治疗药物时,针对搭载的目的基因FIX-Padua CDS区进行密码子优化,密码子优化的结果是:与优化前基因相比,明显提高了FIX-Padua基因表达量,但是由于此优化引入了更多的CpG岛,高CpG岛序列可为强免疫原激活机体免疫反应。当AAV8载体经机体免疫细胞吞或感染进入其胞内后,其未甲基化的高CpG岛含量DNA被细胞内涵体膜上TLR9识别结合,启动固有免疫应答,进而激活适应性免疫应答,加强了针对AAV8衣壳等药物成分的免疫反应,导致该药物的疗效降低,药效持久性大打折扣。因此,基因治疗药物在进行密码子优化的时候,需要考虑降低CpG岛序列的引入。但是,DNA疫苗研发中,由于CpG岛序列是良好的免疫诱导成分,密码子优化时可兼顾提高CpG岛含量,这样可通过CpG岛加强疫苗的免疫原性,提高疫苗的预防效果。

(2)一些基序(motif)(或反式作用元件)

密码子进行优化时还需避免在ORF区出现一些不利于转录或翻译的基序,例如在原核生物中其优化后的ORF避免出现Shine-Dalgarno (SD序列)序列,否则,可能会导致核糖体的暂停,SD序列是原核生物mRNA中核糖体结合位点中的一段,它的作用是帮助核糖体同mRNA结合,使核糖体与起始密码子对齐,进而启动蛋白的合成,不同种类原核生物其SD序列存在一定差异,其中,E.coli菌株的SD序列为AGGAGGU;避免出现核糖核酸酶 E 位点,它可以影响 mRNA 结构的稳定性;避免Chi-site 延伸重组热点,它在原核生物中能够增加自然重组的几率,可能会影响人工重组蛋白的表达。在真核生物中则需要考虑到TATA 盒、Kozak 序列、隐蔽剪切位点等因素,其中TATA 盒和Kozak 序列对转录的启动有着重要的影响;隐蔽剪切位点一旦被激活会造成不符合预期的mRNA剪接模式。此外,真核生物密码子优化时,还需考虑非依赖Rho因子的翻译终止序列;而在真核生物中需考虑避免提前出现polyA基序,防止蛋白质翻译提前终止。

(3)其它考虑因素

除了上述需要考虑的因素外,还包括一些其他的影响因素。例如,需要降低重复序列,过多的重复序列会增加基因合成的难度。就mRNA二级结构来看,避免形成颈环发卡结构,特别是要避免与核糖体结合位点处形成二级结构。限制性酶切位点需要根据实际情况进行修改排除,以免与其它位置需要用到的酶切位点产生冲突,影响基因克隆方面的操作。

基因治疗中的病毒载体和非病毒载体搭载的基因表达一般采用真核生物的转录翻译系统,而细菌载体搭载的治疗基因一般采用的是原核转录翻译系统,但原核生物和真核生物的转录翻译过程存在很多不同,因此在密码子优化具体方法上存在一些差异,要根据对应宿主的具体情况予以调整,提高治疗性蛋白的表达水平。

密码子优化已被广泛应用于基因治疗药物的开发中,是基因治疗药物研发的重要内容之一。随着生命科学研究的进一步深入,生物技术的快速发展,后续会有越来越多的理论和策略来指导密码子优化。

五、密码子优化软件及网站介绍
... ...(更新中,敬请关注)
为促进细胞与基因治疗领域的合作交流,更好的服务广大读者朋友,我们组建了这个专业的细胞与基因治疗行业交流群,长按下方二维码,添加小编微信进群。由于申请人数较多,添加微信时请备注:院校/企事业单位名称—专业/职务—姓名。如果您是PI/ 教授/主管及以上职务,还请注明。


广告:


往期文章推荐:

基因治疗关键质量属性分析技术进展

基因治疗中的核酸药物及非病毒递送载体的研究进展

一次性技术在基因治疗领域的8项经验

医药行业研发风向标JPM2022会议大盘点,细胞基因疗法大时代序章奏响

诺华2021年财报:基因疗法Zolgensma营收超13亿美元,Kymriah营收近6亿美元

猪器官移植人体,基因编辑公司启函生物转向细胞疗法

基因编辑的干细胞替代疗法完成首例患者给药,用于治疗糖尿病

CAR-T疗法,CDE发指导原则

密码子优化原理、进展及其在基因治疗中的应用(上篇)

工信部等九部门发布“十四五”医药工业发展规划,重点发展免疫细胞/干细胞/基因治疗等产品,重点开发超大规模细胞培养、核酸疫苗等技术

一年时间7项AAV基因疗法临床试验(IND)申报获受理,国内AAV基因疗法加速发展

重磅消息|基因治疗老年性黄斑变性取得突破性进展

2021年亮点汇总 | 基因疗法治疗遗传性视网膜疾病

一针1348万元!“史上最贵药”AAV基因治疗药物将落地中国

AAV制备工艺面临的挑战及应对策略(上篇)

2022年基因治疗药物面临的5大挑战

上海两会|构建多元支付体系,让患者用得起细胞治疗药物

纽福斯第二款眼科体内基因治疗新药获FDA孤儿药认定

全球mRNA疗法迎爆发期 国内药企能否突破壁垒迎头赶上?

锦篮基因公司AAV基因治疗产品获临床试验注册审评受理

核酸药物生物分析方法研究进展

持续火热的mRNA药物背后的工艺开发

2021年中国生物医药及其细分领域投融资情况数据汇总分析

腾讯突击入股赚翻,基因治疗CDMO第一股杀入,下一个十年十倍行业

重组表达生物制品生产中的病毒杂质清除验证策略研究进展

JP摩根大会:基因治疗与细胞治疗最引人注目,一天数项大额合作

合成生物学——未来已来,开启“造物”时代

市一医院开启中国首个先天性黑蒙基因治疗研究

细胞治疗CDMO——CXO的新兴细分赛道,细胞治疗大时代的蓝海

创新药深度研究:星火燎原,核酸药崛起的前夜

产业制造崛起,基因治疗、细胞治疗等成新趋势
全球小核酸药物市场竞争分析
细胞治疗行业研究报告解读
中国细胞治疗产业发展白皮书


声明:本文旨在知识共享,所有内容仅学术交流研究,不构成任何建议。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存