目前全球生物医药产业发展处于快速上升期,后疫情时代的医药健康行业,迎来新一轮的变革与机遇,其中基因治疗药物(包括DNA药物、mRNA药物、小核酸药物及基因修饰的细胞药物)被认为是未来医药领域发展的“潜力股”,是目前最受关注的创新医药领域之一,随着越来越多的基因治疗产品的上市,以及基因治疗技术的快速发展,基因治疗产业即将迎来高速发展期。增强基因治疗药物的疗效,提高其安全性及降低药物生产成本无疑会促进基因治疗药物的产业化发展,通过密码子优化来提高基因表达量是满足上述目标常用的策略之一。密码子优化指的是改变基因的密码子来提高目的蛋白的表达量,目前产业界针对密码子优化策略,主要考虑的是密码子的偏好性、GC含量或mRNA稳定性等因素,而对翻译动力学,翻译后蛋白折叠等方面考虑的少;很多情况下也只是单单考虑基因的表达量,而对于基因表达的稳定性、安全性等考虑较少。随着生命科学、生物技术的快速发展,人们对于机体生理生化机制认识更加深入,这也为密码子优化策略提供了新的指导,例如除了考虑密码子偏好性外,还得兼顾密码子的协调性、密码子敏感性等因素,本系列文章共分三篇,依次发布,就密码子优化原理、进展及其在DNA药物和mRNA药物中的应用做一概述。
动物体内有20种氨基酸,却有61种密码子,虽然蛋氨酸 (Met) 和色氨酸 (Trp) 各由一个密码子编码,但剩余的18种氨基酸有两种或多种密码子编码,有的氨基酸有多达6种密码子编码,存在同一种氨基酸具有两个或更多个密码子的现象,即密码子具有简并性。编码同一氨基酸的密码子被称为同义密码子,生物体自然状态下编码同一氨基酸时使用同义密码子的频率是不同的,有的密码子很少使用,被称为稀有密码子,有的却使用非常频繁,且具有明显的物种特异性,表明同义密码子的使用具有偏好性。为了提高转基因的表达率,可根据密码子偏好性理论对目的基因进行优化,例如将低频使用的密码子替换为高频率密码子。一则报道显示密码子优化将蛋白表达率提高了1000倍以上(Protein Expr Purif. 2012;83(1):37–46.),当然,绝大多数的报道的密码子优化成功的案例,提高蛋白表达率在几倍到几十倍之间。
基于密码子偏好性的优化策略是目前密码子优化方法中最常用的策略,也是密码子优化方法发展早期所采用最重要策略,即将目的基因中的稀有密码子替换为转基因宿主中高频密码子,该策略的理论基础是假定宿主中高频率的密码子对应着高丰度相应tRNA,高丰度相应tRNA会导致相对高的翻译效率,使蛋白质的合成速度加快,表现为蛋白产率的提高。基于上述理论的密码子优化策略在多肽、蛋白质药物,例如胰岛素、抗生素及其疫苗生产中发挥了积极作用。此外,也有通过密码子去优化(codon de-optimization)来提高特定蛋白复合物产率的,例如来自一家瑞士生物制药公司的研究人员Magistrelli G等人为了提高双特异性κλ抗体(IgGκλ)的产率,通过密码子去优化降低高表达λ轻链的表达量,这种去优化主要通过选择CHO细胞中不常用的密码子(即稀有密码子)来实现。双特异性κλ抗体由两条重链和两条不同的轻链组成,一条轻链为κ链,另一条为λ链,当κ链与λ链表达比例失衡的情况下,双特异性κλ抗体的产率将会降低,主要生产的为IgGκκ或IgGλλ。未经研究人员优化产率前,转基因后的CHO细胞表达λ轻链的比例明显高于κ轻链比例,产物中主要是IgGλλ抗体,双特异性κλ抗体产率很低。经过密码子去优化,IgGλλ抗体产率明显降低,双特异性κλ抗体产率显著提高。(mAbs. 2017;9(2):231–9.)另外,也可通过密码子优化来降低表达包装质粒间的同源重组,降低野生型病毒的形成风险,提高基因治疗病毒载体的安全性。例如:R Wagner 等人构建了序列来源与人类免疫缺陷病毒 1 型 (HIV-1) 和猿猴免疫缺陷病毒 (SIV) 的嵌合gag-pol基因,并做了密码子优化,改变了原来的DNA碱基序列情况下,不改变编码的蛋白序列。经优化的gag-pol基因可以在没有 Rev 和 5' 非翻译前导序列的情况下有效表达gag-pol基因,包装出的慢病毒载体滴度及其活性不受影响。通过生物实验,未检测到gag-pol表达质粒和目的基因质粒载体之间的同源重组事件,与未优化前相比,其重组频率至少降低了约 100 倍(Hum Gene Ther. 2000 Nov 20;11(17):2403-13. )。为了定量,研究人员已经提出了针对密码子偏好性的量化指标。Sharp PM 和Li WH 于 1987 年提出的一个经典指标,即密码子适应指数 (cAI),可以计算一组基因的密码子使用情况(Nucleic Acids Res 15(3):1281–1295)。cAI分析工具的工作原理为:高表达基因的序列作为参考,评估目的基因与参考基因序列的密码子使用频率的相符程度。若计算得到的CAI值较低,则推测目的基因在宿主细胞内的表达水平会较低,需要对目标基因进行密码子优化。现在也被用于从基因组序列数据中识别高表达的基因(Nucleic Acids Res. 15, 1281(1987).)。受该cAI指数的启发,dos Reis M及其同事提出了 tRNA 适应指数 (tAI) 的指标(Nucleic Acids Res 32(17):5036–5044)。tAI指标假设某些基因组中的 tRNA 基因拷贝数与细胞中的 tRNA 丰度高度相关(Trends Genet 16(7):287–289)。目前大多数密码子优化软件中使用最多的参数为cAI与tAI。虽然tAI是一个有价值的密码子偏性指标,但它通过tRNA基因拷贝数来预测细胞内tRNA浓度在方法某些特殊情况下可能不准确。从生理上讲,细胞内tRNA 的丰度是动态的,翻译率取决于其“供需”之间的平衡(Nucleic Acids Res 38(14):4778–4787),若某种情况下某一同义密码子使用频率过高,则可能使其被迅速消耗导致其丰度明显降低。为了准确解释 tRNA 的细胞动力学,Pechmann 和 Frydman 在 2013 年设计了归一化翻译效率 (normalized translational efficiency,nTE) 量表,该量表将细胞内tRNA丰度和密码子最优性之间的竞争考虑在内(Nat Struct Mol Biol 20(2):237–243)。2015年,Presnyak及其同事提出了一种度量方法,该方法利用酵母中密码子在转录本上出现的频率和mRNA半衰期之间的皮尔逊相关性推导出一个R值(R-value),即密码子使用频率与mRNA稳定性(半衰期)相关系数(CSC)(Cell 160(6):1111–1124)。2016 年,Bazzini 及其同事在一篇研究mRNA密码子组成和翻译如何影响斑马鱼、非洲爪蟾、小鼠和果蝇的mRNA 稳定性的论文中提出了转录组中显著的氨基酸偏向性可能是由于同义密码子影响 mRNA 稳定性造成的,作者通过利用mRNA 半衰期与单个转录本中编码的氨基酸之间的Pearson 相关系数推导出氨基酸稳定系数 (amino acid stabilization coefficient,ASC) ,作为氨基酸最优性的一个定量指标(EMBO J. 35(9):2087–2103)。后续针对CSC和ASC指标的研究也证明密码子组成及其氨基酸组成都与mRNA稳定性有关。2019年,Hia F等人发表针对人类细胞的研究结果显示,半衰期更长的mRNA富含更多第三位碱基为G或C的密码子(GC3),而半衰期短的mRNA含更多第三位碱基为A或U的密码子(AU3),表明GC3为最佳密码子,而AU3为非最佳密码子。此外,此研究数据显示GC3含量的增加会导致GC含量的增加,这表明GC3和GC含量也可以用作人类细胞中mRNA稳定性的评价指标(EMBO Rep 20(11):e48220)。随着密码子偏好性研究的深入,开发出能够准确且简便的量化与mRNA 稳定性相关的指标至关重要。转录、翻译是一系列非常复杂的过程,有必要通过实验等手段进一步研究分析密码子偏好性与密码子最优性。(图片来源:thoughtco)
密码子优化策略发展经历了从简单到复杂的一个过程,即最初将目的基因中密码子均替换为高频密码子的简单策略开始到目前更为复杂兼顾的更为全面的优化策略,例如兼顾密码子的协调性。这种将稀有密码子替换为高频密码子的密码子简单优化策略可能会带来一个意想不到的后果,即它可能破坏了重叠编码区的遗传调控信息,影响翻译延伸的局部速率,导致蛋白质构象的改变,蛋白构想的改变可能影响蛋白产物稳定性,干扰其活性,提高其免疫原性。目前有大量证据表明,同义密码子变化,甚至个别密码子变化,可以显著改变信使核糖核蛋白颗粒 (mRNPs) 的形成、mRNA 二级结构、mRNA 稳定性、microRNA与其的结合、蛋白质有效折叠(Int J Biochem Cell Biol. 2015;64:58–74.71. MBO Mol Med. 2016;8(5):442–57.72. Nat Rev Mol Cell Biol. 2018;19(1):20–30.)。兼顾密码子的协调性策略就是考虑到mRNA翻译成蛋白质过程中,mRNA中一些区域是细胞试图保持缓慢翻译的区域,这些区域被认为对蛋白质折叠很重要,机体进化过程中,可能采用了密码子偏好性等因素来降低翻译过程中此区域蛋白的翻译速率,使得蛋白得以正确折叠。翻译效率可以由几个参数决定,例如同工 tRNA 的可用性、翻译起始效率和翻译延伸率等。翻译起始步骤被认为是蛋白质生产的限速步骤(Curr Protoc Mol Biol 125(1):e79. Proc Natl Acad Sci USA 116:15023–15032)。在原核生物中,蛋白翻译起始过程由起始密码子上游的 Shine Dalgarno 序列促进,而在真核生物中,该过程由包含起始密码子的 Kozak 序列引导。除此之外,开放阅读框 (ORF) 5' 端的密码子组成已被证明与 ORF 的其余部分存在明显差异(Nucleic Acids Res 43(1):13–28)。研究表明,在编码区(CDS) 5′ 端存在一个“ramp”序列,位于起始密码子之后。因“ramp”序列的存在导致翻译效率在翻译起始阶段较慢,之后其速率加快。为何有机体会存在“ramp”序列,研究人员提出了一些假设,有人认为是细菌是为了降低翻译延伸速度,防止“核糖体交通堵塞(ribosomal traffic jams)”,有人认为是机体是为了降低mRNA二级结构。一些影响翻译起始和延伸的调控信号位于编码区的 5' 端。Verma 及其同事研究表明,编码序列的核苷酸 7-15(肽上的 3-5)位点强烈影响翻译效率(Nat Commun 10(1):5774)。Bentele 及其同事的研究表明,细菌蛋白质编码序列的前 5-10 个密码子包含大量稀有密码子,以减少翻译开始时的 mRNA 折叠(Mol Syst Biol 9:675)。此外,Tuller 及其同事的研究表明,在初始 10 个密码子的下游位置 ~ 30-50位置处存在一个低翻译效率区域,细胞以较慢的翻译起始为代价,以减少后续翻译过程中的核糖体碰撞(Cell 141(2):344–354))。除了上述ORF 5' 端富含稀有密码子情况的存在,其 3' 端富含稀有密码子的现象也有报道,研究人员推测,其3' 端稀有密码子的富集将使蛋白质在从核糖体释放之前有更多时间折叠,尤其对于折叠较为缓慢的蛋白质尤为重要,此外,在新生多肽的 C 端减缓或暂停翻译,还可以允许蛋白质辅因子或分子伴侣结合到新生多肽的近乎完整的序列上。也有研究人员提出 其3'端 稀有密码子可以作为 SsrA 标记信号(EMBO J. 2000;19:3762–3769.)。Presnyak 及其同事研究表明,mRNA 半衰期与酵母中的最佳密码子含量相关,指定了CSC指标。在后续研究中,表明这种效应是由与核糖体结合的 Dhh1p 引起的, Dhh1p 可作为核糖体速度传感器,当因为稀有密码子的影响导致翻译速率降低,即核糖体移动减慢时, Dhh1p 与核糖体的结合增多,这将促进其mRNA 的降解。有趣的是,在一项单独的研究中,Dhh1 的哺乳动物同源物 DDX6 的丢失并未导致 mRNA 稳定性和翻译水平之间的相关性发生变化,而是导致 microRNA 目标基因的表达产物增加。进一步的分析显示,在 DDX6 丢失后转录本的稳定性与密码子组成无关,这表明 DDX6 不会将 mRNA 稳定性与哺乳动物细胞中的密码子优化联系起来(Elife 7:e38014.)。另外,Courel 及其同事在哺乳动物细胞中的研究表明,DDX6 靶标是富含 GC 的 mRNA,它们富含最佳密码子而不是非最佳密码子。此外,该研究报告说,基因的 GC 含量影响人类细胞中 mRNA 的降解,富含 AU 和富含 GC 的 mRNA 通过不同途径降解。富含 GC 的 mRNA 通过 XRN1 从 5' 端降解,而富含 AU 的 mRNA 定位于 P 体(P-bodies),在那里它们以 3' 到 5' 的方式被 PAT1B 降解(Elife 8:e49708.)。还研究了 GC含量 以及 GC3 含量对 mRNA 表达和稳定性的影响。在对人体细胞的研究中,与 GC 含量的增加相比,GC3 含量的增加明显增加了 mRNA 稳定性和翻译效率(EMBO Rep 20(11):e48220.)。
为促进细胞与基因治疗领域的合作交流,更好的服务广大读者朋友,我们组建了这个专业的细胞与基因治疗行业交流群,长按下方二维码,添加小编微信进群。由于申请人数较多,添加微信时请备注:院校/企事业单位名称—专业/职务—姓名。如果您是PI/ 教授/主管及以上职务,还请注明。
2022年基因治疗药物面临的5大挑战
AAV制备工艺面临的挑战及应对策略(上篇)
上海两会|构建多元支付体系,让患者用得起细胞治疗药物
纽福斯第二款眼科体内基因治疗新药获FDA孤儿药认定
全球mRNA疗法迎爆发期 国内药企能否突破壁垒迎头赶上?
锦篮基因公司AAV基因治疗产品获临床试验注册审评受理
核酸药物生物分析方法研究进展
持续火热的mRNA药物背后的工艺开发
2021年中国生物医药及其细分领域投融资情况数据汇总分析
腾讯突击入股赚翻,基因治疗CDMO第一股杀入,下一个十年十倍行业
重组表达生物制品生产中的病毒杂质清除验证策略研究进展
JP摩根大会:基因治疗与细胞治疗最引人注目,一天数项大额合作
合成生物学——未来已来,开启“造物”时代
市一医院开启中国首个先天性黑蒙基因治疗研究
一文读懂mRNA疫苗关键技术流程
mRNA疫苗:脂质纳米粒递送系统及其辅料的深度梳理
细胞治疗CDMO——CXO的新兴细分赛道,细胞治疗大时代的蓝海
创新药深度研究:星火燎原,核酸药崛起的前夜
声明:本文旨在知识共享,所有内容仅学术交流研究,不构成任何建议。