150年前一项微不足道的研究,成长为收获9次诺贝尔奖的最前沿
加星标,才能不错过每日推送!方法见文末动图
2023年诺贝尔生理学或医学奖揭晓,卡里科(Katalin Karikó)和魏斯曼(Drew Weissman)因为在核苷修饰碱基方面(促成研发mRNA疫苗)作出突破性贡献而获奖。
核糖核酸(RNA)研发也经历了从微不足道到无比重要的过程。早在1869年米歇尔就发现了RNA,但直到20世纪50年代科学家才开始对其进行系统研究。在这150年里,因RNA方面的研究而荣获诺贝尔生理学或医学奖、化学奖至少9次。本文回顾了RNA发现、发展和应用过程,以期能对RNA生物重要性有一个较为全面的理解。
核素的发现米歇尔 (Friedrich Miescher) 出生于瑞士一个学术氛围浓厚的家庭,父亲和叔叔都是巴塞尔大学的教授,他自小就对科学充满巨大兴趣。17岁时,米歇尔进入巴塞尔大学学习医学,打算遵从父亲建议完成医学培训后主攻耳科,却中途而废。这一方面是由于米歇尔对医学兴趣有限,另一方面则是他儿时耳部感染导致听力不佳,对临床工作造成不便,他最终选择从事更感兴趣的基础科学研究。1868年秋,米歇尔来到德国图宾根霍佩-塞勒 (Ernst Felix Immanuel Hoppe-Seyler) 的实验室,开启了他的研究生涯。霍佩-塞勒是著名的生理学家和化学家,也是现代生物化学开创者之一,在血液成分、血红蛋白性质等领域均作出重要贡献。米歇尔坚定地认为解决诸多生命问题已不能仅依靠传统的观察法,而应更多运用化学方法,这也是他加入霍佩-塞勒实验室的主要原因。作为霍佩-塞勒唯一的学生,米歇尔决定研究细胞的化学成分。由于当时淋巴细胞是此类研究的主要材料来源,最初米歇尔试图从动物淋巴结分离淋巴细胞,但收率较低,很难达到实验所需的细胞量。后来在霍佩-塞勒建议下,他从外科绷带新鲜脓液中分离白细胞。这一改进收到奇效,很容易地获得足够实验材料。米歇尔最初关注细胞的蛋白质成分,这是当时的主流研究方向。然而在一次实验过程中他意外发现一种加酸沉淀,随后再加碱沉淀又溶解的现象,这一特性与当时已知的蛋白质都不相同,他推测可能存在一种新物质。米歇尔经全面研究和分析最终确定这种物质尽管有部分性质与蛋白质相似,但绝非蛋白质。他对这种物质进行元素构成分析,发现其含有碳、氢、氧、氮和磷元素,而非蛋白质的碳、氢、氧、氮和硫元素,进一步证明这是一种新物质,该物质位于细胞核,故命名核素 (nuclein)[1]。米歇尔还进一步确定磷是以有机结合的磷酸存在,而非游离的无机磷酸,从而确定了核素的第一种成分。
1869年底,米歇尔将这一重大发现汇报给霍佩-塞勒,但后者对此持怀疑态度。为慎重起见,霍佩-塞勒又指派助手重复米歇尔的实验,确认无误后才最终于1871年和米歇尔的结果同时发表。尽管米歇尔最初认定核素是一种重要物质,但在研究几年无重大突破后最终还是放弃了该方向。1889年,德国病理学家奥尔特曼 (Richard Altmann) 利用胃蛋白酶和碱水解方法成功去除核素中绝大部分蛋白质成分,将剩余显酸性成分正式命名为核酸 (nucleic acid) 。此时核酸包含DNA和RNA两种,接下来需要研究其化学组成。
几种碱基的鉴定科塞尔 (Albrecht Kossel) 出生于德国罗斯托克一个富裕家庭,从小就对化学和植物学产生浓厚兴趣,并于1872年进入斯特拉斯堡大学学习医学。在这里他受到多位科学大师的熏陶,其中就包括霍佩-塞勒。1877年,科塞尔成为霍佩-塞勒的研究助理,开启自己的科研生涯,并在接触到核素后决定解析其化学构成。为研究核素组成,科塞尔首先需要解决实验材料问题。他与当地一家屠宰场建立密切关系,由后者为其提供实验材料——牛的胰腺。科塞尔的整个研究过程耗费了30头牛的100 kg胰腺和200 L的酸 (如盐酸等),以期从中发现其化学组成。艰苦付出终于获得回报,1885年科塞尔从核酸中分离得到两种生物碱基:一种是1844年由德国化学家马格努斯 (Heinrich Gustav Magnus) 发现的鸟嘌呤 (guanine, G) ;另一种为新物质,科塞尔将其命名为腺嘌呤 (adenine, A),以纪念材料来源——胰腺。几年后科塞尔又从屠宰场获得另一批器官——胸腺,并于1893年鉴定出第3种新碱基,再次根据来源命名为胸腺嘧啶 (thymine, T)。
1894年,科塞尔发现构成核酸的第4种碱基,命名为胞嘧啶 (cytosine, C)。1901年,科塞尔的学生阿斯科利 (Alberto Ascoli) 发现第5种碱基——尿嘧啶(uracil, U)。至此,构成核酸的碱基鉴定完毕,科塞尔也由于在核酸化学组成成分研究上的重大贡献 (碱基发现) 获得1910年诺贝尔生理学或医学奖,这也是诺贝尔生理学或医学奖早期唯一一次颁发给纯基础研究,说明委员会对科学发展独有的深邃洞察力。
核酸的发现20世纪初,研究人员发现从多种生物材料中获得的核酸在组成上存在一定的差异,最终确定自然界存在两种核酸,酵母核酸和胸腺核酸。这两种核酸均含4种碱基,其中A、G和C相同,而酵母核酸含U,胸腺核酸含T。此外,这两种核酸的糖有些许不同,但具体差异却不得而知。列文 (Phoebus Aaron Theodore Levene) 是出生于俄国的美籍生物化学家,学医期间对生物化学产生浓厚兴趣,1893年移民到美国,先后在哥伦比亚大学和纽约大学州立医院学习和工作,期间还曾在著名生物化学家科塞尔和费歇尔 (Emil Fischer) 实验室工作过,熟悉核酸组成的研究方法。1905年,列文成为新成立的洛克菲勒大学医学院的一员,开启系统研究核酸的生涯。1909年,列文和助手雅各布斯 (Walter Jacobs) 从酵母核酸中鉴定出D-核糖 (1891年由费歇尔实验室首先合成,但对作用未深入研究),并证明其是核酸基本成分之一,推翻了传统观点 (当时认为L-木糖是核酸组成成分)。20年后列文又发现胸腺核酸所含戊糖为脱氧核糖[2]。酵母核酸和胸腺核酸获得基于结构而非来源的新名称:酵母核酸为核糖核酸,即RNA;胸腺核酸为脱氧核糖核酸,即DNA。至此,RNA三种基本成分磷酸、核糖和碱基鉴定完毕 (图1) 。
尽管1909年就完成了RNA成分的鉴定,但其生物功能一直未得到科学界足够重视。一方面当时缺乏研究生物大分子的强有力工具;另一方面在于思维惯性,如20世纪初小分子研究较为成熟,想当然地认为酶的本质是小分子,待蛋白质研究成为主流时,自然而然又认为遗传物质为蛋白质。因此,RNA研究进展缓慢。但是,50年代这种状况有了巨大改观,RNA研究迎来春天。
RNA与蛋白质合成帕拉德 (George Emil Palade) 出生于罗马尼亚一个知识分子家庭,父亲为大学哲学教授,母亲是中学教师,在这种氛围熏陶下,他对自然科学尤其是医学兴趣浓厚。他在布加勒斯特大学医学院学习期间,原本想成为一名临床医生,但出于对基础医学的挚爱而投身科研事业。1946年初,帕拉德来到美国,幸运结识纽约大学的克劳德 (Albert Claude) 教授,随后学习了克劳德发明的细胞组分分离方法和新兴的电子显微镜技术,为进一步研究奠定基础。20世纪50年代初,帕拉德利用细胞组分分离方法将肝脏组织匀浆离心获得两部分颗粒状结构:一部分为容易沉淀的大颗粒,包含已知的线粒体等细胞器;另一部分是难沉淀的小颗粒,命名为微粒体。1955年,帕拉德发现微粒体总附着于内质网膜,据此将内质网分为粗糙内质网 (附着微粒体) 和光滑内质网 (不附着微粒体)。帕拉德通过使用去污剂溶解微粒体膜证明了其由蛋白质和RNA两部分构成,并将其命名为核蛋白颗粒 (ribonucleoprotein particle, RNP)。由于RNA携带遗传信息,推测RNP可能参与蛋白质合成,微粒体于1958年被重新命名为核糖体 (ribosome),相应的RNA被称为核糖体RNA (ribosomal RNA, rRNA)[3]。1974年,帕拉德由于在核糖体等亚细胞结构领域的发现而分享了诺贝尔生理学或医学奖。扎梅奇尼克 (Paul Charles Zamecnik) 出生于美国俄亥俄州克利夫兰市一个捷克后裔家庭。受经济大萧条影响,扎梅奇尼克为了稳定而选择医学专业,最终却因对基础科学的浓厚兴趣从事了科学研究。当时多个研究小组都在探索蛋白质合成机制,而扎梅奇尼克对此也具有浓厚兴趣。1953年,扎梅奇尼克成功制备出第一个大鼠肝脏匀浆无细胞体系,使蛋白质体外实验操作大大简化,同时借助当时研究蛋白质生物合成的两种常规方法 (氨基酸放射性标记和高速离心) 加快研究进程。采用无细胞体系,扎梅奇尼克先后确定蛋白质合成场所为核糖体和氨基酸活化形式氨基酰腺苷酸。1956年,扎梅奇尼克进一步将放射性标记氨基酸加入无细胞体系,通过离心处理获得含有高放射性的部分,除含有活化氨基酸外还包含某种RNA。最初该RNA在pH值为5.2时出现沉淀,因此命名为pH5 RNA,后确定其参与活化氨基酸转运工作,重新命名为转运RNA (transfer RNA, tRNA) [4]。1957年底,克里克提出遗传信息流动中心法则,确定RNA在DNA将信息传递给蛋白质过程中发挥中介作用,但错误认为当时唯一已知的rRNA就是蛋白质合成模板。然而,法国巴斯德研究所雅各布 (François Jacob) 的研究激发了克里克剑桥大学同事布雷内 (Sydney Brenner) 的灵感,他敏锐意识到应存在新型RNA。布雷内首先将大肠杆菌在含重同位素 (13C和15N) 培养基中生长以保证所有物质均被标记,随后用T2噬菌体感染大肠杆菌后迅速转移到轻同位素 (12C和14N) 培养基 (还含有32P) 中培养一段时间,破碎细菌并进行密度梯度离心,结果发现只有重同位素标记的核糖体,表明噬菌体感染后没有新rRNA生成 (若有生成则必然有轻同位素标记的核糖体) 。对32P标记的物质检测发现其只存在于完整核糖体 (参与蛋白质合成),而不存在于分离开的核糖体大小亚基 (说明并非rRNA)。杂交实验进一步表明32P标记的物质不与大肠杆菌DNA互补,而是与噬菌体DNA互补,这些结果清晰表明新型RNA的存在[5]。1961年5月13日,布雷内和沃森小组在Nature上发表背靠背文章,确定一种新型RNA的发现。与此同时,雅各布和莫诺 (Jacques Monod) 将这种RNA命名为信使RNA (messenger RNA, mRNA)。至此,参与蛋白质合成的3种RNA均被发现 (图2),它们在蛋白质生物合成过程中如何发挥作用不久后也得到完美解决。
图2 蛋白质合成相关的3种RNA发现。(a)发现三种RNA的科学家(图片分别来自nasonline.org、findagrave.com和britannica.com);(b)三种RNA在蛋白质合成中的作用(图片来自bioninja)
早在1954年,理论物理学家伽莫夫 (George Gamow) 基于立体化学模型从逻辑分析上提出密码子概念,即每3个碱基对应一个氨基酸。1959年,克里克和布雷内在理论上确立遗传密码由3个连续核苷酸构成,即三联体密码,并于1961年用设计精美的实验证实了这种观点,确定3个核苷酸与氨基酸的具体对应关系。尼伦伯格 (Marshall Warren Nirenberg) 出生于美国纽约布鲁克林,自小对生物学就有浓厚兴趣,1957年获得密歇根大学生物化学博士学位后进入国立卫生研究院开展博士后研究,于1960年成为研究院成员,并开始关注mRNA的信使作用。尼伦伯格首先构思出多聚核苷酸策略来确定遗传密码,他获得多聚U(即…UUUUU…)的RNA序列并让其助手马特伊 (J. Heinrich Matthaei) 负责完成,最终合成出只包含苯丙氨酸的多肽链,据此确定UUU对应苯丙氨酸。采用相似策略,他们又确定AAA对应赖氨酸、CCC对应脯氨酸。1964年,尼伦伯格和莱德 (Philip Leder) 开发出三联体-核糖体结合实验,实验原理为3个核苷酸在体外亦可与携带对应氨基酸的tRNA结合,两者随后与核糖体形成复合物,从而无法穿越相应孔径的过滤膜。采用这一策略,他们将除终止密码子外剩余密码子 (前后共61种编码氨基酸的密码子) 完成解析[6]。与此同时,威斯康星大学印度裔美国生物化学家霍拉纳 (Har Gobind Khorana) 采用另一策略也完成了密码子破译。霍拉纳拥有高超的化学和酶学研究能力,因此成功合成一系列二核苷酸重复和三核苷酸重复的多核苷酸,成为解析密码子的基础。如以UC重复多核苷酸为模板最终合成丝氨酸-亮氨酸交替出现的多肽链,结合其他信息最终确定UCU编码丝氨酸,而CUC编码亮氨酸[7]。霍拉纳借助这一策略最终完成61种对应氨基酸的密码子和3种终止密码子的解析。霍利 (Robert Holley) 则将目标转向tRNA,经过3年多的艰苦努力最终完成酵母丙氨酸-tRNA全序列 (77个核苷酸) 测序。这一工作解决了两个基本科学问题:tRNA与氨基酸结合的问题 (氨基酸臂);tRNA携带氨基酸准确运输到核糖体参与蛋白质合成的问题 (mRNA密码子和tRNA反密码子互补配对)。1968年,3位科学家因“对遗传密码及其在蛋白质合成过程方面作用的解释”而分享诺贝尔生理学或医学奖。2000年前后,拉马克里斯南(Venkatraman Ramakrishnan)、施泰茨 (Thomas Steitz) 和尤纳斯 (Ada E. Yonath) 解析了核糖体RNA在蛋白质合成过程中的重要作用,并因此分享2009年诺贝尔化学奖。至此,3种RNA的生物功能和作用机制得到完美解决。
RNA的遗传功能1944年,艾弗里细菌转化实验证明DNA是遗传因子。1952年,赫尔希 (Alfred Hershey) 和同事利用噬菌体侵染实验证明DNA是遗传物质。RNA作为遗传物质的生物功能不久之后也得到证实。烟草花叶病毒 (Tobacco mosaic virus, TMV) 是一种植物病毒,主要由外部的衣壳蛋白和内部的单链RNA构成。1955年,德裔美国生物化学家弗兰克尔-康拉特 (Heinz Fraenkel-Conrat) 将两种成分拆分,并证明单独RNA可以完成致病,而单独衣壳蛋白则缺乏此功能。他还进一步将两种不同病毒的RNA和衣壳蛋白交叉重组形成“杂种”病毒,发现感染宿主后的表型与病毒RNA相关,与蛋白无关,这些结果清晰表明TMV的遗传物质是RNA[8]。几乎同时,多名科学家特别是德国的施拉姆 (Gerhard Schramm) 也得出相同结论 (图3)。因此赫尔希、弗兰克尔-康拉特和施拉姆分享了1958年的拉斯克基础医学奖。赫尔希还于1969年分享了诺贝尔生理学或医学奖,但另外两位科学家未能分享,原因在于DNA作为遗传物质的普遍性,而RNA主要是作为病毒遗传物质。
图3 RNA作为遗传物质的发现(图片源自biocyclopedia)
将RNA作为遗传物质的病毒根据RNA的状态和功能通常可以分为4类,分别为单链-正链RNA病毒、单链-负链RNA病毒、双链RNA病毒和逆转录病毒。单链-正链RNA病毒是最大的一类RNA病毒,正链RNA (类似mRNA,可以直接作为翻译的模板) 为遗传物质,常见的如丙型肝炎病毒 (HCV)、新冠肺炎病毒 (SARS-CoV) 和脊髓灰质炎病毒等;单链-负链RNA病毒种类较少,负链RNA (需首先通过复制产生正链RNA) 作为遗传物质,常见的如流感病毒等;双链RNA病毒为宿主最广泛的一类RNA病毒,著名的如轮状病毒等;逆转录病毒RNA通常需要先逆转录为DNA后才具有遗传功能,常见的如人类免疫缺陷病毒(HIV)等。相比较于DNA病毒,RNA病毒具有较高的变异性,这一特征为有效疫苗研发和药物研制带来巨大的挑战。
RNA的催化功能早在1967年,沃斯 (Carl Woese)、克里克和奥尔格尔 (Leslie Orgel) 就基于RNA具有类似蛋白质可形成复杂二级结构的特点,推测其具有催化功能,但缺乏直接的实验支持。1982年,科罗拉多大学切赫 (Thomas Robert Cech) 实验室在研究四膜虫rRNA中内含子切除机制过程,并试图纯化负责完成该过程的酶时,意外发现其包含的内含子可在不存在任何蛋白质前提下完成自我切除。他们在尝试进一步寻找其他相关蛋白质多次无果后,最终确定rRNA的内含子序列具有催化磷酸二酯键断裂和重新形成的作用。这是首次鉴定出RNA具有和蛋白质类似的催化功能。大约同一时间,耶鲁大学奥特曼 (Sidney Altman) 小组正在研究tRNA分子加工过程。他们从大肠杆菌中分离得到一种RNA酶P,该酶包含蛋白质和RNA (称为M1 RNA) 两部分,负责将前体tRNA转化为活性tRNA。最初认为其中的蛋白质组分发挥催化核心作用,M1 RNA发挥辅助作用,但随后发现完全去除蛋白质单独保留M1 RNA时仍能在体外完成tRNA加工,从而为RNA作为催化剂提供了重要证据。克鲁格 (Kelly Kruger) 将这种具有催化功能的RNA命名为核酶 (ribozyme)[9]。1989年,切赫和奥特曼因发现“RNA催化功能”而分享诺贝尔化学奖。
RNA催化功能的发现深化了对生命起源的认识。传统观点认为生物催化是蛋白质的“专利”,DNA是遗传信息载体,因为蛋白质翻译的信息由DNA指导,而DNA复制需要酶 (蛋白质) 催化,所以两者“谁先谁后”难以确定 (“先有鸡还是先有蛋”悖论) 。RNA既作遗传物质又具催化功能的新发现促使科学家对生命起源有了新的理解。吉尔伯特 (Walter Gilbert) 于1986年提出“RNA世界”学说,认为生命之初首先产生RNA,随着进化RNA将催化功能给予蛋白质,遗传功能给予DNA,从而形成今天的世界,但RNA仍残存了早期生物功能的痕迹。
调节RNA今天多种调节RNA被发现并成为生命科学和医学研究的热点和前沿,其实RNA调节功能的推测最早可追溯到20世纪50年代末。雅各布和莫诺提出乳糖操纵子模型时最初假定调节功能的可移动元件为RNA,但不久吉尔伯特证明是一种特殊蛋白质,直到30多年后RNA的调节功能才被发现。1979年,美国遗传学家安布罗斯 (Victor Ambros) 进入麻省理工学院著名分子生物学家霍维茨 (H. Robert Horvitz,2002年诺贝尔生理学或医学奖获得者) 实验室从事线虫发育研究,特别关注影响发育时间的相关基因,因为这些基因突变造成线虫发育提前或延迟。安布罗斯发现一种线虫突变体lin-4,早期幼虫阶段细胞反复分裂,最终出现发育迟缓。不久,他又观察到另一种突变体lin-14,线虫直接跨越早期阶段而出现早熟表型。两种表型差异暗示lin-4和lin-14在蠕虫发育过程发挥相反作用。1982年,鲁夫昆 (Gary Ruvkun) 也加入霍维茨实验室,开启与安布罗斯关于线虫发育的多年合作。他们首先发现lin-14基因编码一种蛋白产物,该产物在线虫发育早期大量积累,随后出现急剧下降,如果不出现下降则会造成线虫重复早期细胞分裂,而之所以会出现下降原因在于lin-4的产物具有抑制lin-14蛋白积累的功能,但这种调控机制不得而知。20世纪90年代,鲁夫昆揭示lin-14调控机制并发现其mRNA序列3'末端存在非翻译区 (3' untranslated region, 3'UTR),该序列变异或缺失可影响mRNA翻译效率和所产生蛋白质的数量。与此同时安布罗斯也成功分离到lin-4基因,最初认为其编码蛋白质,但随后发现即使转入700bp的DNA片段也可恢复lin-4突变线虫表型。这个DNA短于绝大多数编码基因长度,并且缺乏编码基因所拥有的开放阅读框结构,预示可能并非通过蛋白质发挥功能。1992年春天,安布罗斯获得与lin-4对应的一个61个核苷酸构成的RNA,随后发现一个更小的22个核苷酸RNA。与鲁夫昆进行课题讨论过程中他们发现lin-4的22个核苷酸恰好可以与lin-14的mRNA 3'UTR部分序列碱基配对,基于此他们推测正是二者的结合调节了lin-14 mRNA翻译效率和蛋白质含量 (图4)。lin-4成为第一个发现的微小RNA (microRNA, miRNA),但随后并未在其他生物中发现类似现象,因此认为是一种特殊现象,直到2000年前后一系列miRNA的发现才使大家意识到这是一种普遍的基因表达调控机制[10]。安布罗斯和鲁夫昆因调节RNA的发现荣获众多科学大奖,包括2008年美国拉斯克基础医学奖。
图4 miRNA发现及作用。(a)发现miRNA的两位科学家;(b)miRNA调控机制(图片均来自laskerfoundation.org)
反义RNA随着对RNA功能研究的拓展和深入,RNA应用价值也得到全面体现,多种基于RNA的治疗也应运而生,首先是反义RNA技术的发明。20世纪60年代,发现tRNA的扎梅奇尼克开始将兴趣转向劳斯肉瘤病毒 (Rous sarcoma virus, RSV)。70年代,随着DNA测序技术发展和RSV基因组序列完成,扎梅奇尼克构思出一种全新抗病毒策略,设计与RSV关键基因末端互补的13个碱基,称反义RNA,亦称反义寡聚核苷酸 (antisense oligodeoxynucleotide, ASO) 。体外实验证明这种反义RNA可特异性与靶基因的mRNA形成双链而抑制蛋白质合成,细胞内实验则进一步表明反义RNA抑制RSV复制和宿主细胞转化,显示出巨大的应用潜力。扎梅奇尼克还通过在3'和5'末端进行化学修饰来提高反义RNA生物活性和稳定性。1978年,扎梅奇尼克发表反义RNA领域两篇里程碑论文,标志着反义RNA应用的正式开启[4]。多家制药公司建立反义RNA研发团队,期待能在新药方面取得新突破。随后研究者发现反义RNA策略存在众多问题,临床效果并不理想,最终多家公司放弃进一步投入,但仍有一些小公司坚持研发和开展临床试验。2010年后反义RNA的应用出现巨大转机,几款药物先后被美国、欧洲和中国批准应用。2013年1月,米泊美生 (Mipomersen) 被美国FDA批准用于治疗家族性高胆固醇血症(familial hypercholesterolemia, FH);2016年9月,依特利生 (Eteplirsen) 被FDA批准用于治疗杜氏肌营养不良症 (Duchenne muscular dystrophy, DMD) ;2016年12月,诺西那生 (Nusinersen) 被FDA批准用于治疗脊髓性肌萎缩症 (spinal muscular atrophy, SMA)。目前,还有几十种药物在临床阶段,其中20多种已进入Ⅱ期或Ⅲ期临床[11]。
ASO类药物的一个重大缺点是价格昂贵。一方面是因为这些药物主要应用于单基因突变引起的罕见病治疗,如前段时间引起争议的天价医药费事件主角就是诺西那生;另一方面它们针对的是mRNA,并未涉及突变本质DNA,从而意味着这种治疗只能缓解而无法治愈,患者通常需要终身用药。若想从根本上消除疾病达到一劳永逸的效果,则需要寄希望于其他策略(如基因编辑技术)的发展和完善,在将来实现DNA修复才行。
RNA干扰尽管反义RNA存在一定不足 (抑制靶基因效果并不理想),但在20世纪90年代仍然作为一种基因研究工具得到了广泛应用。1998年,美国梅洛 (Craig Mello) 小组和菲尔 (Andrew Fire) 小组合作研究肌肉蛋白在线虫发育过程中的作用。他们为线虫单独注射肌肉蛋白的mRNA或反义RNA,结果未发现表型异常。若将两种RNA (两者可以互补) 同时注射入线虫体内,线虫出现抽搐,该表现与线虫肌肉蛋白缺陷一致,暗示两种RNA可实现线虫肌肉蛋白敲除的效果。他们又对其他基因进行互补双链RNA注射实验,获得类似效果,线虫出现相应基因缺陷表型。经过一系列简单巧妙的实验后,他们最终得出结论:双链RNA可将靶基因实现沉默,并且这种效应具有特异性,称为RNA干扰 (RNA interfere, RNAi) [12]。进一步的研究发现,RNA干扰效果比反义RNA更为显著,操作又比当时的基因敲除技术简便,因此迅速成为实验室研究基因功能的强有力工具。梅洛和菲尔在RNA干扰技术发明8年后就分享了2006年诺贝尔生理学或医学奖。RNA干扰尽管在科学研究中得到广泛应用,但在疾病治疗方面却面临诸多挑战,如脱靶效应。早期临床试验的结果令人失望,低功效和高毒性使大部分药物最终被否。RNA干扰策略最大挑战在于器官靶向性,也就是把高浓度小干扰RNA (small interfering RNA, siRNA) 药物精准运送到需要发挥作用的细胞内才行。研究人员最初设计出脂质纳米颗粒 (lipid nanoparticle, LNP) 和N-乙酰半乳糖胺 (N-acetylgalactosamine, GalNac) 载体技术。但这些技术仍存在一定缺陷,那就是容易在肝脏聚集,难以到达其他器官。然而至今仍有多款RNA干扰药物被美国FDA批准应用。2018年,第一种RNA干扰药物帕蒂西兰 (Patisiran) 批准用于治疗一种罕见遗传病——遗传性转甲状腺素蛋白淀粉样变性 (hereditary transthyretin-mediated amyloidosis) 。2019年,吉沃西兰 (Givosiran) 被批准用于治疗罕见遗传病急性肝卟啉症 (acute hepatic porphyria)。2020年,卢马西兰 (Lumasiran) 被批准用于治疗罕见遗传病Ⅰ型原发性高草酸尿症 (primary hyperoxaluria type 1, PH1)。目前多款药物尚在临床试验中,有望将来批准应用于临床治疗[13]。
RNA干扰药物和ASO药物存在类似的问题。首先也是价格高昂,如服用卢马西兰,每个病人年花费近50万美元,需终身用药;其次适应症有限,绝大多数遗传病和复杂性疾病都缺乏有效的RNA干扰药物。
适配体20世纪80年代,研究人员发现RNA可像其他有机分子一样具有多样结构,并与蛋白质、糖等物质特异结合,促使科学界开始考虑从RNA分子中筛选出具有潜在药物价值的化合物。1989年,戈尔德 (Larry Gold) 和图尔克 (Craig Tuerk) 成功开发了指数富集配基的系统进化 (systematic evolution of ligands by exponential enrichment, SELEX) 技术,这是一种体外选择或体外进化方法,通过对合成的寡聚核苷酸链进行多轮筛选,最终获得理想结果。借助SELEX技术,戈尔德鉴定出可与T4噬菌体DNA聚合酶结合的单链RNA分子[14]。与此同时,绍斯塔克 (Jack Szostak) 和艾灵顿 (Andy Ellington) 设计出相似的程序,最终他们鉴定出可与染料小分子结合的多种RNA。特别的是,他们将这类RNA命名为适配体 (aptamer),“aptamer”由拉丁语“aptus” (意为“适合”) 和希腊语“meros” (意为“部分”) 组合而成 (图5) [15]。
图5 RNA适配体的发现和作用。(a)发现适配体的两位科学家(图片来自somalogic.com和hhmi.org);(b)适配体作用机制[16]
适配体是一类可折叠为特定空间结构的单链RNA,可与靶蛋白特异性结合。这种结合抑制蛋白质间相互作用,因此通常作为拮抗剂发挥药理效应[16]。适配体在实际应用中有众多优势:第一,相比于蛋白质它分子量较小,通常不会激发机体免疫;第二,作为多聚核苷酸链,可与其他分子形成复合物联合应用;第三,对于特异性识别细胞表面分子的适配体,还可参与药物的靶向运输。当然适配体也存在诸多弊端,如价格昂贵、未修饰RNA体内易降解、水溶性和分子量小的特点导致其易被肾脏排出、携带负电荷易结合血液蛋白而无法靶向细胞等。当然,通过减少适配体核苷酸数量来降低成本、对糖基进行修饰来减少降解、连接聚乙二醇等降低肾滤过率等方法可使问题得到适当解决。
2004年12月,首个核酸适配体药物哌加他尼 (Pegaptanib) 被FDA批准应用于治疗老年黄斑变性 (age-related macular degeneration, AMD)。哌加他尼最初占有较大市场份额,但最终输给了效果更理想的单克隆抗体药物雷珠单抗 (Lucentis)。目前,多款适配体药物仍处于开发和临床试验阶段,虽被业界寄予厚望,但效果如何尚需评判。
11
RNA指导的基因编辑RNA早期应用主要集中于靶向mRNA或蛋白质,而在DNA基因编辑方面的应用则极大拓展其应用领域。20世纪90年代,研究人员在细菌中发现一种全新获得性免疫系统,由成簇规律性间隔短回文重复 (clustered regularly interspaced short palindromic repeat, CRISPR) 序列和相关蛋白 (CRISPR-associated, Cas) 构成。后续的研究发现一种特定Cas蛋白——Cas9为核酸内切酶,而CRISPR序列可转录出一种特殊RNA——crRNA (CRISPR-related RNA) ,crRNA与特定DNA序列互补配对,启动Cas9对DNA的特异剪切。法国微生物学家卡彭蒂耶 (Emmanuelle Marie Charpentier) 从小挚爱医学并选择生命科学作为终身职业,她于2009年6月开始研究CRISPR-Cas9系统。卡彭蒂耶小组鉴定出第二种RNA,即反式激活CRISPR来源RNA (trans-activatingCRISPR-derived RNA, tracrRNA),这种RNA可与刚转录出的CRISPR特定序列互补配对,随后被一种RNA酶Ⅲ识别和剪切产生成熟crRNA[17]。至此参与细菌获得性免疫系统的3种元件 (Cas9、crRNA和tracrRNA) 全部鉴定完毕,下一步就是将这一天然系统改造为一种有效的基因编辑工具。卡彭蒂耶与美国结构生物学和生物化学家杜德娜 (Jennifer Anne Doudna) 达成合作协议,进一步研究发现tracrRNA具有双重作用,不仅参与crRNA加工和成熟,还与crRNA形成特殊二级结构指导Cas9蛋白对靶DNA剪切。Cas9拥有两个DNA核酸内切酶结构域,分别对两条链进行切割,并且其活性依赖tracrRNA与crRNA形成的二级结构 (发夹样结构)。基于这一特征,她们将两条RNA链tracrRNA与crRNA合二为一形成单链引导RNA (single guide RNA, sgRNA),sgRNA保留原来两种RNA的二级结构。体外实验表明,sgRNA和Cas9可完成对靶DNA的精准剪切[18],一种RNA指导的简单基因编辑系统从此诞生。后续研究一方面证明CRISPR-Cas9系统在细胞乃至完整生物体内也可发挥活性,另一方面通过改进实验使有效率和精准度均得到不同程度的提升。
RNA指导的CRISPR基因编辑系统在生命科学研究和医学领域均具有广泛的应用潜力。借助该系统可有效进行动物模型构建、快速疾病诊断、传染性疾病治疗等,特别是有望在遗传病治疗方面发挥更大价值。该系统可从根本上解决突变DNA,因此意义更为重大。卡彭蒂耶和杜德娜也因此分享了2020年诺贝尔化学奖。
12
mRNA疫苗mRNA尽管在1961年就已被发现,但直到20世纪90年代初才开始应用。1990年,威斯康星大学医学院沃尔夫 (Jon Asher Wolff) 等首次将体外转录 (in vitro transcribed, IVT) 的mRNA直接注射到小鼠肌肉并成功表达功能蛋白,开启了mRNA的应用[19]。其他研究随后也证实这一策略的可行性,但进一步研究发现mRNA应用存在包括激发机体先天免疫、易降解和稳定性差、体内表达效率不高等诸多缺陷。1990年,匈牙利裔美国生物化学家卡里科 (Katalin Karikó) 开始尝试mRNA应用,尽管困难重重但她仍坚信mRNA拥有美好未来。1997年,卡里科在宾夕法尼亚大学结识免疫学家魏斯曼 (Drew Weissman),并与其合作研究mRNA在疫苗领域的应用。经过反复实验,他们发现体外转录的mRNA缺乏真核细胞内转录后修饰过程。因此,通常被机体看作“异物”产生免疫排斥,此外IVT产生的mRNA还容易形成双链结构,引发免疫应答并造成稳定性下降。在获悉体外转录的mRNA这些特征的基础上,卡里科和魏斯曼改进体外mRNA制备方法[20],采用核苷酸修饰策略 (如将尿嘧啶修饰为假尿嘧啶等),同时完善mRNA纯化策略,成功解决了最初的免疫原性大和不稳定性等难题,为实际应用扫除众多技术障碍 (图6)。尽管如此,后续的流感和HIV的mRNA疫苗开发仍未取得明显进展[21]。2020年初,新冠肺炎 (COVID-19) 暴发给了mRNA疫苗一展身手的机会。摩德纳公司 (Moderna) 和辉瑞公司经过半年多研制和临床测试最终成功开发出新冠肺炎mRNA疫苗并启动紧急应用,大范围的疫苗接种为缓解全球新冠肺炎疫情作出重要贡献。新冠肺炎mRNA疫苗的成功为卡里科和魏斯曼带来众多荣誉,仅2021年他们就先后荣获著名的路易莎·格罗斯·霍维茨奖 (Louisa Gross Horwitz Prize)、奥尔巴尼医学中心奖 (Albany Medical Center Prize)、生命科学突破奖和拉斯克临床应用奖等,并有望将来分享诺贝尔奖(编者注:果然获得了诺贝尔生理学或医学奖)。
图6 mRNA修饰技术发展和疫苗开发。(a)mRNA疫苗研究作出重要贡献的科学家(图片来自med.wisc.edu、pennmedicine.org和med.upenn.edu);(b)mRNA疫苗的制备和使用(图片来自health feedback)。
结语自1869年核素 (可看作RNA起始) 发现至今已有150多年,RNA研究发生了翻天覆地的变化 (图7),无论基础发现还是实际应用都取得长足进步。基础方面拓展了对众多生命过程的理解和认识,尤其是调节RNA成为当前生命科学研究的前沿和热点;应用方面更是进展迅猛,基于寡聚核苷酸 (oligonucleotide, ON) 的众多RNA产品已在临床展示出巨大价值,有望在疾病诊断、治疗和预防等方面发挥重要作用。
参考文献
[1] DAHM R. Friedrich Miescher and the discovery of DNA [J]. Dev Biol, 2005, 278(2): 274-288.
[2] FRIXIONE E, RUIZ-ZAMARRIPA L. The “scientific catastrophe” in nucleic acids research that boosted molecular biology [J]. J Biol Chem, 2019, 294(7): 2249-2255.
[3] 郭晓强.现代细胞生物学之父——帕拉德[J]. 自然杂志, 2009, 31(1): 59-62.
[4] 郭晓强. “反义技术”之父——扎梅奇尼克[J]. 科学, 2011, 63(2): 44-47.
[5] COBB M. Who discovered messenger RNA? [J] Curr Biol, 2015, 25(13): R526-R532.
[6] 郭晓强. 遗传密码之父——尼伦伯格[J]. 科学, 2011, 63(3): 50-53.
[7] 郭晓强. 基因合成的奠基人——哈尔·戈宾德·科拉纳[J]. 自然杂志, 2013, 35(2): 153-156.
[8] PENNAZIO S, ROGGERO P. Tobacco mosaic virus RNA as genetic determinant: genesis of a discovery [J]. Riv Biol, 2000, 93(3): 431-455.
[9] ABELSON J. The discovery of catalytic RNA [J]. Nat Rev Mol Cell Biol, 2017, 18(11): 653.
[10] MORRIS K V, MATTICK J S. The rise of regulatory RNA [J]. Nat Rev Genet, 2014, 15(6): 423-437.
[11] KULKARNI J A, WITZIGMANN D, THOMSON S B, et al. The current landscape of nucleic acid therapeutics [J]. Nat Nanotechnol, 2021, 16(6): 630-643.
[12] FIRE A, XU S, MONTGOMERY M K, et al. Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans [J]. Nature, 1998, 391(6669): 806-811.
[13] SETTEN R L, ROSSI J J, HAN S P. The current state and future directions of RNAi-based therapeutics [J]. Nat Rev Drug Discov, 2019, 18(6): 421-446.
[14] TUERK C, GOLD L. Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase [J]. Science, 1990, 249(4968): 505-510.
[15] ELLINGTON A D, SZOSTAK J W. In vitro selection of RNA molecules that bind specific ligands [J]. Nature, 1990, 346(6287): 818-822.
[16] YANG S, LI H, XU L, et al. Oligonucleotide aptamer-mediated precision therapy of hematological malignancies [J]. Mol Ther Nucleic Acids, 2018, 13: 164-175.
[17] DELTCHEVA E, CHYLINSKI K, SHARMA C M, et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III [J]. Nature, 2011, 471(7340): 602-607.
[18] JINEK M, CHYLINSKI K, FONFARA I, et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity [J]. Science, 2012, 337(6096): 816-821.
[19] WOLFF J A, MALONE R W, WILLIAMS P, et al. Direct gene transfer into mouse muscle in vivo [J]. Science, 1990, 247(4949): 1465-1468.
[20] KARIKÓ K, BUCKSTEIN M, NI H, et al. Suppression of RNA recognition by Toll-like receptors: the impact of nucleoside modification and the evolutionary origin of RNA [J]. Immunity, 2005, 23(2): 165-175.
[21] PARDI N, HOGAN M J, PORTER F W, et al. mRNA vaccines-a new era in vaccinology [J]. Nat Rev Drug Discov, 2018, 17(4): 261-279.
本文原文发表于《自然杂志》2022年第6期,原标题《RNA研发简史:从微不足道到无比重要》,经授权转载于《返朴》。
相关阅读
1 2023诺贝尔生医奖颁给mRNA技术,不止于对抗病毒,也推开医疗革命的希望之门
3 打了mRNA疫苗会变“转基因人”?一项不靠谱研究引发的恐慌
近期推荐
1 新晋诺奖得主:中年失业、患癌,她用四十年逆袭拯救全人类,还培养了一个奥运冠军
5 电影之外的奥本海默:他不只是原子弹之父,世界还欠他一个诺奖
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
长按下方图片关注「返朴」,查看更多历史文章