天然药物化学史话:天然产物的生物合成
1804年德国药剂师Friedrich Wilhelm Adam Sertüner(1783—1841)第一次从罂粟中分离得到纯的吗啡(morphine),开创了天然药物化学研究的先河。直至19世纪下半叶,已经从自然界(主要是植物)中分离出一系列的天然成分。随着这些成分不断地被发现和积累,化学家们开始对这些小分子来源及它们在植物体内的形成过程产生了兴趣。本文将对天然产物的生物合成,从诞生到发展过程中的一些代表性合成反应进行综述,阐明天然产物生物合成发展的历史脉络及其在天然药物化学、有机化学及促进新学科发展的重要作用。
德国化学家瓦拉赫(Otta Wallach,1847—1931,图1)经过短暂的兵役之后,1872年进入波恩大学凯库乐(FriedrichAugust Kekulé,1829—1896)实验室开始了挥发油的研究。在从天然植物中提取挥发油的研究过程中,瓦拉赫发现其中主要成分是低相对分子质量、不饱和的有机分子,这些分子与之前认识的低相对分子质量有机烃类化合物的性质大不相同,并且瓦拉赫发现,作为挥发油中主成分的这些小分子有机化合物之间存在着某种联系,大都是由2个或2个以上异戊二烯(isoprene,C5H8)单位构成的含氧聚合物(polymers),其将这类化合物命名为萜烯(terpenes)。瓦拉赫曾运用最简单的化学试剂,如HCl、HBr等解析了许多天然精油中的C10H16组分萜烯结构(图2),于1887年首先总结提出了“异戊二烯规则(isoprene rule)”:天然萜类化合物都是异戊二烯的聚合体,或者说自然界存在的萜类化合物都是由异戊二烯头尾(head-to-tail)相连聚合并衍变的。此规则也被称为“一般的异戊二烯规则(general isoprene rule)”“经验的异戊二烯规则(empirical isoprene rule)”或“化学的异戊二烯规则(chemical isoprene rule)”。1909年瓦拉赫发表了达600余页的学术著作《萜类与樟脑》(Terpene and Campher,图1)。在人类历史上,挥发油的应用由来已久,挥发油的研究在有机化学发展的初期就已经出现,但直到19世纪末因为瓦拉赫的研究才归纳出挥发油中萜类化合物的结构单元,也为现代香料科学的发展奠定了基础。瓦拉赫也因此获得了1910年的诺贝尔化学奖。
瑞士苏黎世联邦理工学院(ETH Zürich)化学家LeopoldRužička(1887—1976,图1)在瓦拉赫的研究基础上,进一步对萜类化合物进行深入研究,发现异戊二烯本身并不直接参与萜类化合物的形成过程,而是异戊二烯的活化形式异戊烯基二磷酸(isopentenyl pyrophosphate,IPP)和二甲丙烯二磷酸(dimethylallyl pyrophosphate,DMAPP)直接参与萜类化合物的生物合成。1953年他提出了“生源的异戊二烯规则(biogenetic isoprene rule)”:所有天然萜类化合物都是经甲羟戊酸(mevalonic acid,MVA)途径衍生出来的化合物,或者说萜类化合物都有一个活性的异戊二烯前体化合物[1],见图3。由于Leopold Ružička在萜类化合物、甾体激素、植物杀虫剂等方面的巨大成就,他的实验室成为世界有机化学的研究中心。Leopold Ružička也因此获得了1939年诺贝尔化学奖。在此期间,Leopold Ružička的博士生,世界著名化学家Albert Eschenmoser(1925—,图1)也做出了相当大的贡献[2-4]。
1893年英国化学家John Norman Collie(1859—1942,图4)从地衣中分离出酚性化合物苔黑素(orcinol),接着在1907年又分离出苷色酸(orsellinic acid,图5),他和他的学生推测这类化合物可能是通过乙酰基首尾相连或烯酮(ketene,CH2=C=O)聚合而成,并把它们称之为聚乙酰(polyacetyl)类化合物,这是聚酮理论的雏形[5-8]。
Collie的聚酮理论思路沉寂了近半个世纪以后,1953年澳大利亚化学家Arthur John Birch(1915—1995,图4)进一步发展完善了Collie的聚酮理论(图6)。因缺乏实验证据被《英国化学会志》(the Journal of the ChemicalSociety)拒稿后,Birch转而投向了刚刚创刊不久的《澳大利亚化学会志》(AustralianJournal of Chemistry)[9],并陆续发表了多篇相关研究[10-14]。1955 年开始用同位素标记的乙酸酯证实了聚酮类化合物来源于乙酰的聚合。直到20世纪50年代中期Robert Robison(1886—1975,图4)发现了几类天然产物结构之间的生源关系,1955年牛津大学出版了其著作《天然产物的结构关系》(The Structural Relations of Natural Products),提出了著名的生源学说,包括所谓的聚酮次甲理论(polyketonmethylenetheory),首次采用聚酮生物合成(polyketidebiosynthesis)进行表述。
同位素示踪法是利用放射性核素作为示踪剂对研究对象进行标记的微量分析方法。1896年英国化学家,也是1921年获诺贝尔化学奖得主Frederick Soddy(1877—1956,图7)发现了放射现象,而后发现了同位素的存在,1913年正式引进同位素一词(isotopes)[15]。1912年瑞典化学家、核医学之父George Charles de Hevesy(1885—1966,图7)首先试用同位素示踪技术,并陆续做了许多相关工作[16-17],并因其开创性贡献获得了1943年的诺贝尔化学奖。1932年美国哥伦比亚大学化学家Harold Clayton Urey(1893—1981,图7)发现了重氢(deuterium)同位素,用于探索追踪生物合成途径,并因发现氢的同位素氘获得1934年诺贝尔化学奖。1934年法国科学家Frederic Joliot-Curie(1900—1958,图7)和Irène Joliot-Curie(1897—1956,图7)夫妇(1935年诺贝尔化学奖获得者)发现了人工放射性(artificialradioactivity),1940年末至1950年初发现了放射性同位素14C,为放射性同位素示踪法更快的发展和在生命科学、医学、化学等领域广泛应用提供了基本条件和有力保障,为人们认识世界开辟了一个新的途径[18]。
20世纪30年代美国哥伦比亚大学生物化学家Rudolph Schoenheimer(1898—1941,图8)建立了用同位素追踪生物代谢产物的方法[19-20]。Schoenheimer团队的KonradEmil Bloch博士(1912—2000,图8)掌握了这种方法,并将其用于胆固醇的研究,弄清楚了胆固醇的生物合成途径,并阐明胆酸、性激素和维生素D均来源于胆固醇[21-25]。德国科学家Feodor Felix Konrad Lynen(1911—1979,图8)确定了合成胆固醇的原料乙酰辅酶A(acetyl-coenzyme A)的结构及其与脂肪酸的关系,二人分享了1964年的诺贝尔生理学或医学奖。在此以前,Fritz Albert Lipmann(1899—1986)因为发现辅酶A(coenzyme A,CoA,图9),获得了1953年的诺贝尔生理学或医学奖。其实,在1953年,美国化学家Robert Burns Woodward(1917—1979,1965年获诺贝尔化学奖获得者)和英国化学家Robert Robinson(1886—1975,1947年获诺贝尔化学奖获得者)都对胆固醇的生物合成提出了自己的假说。
生物合成理论研究的辉煌时代是在20世纪60年代中期,其重要的标志是异戊二烯途径和氨基酸途径的确立。用放射性同位素追踪标记方法验证了Ruzicka提出的生源异戊二烯规则(biogenetic isoprene rule),发现MVA可作为乙酸替代物而起作用,进而确立了异戊二烯途径(isoprene pathway)在萜和甾体类化合物生物合成中的重要作用。1950年德国生物化学家Feodor F. Lynen发现了焦磷酸异戊烯酯(IPP)的存在。1956年美国默克公司化学家Karl August Folkers(1906—1997,图10)发现了MVA的存在,由此证明了“生源的异戊二烯规则”假设成立(图11)。1993年法国学者Rohmer等[26]又发现了新的非甲戊二羟酸合成途径(non-mevalonic acid pathway,mevalonate-independent pathway,图12),并进行了相关研究[27-29]。
20世纪50年代中期Robison还提出了氨基酸是生物碱的生物合成前体物假说,1960年被英国剑桥大学AlanRushton Battersby等学者用放射性同位素标记方法所证实。迄今为止,生物合成已经发展成为颇具生命力的学科,其研究范围已几乎涉及所有类型的天然产物。
最初,生物化学和天然药物化学联系非常密切。因对细胞化学(特别是蛋白质和核酸)有卓越的研究成就而获得1910年诺贝尔生理学或医学奖的德国著名的生物化学家Albrecht Kossel(1853—1927,图13),细胞化学的奠基人,于1891年首次提出一级代谢产物(primary metabolites)和二级代谢产物(secondary metabolites)的概念。Kossel还首次分离出了茶碱(theophylline),茶碱为茶叶和咖啡的有效成分。绿色植物和藻类植物体内碳的代谢途径均是从光合作用开始的,通常可将代谢过程大致分为4个区(A~D):A区是光合作用产生的葡萄糖及其糖酶解,这部分是全部代谢的基源;B区主要是葡萄糖代谢产生的有机酸;C区是前体物;D区是二级代谢产物。三羧酸循环在其中起了重要作用。
三羧酸循环以循环中一个重要中间体柠檬酸(citric acid)命名,亦称作柠檬酸循环(citric acid cycle,CAC),因柠檬酸本身是一种三元羧酸(tricarboxylic acid),因此称为三羧酸循环。该循环是1937年由德裔英国生物化学家Hans Adolf Krebs(1900—1981,图13)发现,因而也被称为Krebs cycle[30-31]。因此,Krebs获得1953年诺贝尔生理学或医学奖。早在20世纪30年代,匈牙利生化学家Albert Szent-Györgyi(1893—1986,图13)就因阐明了CAC中的一个重要中间体延胡索酸(fumaric acid)的研究,获得了1937年诺贝尔生理学或医学奖。
葡萄糖经醣酵解(glycolysis)产生的丙酮酸(pyruvic acid)经过丙酮酸脱氢酶系氧化,生成乙酰辅酶A后,与由苹果酸(malicacid)生成的四碳二元羧酸草酰乙酸(oxaloacetic acid)缩合,生成柠檬酸,进入CAC。随后,经过一系列反应,2个碳原子转化为二氧化碳(CO2)分子,柠檬酸中蕴藏的化学能释放转化至还原的辅酶中。CAC的终产物仍然是草酰乙酸,这使得该循环能源源不断地氧化输入循环的乙酰辅酶A。乙酰辅酶A既可通过脂肪酸的β-氧化生成,也可以作为脂肪酸的前体合成脂肪酸(图14)。
通过研究天然产物的生物合成能够了解这些千变万化的小分子在自然界是怎样形成的。天然产物生物合成的研究大致经历了3个阶段:第1阶段主要是在20世纪初到50年代之间,是根据结构特点结合化学性质提出生源假说,如醋酸假说、异戊二烯规则等;第2个阶段是在20世纪50年代到80年代,主要是通过同位素标记前体喂饲实验来确定生物合成途径,这一阶段的研究使得生物合成的研究从假说变成可通过实验验证的科学,此后又发展出了刺激实验法、洗涤菌丝法、无细胞提取液转化、遗传诱变等方法来确定生物合成途径;第3个阶段主要是20世纪80年代以后,结合现代分子遗传学方法和生物化学的方法来具体地研究天然产物的生物合成,即modern genetic-guided生物合成研究。一般以英国John Innes Centre的DavidAlan Hopwood于1984年在《自然》(Nature)发表成果为标志[32],将天然产物与对应的生物合成基因联系了起来,这方面尤以聚酮合酶(PKS)和诺娜基二磷酸合酶(NPPS)类化合物的生物合成机制研究最为突出,近年来已经取得了重大的突破,期间还发展出了组合生物合成、全生物合成等新的研究方向[33-34]。
6.1 有助于天然产物的结构鉴定
在NMR和X-ray衍射技术高度发展的今天,二者的应用虽然已显得无足轻重,但在1950年以前还很重要,是天然产物结构推测的重要手段。若在1920年以前就搞清了胆固醇和甾体化合物的生物合成途径,1928年诺贝尔化学奖获得者Reinhold Windaus(1876—1959)关于胆固醇的错误结构就可能避免(图15)。
6.2 有助于天然产物的仿生合成(biomimetic synthesis)
在一个天然产物的生物合成途径被阐明后,按照其生源合成途径,模仿合成步骤对其进行化学合成的方法称之为仿生合成。仿生合成为生源假说提供真实的证据。1917年RobertRobinson(1886—1975)利用曼尼希反应(Mannich)进行的第一次仿生合成颠茄碱(又称阿托品)标志着仿生合成的开始[35](图16)。
20世纪50~70年代是甾体化合物研究的辉煌时代,继Woodward和CarlDjerassi合成可的松后,20世纪50年代,哥伦比亚大学Gilbert Stork(1921—2017,图17)、瑞士化学家苏黎世联邦理工学院Albert Eschenmoser(1925—)和斯坦福大学的William Summer Johnson(1913—1995,图17)等人在胆固醇生物合成的基础上,提出一个多烯环合的假说[36]。20世纪70年代哥伦比亚大学Ronald Charles D. Breslow(1931—2017,图17)提出了仿生化学的概念[37-41]。William Summer Johnson博士把甾体化合物的全合成推向了极致,采用巧妙的仿生合成方法完成了孕甾酮(progesterone)的全合成,这是天然产物全合成历史上的一个里程碑[42-43](图18)。英国Nottingham大学的Gerald Pattenden(1940—,图17)发明了用一步反应合成甾体化合物4个环和7个手性中心的简易巧妙方法[44](图19)。1992年加利福尼亚大学Clayton H. Heathcock等人依据仿生合成原理合成了虎皮楠生物碱(daphniphyllum alkaloid)dihydro-proto-daphniphyl- line[45-46],在烯醇化合物合成中的立体选择性做了大量研究[47-49]。他们采用甲酰化的角鲨烯经曼尼希反应,环合、水解合成得到dihydro-proto- daphniphylline,合成路线见图20。诺贝尔化学奖得主,哈佛大学的Corey,在1997年首次报道了运用仿生方法立体选择性地合成了scalarane型二倍半萜类化合物达马烷二烯醇(dammaranedienol)[50](图21)。二倍半萜类化合物是海洋萜类天然产物中的一个大家族,在陆生植物中极其少见,其结构主要有3种类型:manoalide型、hyrtiosane型和scalarane型。其中scalarane型最为常见,具有很好的抗肿瘤、抗感染活性。土楠酸类化合物结构中虽然有很多不对称中心,但整个分子是消旋的,因此人们设想这类化合物在生物合成的前几步是由一系列非手性的非酶的电环合反应中产生的。这一设想在1982年被Nicolaou所证实[51]。在相当温和的条件下,经过土楠酸(endiandric acid)串联反应生成了土楠酸A~C(图22)。
6.3 有利于定向合成所需的天然产物——从青霉素到头孢霉素
青霉素(penicillin)和头孢霉素(cephalosporin)的共同特点是它们都含有β-内酰胺环(β-lactam),这两类抗生素约占了整个抗生素市场的65%[52]。它们在结构上有许多相似之处,均由类似的母核与侧链组成。所不同的是青霉素骈合的是五元环噻唑环(thiazolidinic ring),而头孢霉素骈合的是六元二氢噻唑环(dihydrothiazolidinic ring)。头孢霉素不易被青霉素酶(penicilinase)降解,因此,与青霉素相比,不易产生耐药性[53-54]。很早以前就发现,在使用青霉菌发酵青霉素时,发酵液中同时还存在头孢霉素。青霉素和头孢霉素的生物合成途径均已清楚,在合成的开始阶段青霉素和头孢霉素有共同的前体,它们是3个氨基酸:L-α-氨基己二酸(L-α-aminoadipic acid)、半胱氨酸(L-cystein)和缬氨酸(L-valine)。它们在氨基头孢烷酸(ACV)合成酶和isopenicillin N合成酶的作用下形成第一个有活性的共同前体物isopenicillin N,而后在合成路径上出现了分支,在分支点上有一个重要的“调节阀门”扩环酶(DAOC synthase),母核的五元环不扩大,直接进入了青霉素合成,如果扩大成为六元环,则进入头孢霉素合成。因此,目前人们利用基因工程方法,增加扩环酶基因,相当于将“调节阀门”打开,同时利用基因工程方法使流向青霉素合成的基因“关闭”,使头孢霉素的合成“流”加大,既可增加头孢霉素的合成产量,青霉菌经过这样的技术改造,可以在工业上大量生产头孢霉素[55-56]。同样头孢霉素也可以将侧链切掉,获得母核,然后再接上新的侧链,获得半合成头孢霉素(图23)。
6.4 狄尔斯-阿尔德反应的发现
狄尔斯-阿尔德反应(Diels-Alderreaction)又叫双烯加成反应,1928年德国化学家Otto Paul Hermann Diels(1876—1954,图24)及其学生Kurt Alder(1902—1958,图24)首次发现并报道了该反应[58],他们也因此获得了1950年的诺贝尔化学奖。狄尔斯-阿尔德反应是现代有机合成特别是天然产物全合成常用的一个反应,被伍德沃德和Nicolaou等合成大师们青睐[59-62]。近20年,约有400余个天然的狄尔斯-阿尔德反应加成物被不断分离、鉴定[63],探究植物中存在的狄尔斯-阿尔德反应合成酶也成为化学家和生物学家研究的热点[64-72]。
6.5 基于生物合成作用机制的药物发现——他汀(statins)
20世纪50年代美国生化学家即1964年的诺贝尔生理学或医学奖获得者Konrad Emil Bloch(1912—2000)阐明了胆固醇生物合成途径[73-74](图25)。当时胆固醇超标和心脏疾病之间具有一定联系的观点已经得到共识。1973年,高尔斯坦和布朗教授成功建立了胆固醇合成速度分析技术,就是通过分析成纤维细胞HMG-CoA还原酶(HMGR)的活性,间接了解了细胞合成胆固醇的能力。然后利用这一简单技术,确定了血液中低密度脂蛋白是抑制胆固醇合成的关键因子。二人也因此获得了1985年诺贝尔医学奖[75-76]。
受发现青霉素和链霉素的启发,日本科学家远藤章(Akira Endo,图26)认为某种菌类可能会产生可以抑制胆固醇合成的物质。这些微生物代谢产物有可能抑制HMGR。1972年,远藤章在筛选了3 800种真菌后,终于发现了桔青酶Penicillium citrinum提取物能够有效地抑制胆固醇的合成,1年后成功从桔青酶中提纯了活性物质,命名为ML-236B,也就是世界上第一个调血脂的天然化合物——美伐他汀(mevastatin)。他汀又称为HMG- CoA还原酶抑制剂(HMG-CoA reductase inhibitors)。而HMGR正是胆固醇生物合成过程中的一个关键限速酶。他汀类药物的活性部位就是甲瓦龙酸相似的羟基戊酸部分。1979年远藤章首次从红曲霉Monascus rubber中分离出具有HMGR抑制作用的化合物monacolinK。几乎同一时间,默克公司的AlfredAlberts博士从土曲霉Aspergillus terreus中也分离出一个对于HMGR有抑制作用的化合物,命名为mevinolin。后来证实monacolin K与mevinolin为同一物质,即洛伐他汀(lovastatin)。1987年,洛伐他汀(商品名美降脂Mevacor®)被FDA批准成为第一个上市的他汀药物(图27)。受天然他汀类药物的活性部位的启发,1985年Warner- Lambert公司的青年化学家Bruce D. Roth(图26)成功地研发出辉瑞(Pfizer Inc.)的第一个人工合成的他汀类药物——阿托伐他汀(atorvastatin)。1996年底,美国食品药品监督管理局(FDA)批准了阿托伐他汀,商品名为立普妥,开始了一段药品发展史上的传奇。自1996年上市以来,立普妥连续保持销售冠军纪录达10年,且是第一个年销售额突破百亿大关的畅销药物,也是迄今药物史上销售额最大的药物,成了史上最成功的me-best药物。
天然产物来源于自然界,其化学结构和功能是在自然界长期的进化过程中得以选择和优化的结果,它们所具有的独特结构特征赋予了天然产物与特定靶点专一性结合的能力并表现出良好的生物活性,是生物活性前体化合物和药物发现的重要源泉。自然界的天然产物已逾10万余种,结构千差万别。天然产物生物合成研究把这些包罗万象的结构从生源上进行系统分类,理清了这些天然产物内在的联系。
天然药物化学的任务之一是阐明具有生物活性的天然产物的结构及进行全合成,生物合成的理论有助于天然产物合成的设计和结构的推导,如Robinson对吗啡结构的推导就是典型的案例之一。在生物体内,一次代谢形成的几百个化合物中只有几个是二次代谢产物的原料,由这些简单的原料进一步转化形成数目庞大、结构各异的天然化合物,如何对其形成的原理、涉及反应的类型及机制进行科学的分类引起了人们极大的兴趣。生物合成的反应很多也符合有机化学反应机制,甚至包括立体化学机制。通过生源合成途径研究,阐明一类化合物的生物合成的每个步骤,探索天然产物的形成规律,阐明天然化合物结构之间的联系及一次代谢和二次代谢产生的生源关系,解释复杂多变的天然药物化学成分之间的内在逻辑,为天然产物的全合成具有指导意义。天然产物化学和分子生物学的发展和融合为基础的化学生物学(chemical biology)和合成生物学(synthetic biology)的诞生将催生下一次生物技术革命[77-80]。
本文为《天然药物化学史话》系列文章之一。文中部分图片源自网络,在此向原作者表示衷心感谢。
参考文献(略)
来 源:王 伟,李韶静,朱天慧,李力更,张嫚丽,史清文. 天然药物化学史话:天然产物的生物合成 [J]. 中草药, 2018, 49(14):3193-3208.