Cell|高精度从头设计可透膜的环状多肽
段宏亮教授引言:
转眼间Alphafold2已经推出接近两年时间了,在这段时间里面,虽然学术界和产业界轰轰烈烈,各种fold的新版本层出不穷。但蛋白质结构预测这个任务在新药发现上的落地应用却鲜见报道。
David Baker,作为蛋白质结构预测领域的领军人物,这次选择了环状多肽作为蛋白质结构预测的落地应用场景。该实验室于2022年8月29日在Cell杂志上发表文章,对环肽透膜和口服生物利用度的设计原则进行了探索。
多肽,是介于小分子药物和蛋白质药物之间的第三种药物存在模式。同前两者相比,多肽药物的市场一直偏小,这与其自身存在的诸多缺陷是分不开的。首先,是多肽药物的稳定性问题,多肽药物因为其众多肽键的存在而容易被体内的肽酶水解。David Baker选择了环状多肽这样一类结构来解决它的稳定性问题。其次,便是跟透膜性密切相关的口服问题,这也是多肽药物未能同小分子药物一样普及开来最关键的问题所在。文中提及的多肽药物以6-12个氨基酸残基为主,他们的分子量多在1000左右,大大超过了成药5原则中口服药物不能分子量不能超过500的规则。
环孢菌素以及索马鲁肽等口服多肽药物的存在,让科学家们发现,多肽的口服是可以实现的。但是,人们对多肽药物实现口服这个问题一直研究得不够深入。这是阻碍多肽药物市场进一步拓展开来的一个极为极为重要的因素。
本质上来说,多肽跟蛋白质并没有太大的区别,它们的基本组成单元都是20种,不同之处更多是分子的大小而已。这样,既然Alphafold2已经解决了蛋白质结构预测问题,从迁移学习的角度上来说,通过同样的技术手段,环肽结构预测问题的解决也就顺理成章了。
具体到本文来说,文中假设,透膜性是跟环肽分子中的氢键给体密切相关的,通过尽量多地形成分子内氢键或者对氢键给体进行甲基化,可以增加环肽分子的透膜口服性。通过对环肽分子的构象进行预测,能够在不影响活性的前提下,尽量改善环肽分子的口服活性。
David Baker是否能够通过AI的方式来解决好环肽药物的口服问题,从而颠覆多肽药物的发现范式,从巨大的口服小分子药物市场分一杯羹呢,让我们翘首以待吧!
以下是全文主要介绍。
1.研究背景
环肽作为治疗药物具有相当大的潜力,透膜性环肽可以进入细胞内的药物靶点,通过肠道上皮细胞转运,实现口服给药,并通过穿越脑微血管内皮细胞穿透血脑屏障。天然环肽如环孢菌素A和浅灰霉素,表明环肽的性质常常在类药五规则之外。即使通过对天然透膜环肽的研究总结了一些共同的特征,如低极性表面积、减少暴露氢键供体以及在水和膜环境中构象转换实现被动透膜,但是研发新的不同形状和大小的透膜环肽依然是非常困难的。然而,以前的工作主要局限于5-7个氨基酸长度的短肽。此外,将这些原则扩展到具有广泛化学和结构多样性的新型透膜肽的设计上仍然具有挑战性,因为它需要了解结构、灵活性和透膜性之间的关系,以及同时准确控制大环肽的序列和结构特征。
在此,作者通过计算设计和实验表征,系统地研究了大环肽透膜和口服生物利用度的设计原则。作者采用设计-构建-测试的方法,设计含有不同结构特征的肽,确定其晶体和溶液结构,并评估其透膜性。作者主要考虑三个结构特征:通过形成肽内氢键满足所有氢键供体;存在顺式肽键;以及在水和脂质环境中切换构象的能力。
2.结果
作者扩展了 generalized kinematic closure(genKIC)方法,随机生成~106个6-12个残基的聚甘氨酸肽的N-C环状骨架构象的集合,把有2对以上主链氢键形成的构象取出。在有内部氢键相互作用的主链集合上,将L-氨基酸和D-氨基酸分别限制在Ramachandran空间的负和正phi区域,并在结构上兼容的位置加入构象受限的氨基酸,如L-脯氨酸、D-脯氨酸和α-氨基异丁酸(AIB),强化环肽的结构刚性。为了清除暴露的氢键供体,骨架上有暴露的氢键供体的氨基酸被突变为N-甲基化的变体,并且在序列设计步骤中只允许使用非极性氨基酸(见STAR方法和图S1A)。作者选择了具有两个或多个分子内氢键和五个或更少的N-甲基化氨基酸的低能量设计。通过生成105-106个备选构象并评估能量和骨架RMSD与设计模型的关系,对所选大环肽的构象能量景观(landscape)进行了表征。作者选择了具有漏斗状能量景观(landscape)的序列,并向其相应的设计模型靠拢(见STAR方法和图S1B)。最后根据二面角的聚类方法评估整体结构多样性,每个残基分配一个torsion bin(A[右手螺旋区],B[右手折叠区],X [A的镜像],Y [B的镜像],O [phi < 0的氨基酸,残基i和i+1之间有顺式肽键],Z [phi > 0的氨基酸,残基i和i+1之间有顺式肽键]),并对合成的torsion bin进行聚类。
2.1 基于6-8残基的透膜环肽设计
为了评估设计方法的准确性,作者确定了2个7残基环肽和15个8残基环肽的X射线晶体结构。2个7残基和12个8残基环肽的结构与计算设计模型非常接近(骨架原子RMSD < 1.2Å )(图1;表S1)。在七个RMSD明显低于0.5Å的情况下,设计模型在X射线数据的实验分辨率之内。其中三个设计,D8.1,D8.2,和D8.12,是内部对称的:D8.1的骨架与设计模型的RMSD为0.21Å,其内部S2镜像对称性由4个β turns和2个γ turns motif组成;D8.2的C2对称性由4个β turns和2个α turns组成(RMSD为0.24 Å);D8.12的C2对称性有4个内部氢键,没有N-甲基化氨基酸(RMSD为0.48 Å)。D8.5不含N-甲基化氨基酸的p2通过形成4个β圈和一个α圈motifs的4个内部氢键稳定(RMSD 0.24Å )。D8.10的模型和X射线结构之间的RMSD为0.35Å,它的序列中有三个N-甲基化氨基酸和两个脯氨酸残基;它的其他三个氨基酸参与了三个内部氢键。
总的来说,实验结构和设计模型之间的密切匹配验证了该方法可以非常准确地指定大环肽结构。
图1:6-8个残基环肽的计算设计与结构验证
在发现大环肽按设计折叠后,作者探索了它们的透膜性。在平行人工膜渗透试验(PAMPAs)中,穿透人工膜的速率是通过基于质谱技术的供体和受体孔中肽浓度的量化来确定的(见STAR方法)。其中,8个6-mers、5个7-mers和10个8-mers的环肽Papp大于1×10-6cm/s(图2A)。在Caco-2试验中,渗透性大于1×10-6cm/s被认为是候选药物的充分穿膜的标志。由于Caco-2试验需要大量资源,作者集中测试较大的8-mers环肽,而没有对6和7个残基的大环肽进行这种试验。作者再次观察到Caco-2试验中的高穿膜性(图2B):在Caco-2试验中测试的8个含有8个残基的大环肽中,6个大环肽的Papp大于1×10-6cm/s,4个大环肽高于1×10-5cm/s。没有N-甲基化氨基酸的D8.1显示出非常高的Papp,为23.27×10-6cm/s。
虽然以前采用天然骨架和基于库的方法的研究已经鉴别了透膜大环肽,但这些大环肽通常需要多个N-甲基化或N-烷基化的氨基酸。例如,环孢素中11个氨基酸中有7个是N-甲基化的,这是以增加分子灵活性和合成难度为代价的。此处6-8个残基透膜肽中,N-甲基化氨基酸的数量在0到3之间。在结构验证的设计大环肽中,有5个大环肽,即D7.8、D8.1、D8.2、D8.5和D8.12,没有N-甲基氨基酸,突出了计算方法所提供的精确控制,通过内部氢键和脯氨酸设计出完全满足氢键供体的结构(图1;dataS2)。D8.1、D8.2、D8.5.p2和D8.12是缺乏N-甲基化或N-烷基化氨基酸的最大被动穿膜大环肽。在这些没有N-甲基化氨基酸的大环肽中,广泛的内部氢键使NH键得到充分满足;D8.1和D8.2有六个内部氢键,使结构稳定。作者也设计并测试了中间氨基酸被N-甲基化的变体,在所有情况下,具有额外N-甲基化的变体比原来的变体透膜性更强。然而,在所有的透膜大环肽中,透膜性与N-甲基化氨基酸的数量无关;例如,D8.1是PAMPA和Caco-2试验中透膜性最强的含有8个残基的大环肽,没有任何N-甲基化氨基酸。这说明在折叠结构中最大限度地满足氢键和少用N-甲基化是实现透膜性的一个可行策略。
图2:环肽在PAMPA和Caco-2试验中的穿膜性测量
2.2 基于9-12残基的透膜环肽设计
早期关于被动透膜肽的工作主要局限于5-7个氨基酸,因为纯亲脂多肽的透膜性随环肽大小的增加而急剧下降。作者为了确定其设计原则是否能规避这一趋势,使用计算管道设计了各种较大的大环肽,范围是9到12个氨基酸。
总的来说,几乎所有没有暴露NH基团的多肽都是可穿膜的。与非设计的大环化合物的结果相反,透膜性和大小之间没有强烈的相关性;事实上,一些10个和11个残基的肽是高度可穿膜的。不具有穿膜性或显示出低穿膜性的大环肽的晶体结构进一步支持了减少NH暴露的重要性。尽管减少氢键供体暴露对于透膜性似乎是必要的,但D10.21、D10.22和D10.23的X射线结构与它们的设计模型非常吻合(RMSD<1Å)且没有暴露的NH基团,但依然没有透膜性。
图3:9-12个残基环肽的计算设计与结构验证
2.3 变色龙(chameleonic)透膜环肽的设计
虽然结果表明顺式肽键本身并不增加透膜性,但肽键的顺反异构化可能是一个强大的设计原则,用于生成具有开放状态(极性基团暴露出来与治疗靶标相互作用)和透膜封闭状态(所有NH基团形成肽内氢键)的环肽。顺反异构化的动力学相对较慢,这使得一个多肽可以填充多种构象,这些构象可以快速地相互转换,从而具有生物相关性。有一些证据表明,环孢素中顺式-肽键周围的异构化会使不同的结合能力和穿膜状态相互转换。为了测试这一假设,作者设计了进行顺反异构化的大环肽(D8.21、D8.31和D9.16),并成功地解出了与设计模型或预测的可替用的低能结构之一相匹配的晶体结构(图4)。
图4:构象转换大环肽的设计和结构表征
3.讨论
作者通过使用多种局部结构和内部氢键的极性基团的构象屏蔽来实现这种高渗透性。作者设计、合成并验证了84个具有良好渗透性的结构不同的大环,包括6-8个具有高渗透性且没有N-甲基化氨基酸的环肽,以及9-12个具有单一N-甲基化氨基酸的透膜性环肽。在作者成功确定晶体或核磁共振结构的35种设计中,25种紧密匹配的大环(RMSD < 1 Å)中有21种设计状态都是膜渗透的。虽然35种设计中的29种模型与相应的实验晶体或核磁共振结构之间的非常接近的一致性(RMSD < 1.2Å)表明设计方法具有非常高的准确性,但不能排除缺乏x射线或核磁共振结构的设计可能会折成对渗透率非常重要的交替构象。
本文提出的设计方法和可渗透膜的环肽为环肽疗法的开发提供了基础。基于能量景观的方法设计了具有环孢素样变色化行为的多肽,随着溶剂极性的变化在亲脂状态和第二种相对极性状态之间切换,这使设计的环肽能够在结合细胞内治疗靶点与暴露的极性基团的前提下,同时保持膜渗透性。
参考资料
Bhardwaj G, O’Connor J, Rettie S, et al. Accurate de novo design of membrane-traversing macrocycles[J]. Cell, 2022.
https://doi.org/10.1016/j.cell.2022.07.019
--------- End ---------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
●Nature评论|AlphaFold如何在结构生物学中实现AI的全部潜力●AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
●Science|利用深度学习设计蛋白质功能位点
●分子之心发力!业界首个功能完整的AI蛋白设计平台MoleculeOS首次公开
●Nat Mach Intel|用语言模型进行可控的蛋白质设计
●JCIM|药物发现中基于AI的蛋白质结构预测:影响和挑战●Commun Biol|人工智能指导下的内在无序蛋白质的构象挖掘
●Nat Methods|ScanNet:基于结构的蛋白质结合位点预测深度学习模型
●Nat Methods|ColabFold:让所有人都能进行蛋白质折叠
●Nat Rev Mol Cell Bio|用人工智能预测蛋白质结构的前景和机遇●Nat Commun|使用AlphaFold2改进对蛋白质-蛋白质相互作用的预测
●Nat Commun|在生物科学领域应用深度学习的当前进展和开放挑战●Nature|仅根据靶点结构设计蛋白质的结合蛋白
●Nature|确定蛋白质结构的短暂状态
●Facebook|从数百万个预测蛋白质结构中学习逆折叠,预测序列信息
●AI+蛋白质错误折叠疾病的药物开发|Congruence获5000万美元A轮融资●BIB|通过深度多任务学习准确预测RNA、DNA 和蛋白质结合的内在无序残基
●Curr Opin Struc Biol|蛋白质设计的深度生成建模
●Nat Methods|用AlphaFold以原子精度预测蛋白质结构
●Drug Discov Today|基于AI的蛋白质结构数据库有可能加速罕见病研究●Nat Methods特刊|2021年度方法:蛋白质结构预测●Nature Outlook|借助算法和模拟将蛋白质折叠的瞬时结构转变为药物靶点
●Nature|人工智能助力蛋白质折叠预测
●Science|AI揭示了蛋白质复合物的结构
●BioRxiv|利用AlphaFold-Multitimer进行蛋白质复合物预测