“照片51”:DNA双螺旋的阿凡达
加星标,才能不错过每日推送!方法见文末动图
2023年是DNA双螺旋结构发现七十周年。1953年2月28日,沃森和克里克根据女科学家弗兰克林拍摄的X射线衍射照片,成功推断出遗传物质DNA的三维结构模型。双链碱基配对模式的简约之美,直观提示了遗传物质的复制机理,瞬间开启了通往分子生物学的快速通道。
如果我们用一个问卷来调查1901年以来所有诺贝尔生理学或医学奖项的知名度,排名第一的很可能就是1953年DNA双螺旋结构的发现。双链碱基配对背后呼之欲出的遗传物质复制机理,使该发现被誉为生命科学史上继达尔文演化论和孟德尔遗传学之后的第三座里程碑。
发现人之一沃森 (James Watson) 出版于1968年的The Double Helix(《双螺旋》)一书,写作手法引人入胜,非常适合中学生以及还未确定专业的本科生用来测试自己对基础生物学是否有兴趣。但是很多对生物化学有热情的青年学生在读完此书后可能会有不过瘾的感觉,尤其是无法在科普意义上理解沃森和克里克 (Francis Crick) 如何从X射线衍射照片推断出DNA的二级结构。令人遗憾的是,沃森此书的视角过于主观,对女科学家弗兰克林 (Rosalind Franklin) 的重要贡献未能给出全面公正的评价。
1970年代以来,围绕着DNA双螺旋这一经久不衰的话题,也涌现了不少出色的科学史专著与文章。但我们很难发现一篇独立的科普著述,能从弗兰克林著名的“照片51”出发,把从X射线衍射数据推断DNA结构的要点都讲清楚。本文试图将很多零散的文献材料整合起来,对这个知名度极高的科学史案例给出不失新意的诠释。
首先简要回顾一下1953年3月前与DNA研究有关的几个重要事件:
· 1944年:埃弗里 (Oswald Avery) 等人给出了扎实的实验证据,表明DNA是肺炎链球菌的“转化因素”,大体确立了遗传物质的本质是DNA;
· 1951年11月:刚到剑桥大学卡文迪许实验室不久的博士后沃森,对导师肯德鲁 (John Kendrew) 的蛋白结构研究毫无兴趣。他深知在伦敦的国王学院 (King’s College) 才是用X射线衍射研究DNA结构的“前沿阵地”,于是经常主动前来打探最新的进展。弗兰克林在一个报告里讨论了她在DNA纤维样品研究中发现的两种构型:A型 (她最早称之为“类晶体型”,环境相对湿度小于75%) 和 B型 (她最早称之为“高湿型”,环境相对湿度大于90%);
· 1952年:查戈夫 (Erwin Chargaff) 在回看自己积累的数据时发现,DNA所含的四种碱基中,腺嘌呤 (Adenine, A) 与胸腺嘧啶 (Thymine, T) 数量几乎一样,鸟嘌呤 (Guanine, G) 与胞嘧啶 (Cytosine, C) 的数量也比较接近;
· 1953年1月:沃森和克里克曾在1952年提出过一个错误的DNA三螺旋模型,卡文迪许实验室主任小布拉格爵士 (Lawrence Bragg) 明令禁止他们与弗兰克林和威尔金斯 (Maurice Wilkins) 竞争,必须放弃DNA结构建模的尝试。沃森在大半年过去后,借着美国加州理工大学的鲍林教授 (Linus Pauling) 将要发表DNA三链模型的最新消息再次来到国王学院。虽然沃森与弗兰克林的谈话进行得很不愉快,但他在威尔金斯那里却获得了意外收获,看到了弗兰克林在1952年5月拍摄的B型DNA“照片51”:· 1953年2月:沃森回到剑桥后转述给克里克的“照片51”样貌虽然很有信息量,但他并不知道照片背后的一些重要参数。克里克利用私交邀请威尔金斯前来共进午餐,同时表明他和沃森已获得小布拉格主任的准许而将重新开始DNA结构的建模。威尔金斯不愿向克里克直接提供“照片51”的具体参数,但他提到弗兰克林在1952年12月曾向英国医学研究委员会 (Medical Research Council, MRC) 提交过一篇书面进展报告,而克里克的博士论文导师佩鲁兹 (Max Perutz) 正好是MRC委员会的成员。
在揭秘“照片51”背后隐藏的DNA分子结构信息之前,我们需要掌握一些X射线衍射的基础知识。很多生物大分子较难形成具有良好衍射性质的晶体,而DNA要等到1969年才首次结晶成功。幸运的是,不少线性多聚体分子在细胞外的分离纯化过程中容易形成纤维。当实验者用垂直于纤维轴方向的X射线照射这些样品时,得到的衍射图案中蕴涵着分子水平上的尺度信息 (图1)。
能够形成纤维的生物大分子一般是组分和单体结构已知的多聚体,比如DNA就是由四种脱氧核苷酸通过3’,5’-磷酸二酯键首尾相连的序列。每一条DNA单链都有方向性,一端被称为5’末端,另一端则被称为3’末端 (图2)。研究者若能把来自DNA纤维X射线衍射分析的尺度数据与已知的单体结构信息相结合,通过立体化学的限制条件来建立结构模型,往往事半功倍。
图2. DNA是一种具有方向性的多聚体大分子。[Voet, D. & Voet, J.G. (2011) Biochemistry, 4th edition, John Wiley & Sons Inc.]
无论是类晶型 (crystalline,比如A型DNA) 还是非晶型 (non-crystalline,比如B型DNA) 的纤维,其X射线衍射图案往往都有沿着纤维轴方向分布的间距相等的层线 (layer lines, 参见图1中的衍射图案),而层线的间距又与大分子结构的周期性有关。
图3. 傅里叶变换是分析X射线衍射数据的重要数学工具。[Freeman, D. (2011) MIT Course 6.003, “Signals and Systems”, Lecture 20.]
有周期性的晶体或者纤维结构,可以用周期尺度为D的格栅模型 (gratings) 来描述。单束X射线穿过格栅后会被分解为多束电磁波,它们抵达检测屏幕时由于路程差而产生了相位差,从而通过干涉效应在胶片上留下衍射强度分布图样。多束射线相互干涉后的振幅分布函数F(θ),一般取值为复数,可以通过并不复杂的数学推导后用一个积分来计算 (图3)。公式中的f(x) 函数代表纤维中分子结构的电子密度分布,x为格栅模型的任意一点与纤维轴原点的距离,λ是入射X射线的波长,θ为每束射线改变方向后与入射方向的夹角,而虚数单位i (-1的平方根) 在电子工程文献中常用j来表示。在散射角θ一般比较小的情况下,我们可以用sin(θ) ≈ θ的近似,这样上面这个积分公式就成了著名的傅里叶变换 (Fourier transform) 。
纤维物质中一个相当常见的结构元素就是螺旋,而克里克本人在博士论文研究过程中,曾在1952年与两位X射线衍射专家合作,发表了螺旋结构傅里叶变换的CCV理论 (Cochran, Crick & Vand)。
图4. 螺旋结构的傅里叶变换。[Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]
CCV理论曾被应用于已知为螺旋结构的多肽链X射线衍射分析,与实验数据的一致性相当好。螺旋结构经过傅里叶变换后展示的衍射图案中,有一个非常显眼的“X” (图4, Saint Andrew Cross)。描述一个单链螺旋最重要的两个参数是:螺距P (pitch),半径 r (radius)。当一个螺旋半径不变而螺距变大时,其傅里叶变换预测的“X”图案中层线间距会变小 (图4,a和b);当一个螺旋的螺距不变而半径变大时,其“X”的两臂与子午线的夹角δ会变小 (图4,a和c)。需要特别注意的是,图4b显示的“X” 夹角δ貌似变大了,这其实是层线间距变小后产生的错觉。如果我们把δ的大小定义为宽度w与层线数l (图4中的例子:l = 10) 比值的反正切函数,就会发现图4a和图4b中的两个“X”在层线数相同时宽度w是一样的。
图5. “照片51”中的四大显著特征:间距相等的层线、存在“X”图案、菱形模式、第四级层线消失
沃森虽然对CCV理论一知半解,但通过与克里克一年多的交流,第一眼看到“照片51”中的“X”也能立刻知道DNA结构中含有螺旋链。克里克结合沃森转述的“照片51”概貌与弗兰克林MRC报告中的重要信息,总结出对搭建DNA分子模型非常重要的四大特征 (图5):· “X”图案提示了螺旋链的存在,但还不能确定有几条链。通过弗兰克林报告中给出的夹角δ,克里克可以推算出B型DNA的螺旋半径约为1纳米 (螺旋半径r与傅里叶变换后图案中的δ正切函数值成反比);· “照片51”中央有个白色圆点,这是由于原点附近的“赤道层线” (l = 0,也可称为第零级层线) 与第一级层线 (l = 1) 衍射强度过大,为避免整张底片的过度曝光,实验时一般用圆柱形铅块来遮挡。通过度量从第二级层线开始的平均间距,很容易推算出B型DNA的螺距约为3.4纳米;· “X”中央的上下左右共有四个菱形区域 (图6),其中上下两个菱形中没有任何衍射强度。克里克据此可以推断:DNA分子的核糖-磷酸骨架在外,而碱基在内。这两个菱形在子午线方向的对角线跨度为10个层线,提示B型DNA每圈螺旋中有10个核苷酸单体 (也就是10个磷原子);· 第四级层线的消失:克里克根据他自己的CCV理论做了一番数学推导后发现,两条共轴而相互缠绕的螺旋链,投影到二维平面上就是两个有相位差的正弦波(或余弦波),若它们的相位差是螺距的3/8,那么在傅里叶变换后叠加就会产生第四级层线的相消 (图6)!这也是从1953年2月开始,沃森和克里克把精力集中在双链螺旋模型搭建上的主要依据。
虽然有了共轴而相互缠绕的双链、碱基在内、以及螺距和半径等重要信息和参数,但沃森在搭建结构模型过程中还是遭遇了各种困难。他先是假设了所谓的“同类配对原理”,尝试把两条链上的碱基按照A:A,C:C,G:G, 和T:T来对应排列 (图7)。腺嘌呤(A)和鸟嘌呤(G)是双杂环结构,而胞嘧啶(C)和胸腺嘧啶(T)是单杂环结构,因此沃森的嘌呤对在尺度上明显要大于嘧啶对,放到螺旋内部根本不可能嵌入一个规则的圆柱。另外“同类配对原理”也无法解释前文提及的查戈夫碱基比例经验规则。
图7. 沃森根据“同类配对原理”构建的双链DNA结构模型示意图。[Watson, J.D. (1968) The Double Helix, Atheneum Press]
当时与沃森和克里克共用一个办公室的多诺休 (Jerry Donohue) 看到这个模型后也指出,沃森依据戴维森的教科书选用的鸟嘌呤(G)和胸腺嘧啶(T)互变异构体是烯醇式,而多诺休认为在活细胞的生理环境中应该是酮式 (图8)。在多条证据推翻“同类配对原理”后,沃森才开始摆弄根据酮式互变异构体重新制作的碱基纸板模型,试图寻找新的双链间碱基配对模式。根据沃森在The Double Helix一书中的回忆 (克里克的版本与之有明显的出入),纸板模型让他顿悟了A:T对与C:G对在总体外形轮廓上相似,而其它的两两组合方案都无法做到这一点。使用G和T的酮式互变异构体后,A:T对与C:G对之间都至少可以形成两个氢键 (图8),而这一配对模式又能符合查戈夫经验规则,让克里克有一种好到难以置信的感觉。
图8. 鸟嘌呤(Guanine)和胸腺嘧啶(Thymine)的互变异构对发现碱基配对的重要性。[Crick, F.H.C. & Watson, J.D. (1954) Proc. Royal Soc. A 223: 80-96]
在沃森领悟到碱基配对的同时,克里克还从弗兰克林书面报告中发现了一个只有他能领会的要点: A型DNA纤维由于接近晶体,弗兰克林指出其晶胞 (unit cell) 属于面心单斜类型 (face-centered monoclinic),并包含C2空间群的对称元素 (图9)。克里克在与导师佩鲁兹一起研究载氧血红蛋白的晶体结构时,就曾与C2空间群打过交道,非常了解其数学和物理意义。他深知B型DNA纤维只是水含量增加,其内蕴的对称性应该与A型DNA一致。C2空间群的存在意味着双链DNA的二重对称轴 (dyad axis of symmetry) 必须在图9垂直于纸面的方向,要求沿着纤维轴的双链互为反平行 (anti-parallel)。如果按照沃森最初构想的平行 (parallel) 双链 (图7),那么对称轴将平行于纤维轴,这与C2空间群的存在是不可调和的矛盾。
图9. 克里克根据面心单斜C2空间群推断出DNA双链反平行。[Lydon, J.E. (2003) Liquid Crystals Today 12: 1-9; Lucas, A.A. (2008) J. Chem. Educ. 85: 737-743]
克里克及时领悟到双链必须反平行,也解决了沃森在搭建模型中的一个立体化学困难。从“照片51”的分析中得到单股螺旋的螺距为3.4纳米,相互缠绕的双链如果是平行的,那么表观螺距 (apparent pitch) 就应该是6.8纳米,相邻碱基间的转角则为18度。只有18度的转角使得模型的原子间距过于拥挤,整个结构显得过紧而不合理 (图10)。而一旦采用了反平行模式,整个双链的表观螺距就还是3.4纳米,相邻碱基间的转角成了36度,构建双链模型的最后一个困难就迎刃而解。
图10. 弗兰克林MRC报告中的参数与双链反平行对DNA结构建模的重要性。
DNA双螺旋结构的发现过程彰显了跨学科合作的重要性。弗兰克林除了获得“照片51”这一至关重要的实验数据,她本人的理论分析离正确的双螺旋模型 (图11) 也只有两步之遥。克鲁格教授 (Aaron Klug) 在仔细阅读了弗兰克林当年留下的研究笔记本后发现:
· 她了解查戈夫的经验定则,写下了两个嘌呤碱基 (A和G) 以及两个嘧啶碱基 (C和T) 之间可以互换的正确想法,已经接近碱基配对的概念;
· 她画出了DNA的平行双链螺旋示意图,只是没有意识到C2空间群的重要性,尚未领悟到双链走向必须反平行。克里克认为弗兰克林若没被他和沃森抢先,也能在几个月后解出DNA的双螺旋结构,只是这一过程会是循序渐进的,而不是如雷电般的灵光乍现 (… but the results would have come out gradually, not as a thunderbolt, in a short paper in Nature.)。
图11. 沃森和克里克搭建的DNA双螺旋模型。[Watson, J.D. & Crick, F.H.C. (1953) Nature 171: 737-738; Watson, J.D. (1968) The Double Helix, Atheneum Press.]
1958年,弗兰克林不幸罹患癌症而在37岁时英年早逝,令人扼腕叹息。如果她能得享天年,那么1962年的诺贝尔生理学奖极有可能是她与沃森和克里克分享。历史也注定不会忘记这位女科学家的卓越贡献,英国王家学会 (Royal Society) 在2003年设立了“弗兰克林奖章” (Rosalind Franklin Award),每年表彰一位在科技/工程/数学 (STEM) 领域有杰出贡献的女科学家。
推荐阅读
1 Olby, R. (1974) The Path to the Double Helix, University of Washington Press.
2 Olby, R. (2009) Francis Crick: Hunter of Life’s Secrets, Cold Spring Harbor Laboratory Press.
3 Markel, H. (2021) The Secret of Life: Rosalind Franklin, James Watson, Francis Crick, and the Discovery of DNA's Double Helix, W. W. Norton & Company.
本文原载于微信公众号“药时代”,《返朴》此次发表时作者修订了部分文字和图片。
相关阅读
2 20世纪最伟大生物学家:生物学研究有什么特别之处?丨展卷
近期推荐
1 怀念朱照宣先生
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
长按下方图片关注「返朴」,查看更多历史文章