1962年生理学奖:“照片51”与DNA双螺旋
徐亦迅博士 | "诺光灯"下的科学史掠影 (中)
预计阅读时间: 16分钟
如果我们用一个问卷调查来测试1901年以来所有诺贝尔生理学或医学奖项的知名度,排名第一的很可能就是1953年DNA双螺旋结构的发现。双链碱基配对背后呼之欲出的遗传物质复制机理,使该发现被誉为生命科学史上继达尔文演化论和孟德尔遗传学之后的第三座里程碑。
发现人之一沃森 (James Watson) 出版于1968年的《The Double Helix》一书,写作手法引人入胜,非常适合中学生以及还未确定专业的本科生作为测试自己对基础生物学是否会有兴趣的读物。但是很多对生物化学有热情的青年学生在读完此书后可能会有不过瘾的感觉,尤其是无法在科普意义上理解沃森和克里克 (Francis Crick) 如何从X射线衍射照片推断出DNA的二级结构。令人遗憾的是,沃森此书的视角过于主观,对女科学家弗兰克林 (Rosalind Franklin) 的重要贡献未能给出全面公正的评价。
1970年代以来,有关DNA双螺旋这一经久不衰的话题也涌现了不少出色的科学史专著与文章。但我们很难发现一篇独立的科普著述,能从弗兰克林著名的“照片51”出发,把从X射线衍射数据推断DNA结构的要点都讲清楚。本文试图将很多零散的文献材料整合起来,对这个知名度极高的科学史案例给出不失新意的诠释。首先简要回顾一下1953年3月前与DNA研究有关的几个重要事件:
在揭秘“照片51”背后隐藏的DNA分子结构信息之前,我们需要掌握一些X射线衍射的基础知识。很多生物大分子较难形成具有良好衍射性质的晶体,而DNA要等到1969年才首次结晶成功。幸运的是,不少线性多聚体分子在细胞外的分离纯化过程中容易形成纤维。当实验者用垂直于纤维轴方向的X射线照射这些样品时,得到的衍射图案中包含着分子水平上的尺度信息 (图十六)。
图十六来源:Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.
能够形成纤维的生物大分子一般是组分和单体结构已知的多聚体,比如DNA就是由四种脱氧核苷酸通过3’,5’-磷酸二酯键首尾相连的序列。每一条DNA单链都有方向性,一端被称为5’末端,另一端则被称为3’末端 (图十七)。研究者若能把来自DNA纤维X射线衍射分析的尺度数据与已知的单体结构信息相结合,通过立体化学的限制条件来建立结构模型往往事半功倍。
图十七:DNA是一种具有方向性的多聚体大分子 [Voet, D. & Voet, J.G. (2011) Biochemistry, 4th edition, John Wiley & Sons Inc.]
无论是类晶型(crystalline,比如A型DNA)还是非晶型(non-crystalline,比如B型DNA)的纤维,其X射线衍射图案往往都有沿着纤维轴方向分布的间距相等的层线(layer lines, 参见图十六中的衍射图案),而层线的间距又与大分子结构的周期性有关。
图十八来源:Freeman, D. (2011) MIT Course 6.003, “Signals and Systems”, Lecture 20.
有周期性的晶体或者纤维结构,可以用周期尺度为D的格栅模型(gratings)来描述。单束X射线穿过格栅后会被分解为多束电磁波,它们抵达检测屏幕时由于路程差而产生了相位差,从而通过干涉效应在胶片上留下衍射强度分布图样。多束射线相互干涉后的振幅分布函数F(θ),一般取值为复数,可以通过并不复杂的数学推导后用一个积分来计算 (图十八)。公式中的f(x) 函数代表纤维中分子结构的电子密度分布,x为格栅模型的任意一点与纤维轴原点的距离,λ是入射X射线的波长,θ为每束射线改变方向后与入射方向的夹角,而虚数单位i (-1的平方根) 在电子工程文献中常用j来表示。在散射角θ一般比较小的情况下,我们可以用sin(θ) ≈ θ的近似,这样上面这个积分公式就成了著名的傅里叶变换 (Fourier transform)。
纤维物质中一个相当常见的结构元素就是螺旋,而克里克本人在博士论文研究过程中,曾在1952年与两位X射线衍射专家合作,发表了螺旋结构傅里叶变换的CCV理论 (Cochran, Crick & Vand)。
图十九:螺旋结构的傅里叶变换 [Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]
CCV理论曾被应用于已知为螺旋结构的多肽链X射线衍射分析,与实验数据的一致性相当好。螺旋结构经过傅里叶变换后展示的衍射图案中,有一个非常显眼的“X” (图十九, Saint Andrew Cross)。描述一个单链螺旋最重要的两个参数是:螺距P (pitch),半径 r (radius)。当一个螺旋半径不变而螺距变大时,其傅里叶变换预测的“X”图案中层线间距会变小 (图十九,a和b);当一个螺旋的螺距不变而半径变大时,其“X”的两臂与子午线的夹角δ会变小 (图十九,a和c)。需要特别注意的是,图十九b显示的“X” 夹角δ貌似变大了,这其实是层线间距变小后产生的错觉。如果我们把δ的大小定义为宽度w与层线数l (图十九中的例子:l = 10) 比值的反正切函数,就会发现图十九a和b中的两个“X”在层线数相同时宽度w是一样的。
图二十:“照片51”中的四大显著特征
沃森虽然对CCV理论一知半解,但通过与克里克一年多的交流,第一眼看到“照片51”中的“X”也能立刻知道DNA结构中含有螺旋链。克里克通过沃森转述的“照片51”概貌结合弗兰克林MRC报告中的重要信息,总结出对搭建DNA分子模型非常重要的四大特征 (图二十):
图二十一:“照片51”中的菱形图案与第四级层线的消失
虽然有了共轴而相互缠绕的双链螺旋、碱基在螺旋的内侧、以及螺距和半径等重要信息和参数,但沃森在搭建结构模型过程中还是遭遇了各种困难。他先是假设了所谓的“同类配对原理”,尝试把两条链上的碱基按照A:A,C:C,G:G, 和T:T来对应排列 (图二十二)。腺嘌呤(A)和鸟嘌呤(G)是双杂环结构,而胞嘧啶(C)和胸腺嘧啶(T)是单杂环结构,因此沃森的嘌呤对在尺度上明显要大于嘧啶对,放到螺旋内部根本不可能嵌入一个规则的圆柱。另外“同类配对原理”也无法解释前文提及的查戈夫碱基比例经验规则。
图二十二:沃森根据“同类配对原理”构建的双链DNA结构模型示意图 [Watson, J.D. (1968) The Double Helix, Atheneum Press]
当时与沃森和克里克共用一个办公室的多诺休 (Jerry Donohue) 看到这个模型后也指出,沃森依据戴维森的教科书选用的鸟嘌呤(G)和胸腺嘧啶(T)互变异构体是烯醇式,而多诺休认为在活细胞的生理环境中应该是酮式 (图二十三)。在多条证据推翻“同类配对原理”后,沃森才开始摆弄根据酮式互变异构体重新制作的碱基纸板模型,试图寻找新的双链间碱基配对模式。根据沃森在《The Double Helix》一书中的回忆 (克里克的版本与之有明显的出入),纸板模型让他顿悟了A:T对与C:G对在总体外形轮廓上相似,而其它的两两组合方案都无法做到这一点。使用G和T的酮式互变异构体后,A:T对与C:G对之间都至少可以形成两个氢键 (图二十三),而这一配对模式又能符合查戈夫经验规则,让克里克有一种好到难以置信的感觉。
图二十三:鸟嘌呤(Guanine)和胸腺嘧啶(Thymine)的互变异构对发现碱基配对的重要性 [Crick, F.H.C. & Watson, J.D. (1954) Proc. Royal Soc. A 223: 80-96]
在沃森领悟到碱基配对的同时,克里克还从弗兰克林书面报告中发现了一个只有他能领会的要点: A型DNA纤维由于接近晶体,弗兰克林指出其晶胞(unit cell) 属于面心单斜类型 (face-centered monoclinic),并包含C2空间群的对称元素 (图二十四)。克里克在与导师佩鲁兹一起研究载氧血红蛋白的晶体结构时,就曾与C2空间群打过交道,非常了解其数学和物理意义。他深知B型DNA纤维只是水含量增加,其内蕴的对称性应该与A型DNA一致。C2空间群的存在意味着双链DNA的二重对称轴 (dyad axis of symmetry) 必须在图二十四垂直于纸面的方向,要求沿着纤维轴的双链互为反平行(anti-parallel)。如果按照沃森最初构想的平行(parallel)双链 (图二十二),那么对称轴将平行于纤维轴,这与C2空间群的存在是不可调和的矛盾。
图二十四:克里克根据面心单斜C2空间群推断出DNA双链反平行 [Lydon, J.E. (2003) Liquid Crystals Today 12: 1-9; Lucas, A.A. (2008) J. Chem. Educ. 85: 737-743]
克里克及时领悟到双链必须反平行,也解决了沃森在搭建模型中的一个立体化学困难。从“照片51”的分析中得到单股螺旋的螺距为3.4纳米,相互缠绕的双链如果是平行的,那么表观螺距 (apparent pitch) 就应该是6.8纳米,相邻碱基间的转角为18度。只有18度的转角使得模型的原子间距过于拥挤,整个结构显得过紧而不合理 (图二十五)。而一旦采用了反平行模式,整个双链的表观螺距就还是3.4纳米,相邻碱基间的转角成了36度,构建双链模型的最后一个困难就迎刃而解。
图二十五:弗兰克林MRC报告中的参数与双链反平行对DNA结构建模的重要性
DNA双螺旋结构的发现史彰显了跨学科合作的重要性。弗兰克林除了获得“照片51”这一至关重要的实验数据,她本人的理论分析离正确的双螺旋模型 (图二十六) 也只有两步之遥。克鲁格教授 (Aaron Klug) 在仔细阅读了弗兰克林当年留下的研究笔记本后发现:
克里克认为弗兰克林若没被他和沃森抢先,也能在几个月后解出DNA的双螺旋结构,只是这一过程会是循序渐进的,而不是如雷电般的灵光乍现 (… but the results would have come out gradually, not as a thunderbolt, in a short paper in Nature)。
图二十六来源:Watson, J.D. & Crick, F.H.C. (1953) Nature 171: 737-738; Watson, J.D. (1968) The Double Helix, Atheneum Press.
1958年,弗兰克林不幸罹患癌症而在37岁时英年早逝,令人扼腕叹息。如果她能得享天年,那么1962年的诺贝尔生理学奖极有可能是她与沃森和克里克分享。历史也注定不会忘记这位女科学家的卓越贡献,英国王家学会 (Royal Society) 在2003年设立了“弗兰克林奖章” (Rosalind Franklin Award),每年表彰一位在科技/工程/数学(STEM)领域有杰出贡献的女科学家。
【推荐阅读】Olby, R. (1974) The Path to the Double Helix, University of Washington Press.
版权声明:
文中图片取自网络,根据CCO协议使用,版权归拥有者。
本文为药时代专栏作者的原创文章,授权药时代独家首发。欢迎转发到微信群、朋友圈。谢绝转载。
任何问题,请与我们联系。衷心感谢!
推荐阅读