查看原文
其他

《自然》:量子计算与生物学的联系愈发紧密

光子盒研究院 光子盒 2021-12-15
光子盒研究院出品
 


9月21日,加州大学洛杉矶分校的加州纳米系统研究所(CNSI)成立了一个量子生物学中心。同一天,耶鲁大学宣布将启动并领导一个量子计算化学中心,与生物学关系密切。本月早些时候,美国国家科学基金会宣布斥资2500万美元在芝加哥建立量子生物学研究所,通过官方拨款的形式支持量子技术在生物学中的应用。
 
事实上,近年来量子技术与生物学的联系愈发紧密,特别是量子计算。理论表明,量子计算可以做到很多事情,比如它能够大规模加速一些生物信息学的计算。
 
以下内容来自《自然·方法学》杂志:
 
量子计算是一个炙手可热的领域。美国德州大学奥斯汀分校的计算机科学家Scott Aronson(玻色取样理论提出者)断言,量子计算机“很快就会把地球上最快的超级计算机甩在身后”。
 
研究人员可以在量子计算领域找到充足的资金来源。欧洲量子旗舰计划在其门户网站上,列出了大量的资助项目,旨在利用量子技术“启动一个有竞争力的欧洲产业”。一个由欧洲量子技术研究资助者组成的跨国网络启动了QuantERA计划。
 
美国国会通过了12亿美元的《国家量子倡议法案》。美国国家科学基金会(NSF)已经资助了三个“量子飞跃挑战”研究所(Quantum Leap Challenge Institutes),并将资助更多项目。三个研究所将利用量子力学在原子和亚原子尺度上观察、操纵和控制粒子和能量的行为,引领“下一代传感、计算、建模和通信技术”。
 
对科学的热情,加上获得资助的机会,等于巨大的推动力。一些生物医学科学家已经开始研究量子计算如何帮助他们在生物学的许多领域中开发和应用算法和机器学习方法,如蛋白质设计。当生物学家使用这项技术时,他们会想知道幕后发生了什么。当经典计算机为他们服务时,“尽管计算机很精密,但它们本质上只是计算速度非常快的机器。”纽约非营利性机构Flatiron的系统生物学研究员Vikram Mulligan说。计算机生成的电影、电子游戏、与数百公里外的人交谈——都可以归结为一系列快速完成的数学运算。量子计算机在算术方面实际上相当缓慢和糟糕,”他说,但在其他任务上速度惊人。
 
 
谷歌、霍尼韦尔、IBM和微软等公司正在构建量子计算系统,并展示了它们的实力。
 
许多规模较小的量子计算公司也在开发产品和服务,包括硬件和硬件组件、软件工具、模拟选项和基于云的量子计算服务。这些公司包括:剑桥量子计算、D-Wave Systems、ColdQuanta、IonQ、PsiQuantum、Rigetti Computing、Silicon Quantum Computing、Strangeworks、Xanadu和Zapata Computing等。
 
2019年,来自加州大学圣巴巴拉分校和谷歌量子人工智能实验室的John Martinis和他的同事提出了使用一个名为Sycamore(悬铃木)的量子处理器,并与学术伙伴一起对其性能进行了评估。该处理器花了200秒完成了一项与随机数生成相关的任务,根据该小组的说法,一台最先进的经典超级计算机完成该任务将大约需要一万年的时间。作者指出“量子处理器因此达到了量子霸权的里程碑。”量子计算做到了经典计算机所不能做到的——至少在合理的时间内是不可能的事情。
 
2012年,加州理工学院的理论物理学家John Preskill创造了“量子霸权”(quantum supremacy)这个词。但有些人认为,这个词与白人至上(white supremacy)的“令人反感的政治立场”有关,此外“量子霸权”加剧了对量子技术的过度炒作。Preskill回应称,他预料到了第二个问题,但没能预料到第一个。“我预计量子计算机将对社会产生革命性的影响,但这可能还需要几十年的时间,”他说。
 
有些人——比如量子计算公司IonQ负责业务开发的Denise Ruffner——更喜欢“量子优势”(quantum advantage)这个词,但Preskill认为“优势”只是以微弱优势取胜。他表示,原则上,量子计算机的速度“远远超过”经典计算机。
 
“量子霸权这个概念并不像听起来那么有趣,”科罗拉多大学医学院的Lawrence Hunter说,他致力于计算机和生物医学的结合。他说,这只是意味着“一台可行的量子计算机。争议归结为量子计算机是否已经有效地产生了任何事物的指数级加速。”在他看来,到目前为止,量子计算在密码学和模拟量子化学方面都很有用处,在量子化学中,量子力学被应用于研究分子如何运动等方面。“超越这些狭窄领域的实际应用很快就会到来,生物序列分析可能是下一个重要的应用领域之一,”Hunter说。
 
牛津大学研究员Charlotte Deane合著了一篇关于量子计算在计算分子生物学中的应用前景的文章,这导致许多公司前来拜访他。Deane说,生物医学研究人员应该把量子计算看作“一种即将到来但尚未准备好的技术”。接下来的几年将揭示“它将帮助解决哪些问题,以及它将真正增进我们的理解”。她看到了“从长远来看不可思议的潜力”——例如,模拟光合作用或固氮催化的分子过程。
 
耶鲁大学研究员Mark Gerstein说,他的同事们对量子计算在物理科学中应用的热情特别高涨,对计算生物学和更广泛的生物学的兴趣也在增长。他的项目横跨生物学和信息学。
 
Mark Gerstein。图片来源:耶鲁大学
 
2020年,V. K. Mulligan和几家研究机构的同事发布了一篇关于他们如何在量子计算机上设计肽的预印论文,这引发了许多与制造量子计算硬件的公司以及开发工具的研究人员的对话,这些工具要么将问题映射到量子硬件上,要么用普通的经典计算机。
 
Mulligan表示:“可以理解的是,科学界仍然对任何关于量子计算的说法持保留态度,这是合理的。虽然量子计算的潜力巨大,但是我们仍处于早期阶段。”
 
马克斯·普朗克信息学研究所的Thomas Lengauer说,量子计算的研究计划包括如何将其应用于生命科学中的组合优化和机器学习问题。他没有参与量子计算的研究,但一直紧跟这一领域。他说,量子计算的应用远远超出了生命科学,延伸到了数据驱动科学的所有方面。
 
Mark B. Gerstein与人合著了一篇论文,这篇论文是由美国国家卫生研究院(NIH)下属的国家精神卫生研究所(NIMH)的一系列讨论得出的。他说,这是NIH探索如何支持对量子计算感兴趣并参与其中的生物学家的方法的一部分。例如更广泛的神经科学领域对量子方法如何应用于深度学习和机器学习感兴趣。
 
这些NIH会议汇集了量子计算、计算生物学、神经科学和基因组学领域的研究人员。NIMH的组织者是Geetha Senthil和她的同事Thomas Lehner,他们目前在纽约基因组中心工作。正如Senthil所说,量子现象可用于计算解决化学和物理科学中的复杂问题的想法“激发了我们的好奇心”,去探索如何将量子计算应用于生物医学,“特别是在大数据和多维分析带来的挑战越来越大的情况下”。
 
除了她在NIMH的角色之外,Senthil还是NIH在美国国家科学技术委员会量子信息科学小组委员会(SCQIS)(该小组委员会负责协调联邦研究政策)的代表;还加入了白宫科技政策办公室;并共同主持了一个SCQIS工作组(旨在将生物医学研究人员与量子技术和量子计算联系起来)。她说,NIH的其他研究机构也支持用先进的计算技术进行生物研究,包括量子方法。例如美国国家药物滥用研究所(National Institute for Drug Abuse)提供了一笔与成瘾研究中多模态数据分析相关的资金。
 
Senthil说,“量子”通常更多地出现在物理科学中,生物学家较少接触量子科学的发展;大多数量子技术应用不会出现在生物医学领域。但对于生物学,她看到了量子传感和量子模拟技术的实际应用,包括成像、光谱学、显微镜以及蛋白质和分子动力学研究。
 
Gerstein说,有朝一日NIH可能会操作一台大型量子计算机,实验室可以在这台计算机上预定一段时间用于研究小组的计算。Gerstein获得了一笔探索量子计算的补充拨款。目前,他认为最适合量子计算的领域是药物设计和结构生物学方面的计算。
 
 
根据量子力学理论,一些物质(例如电子)不能表示为具有特定位置。它处于叠加状态,分散在空间中,并且有机会处于所有可能的状态。“它既不在这里也不在那里,”Gerstein说。它在数学上由一个具有概率振幅的波函数来描述。当电子被测量时,波函数“坍缩”并且电子处于一个固定位置。
 
奥地利物理学家埃尔温·薛定谔的经典但相当可怕的思想实验说明了量子理论的奇怪之处。一只猫与少量放射性物质一起放入盒子中,有50%的概率放射性物质将会衰变并释放出毒气杀死这只猫。直到有人看到盒子里面,猫要么死了,要么活着。但根据量子力学,猫既活着又死了;它具有它可能占据的所有情况,仅在观察者检查猫时才会改变。
 
这个思想实验是关于亚原子粒子的,与较大的物体不同,亚原子粒子具有可变的状态,甚至可以在很远的距离上相互纠缠。在纠缠量子对中,一个粒子可以揭示另一个粒子的特性。这是爱因斯坦等人提出的EPR佯谬的一部分。
 
正如Gerstein解释的那样,当两个这样的粒子被分离时,测量一个会确定第二个的测量结果。“从远处看,这可能看起来像幽灵般的行为,”他说。它类似于一副分离的手套,当看到右手时,一个人立即告诉你另一个是左手的手套。
 
图片来源:D. Todorovic/Getty
 
量子计算机使用量子比特进行计算,量子比特是量子计算机的基本单位。在具有多个量子比特的系统中,量子比特会发生纠缠。由于量子纠缠,对其中一个量子比特执行的任何操作都会影响所有量子比特的集体状态。Deane说这是一个数学事实,即“没有量子纠缠,任何量子算法都无法超越经典算法。
 
即使对于Gerstein这样受过物理训练的人来说,量子力学也很神秘。他说,简而言之,波函数“无处不在”。量子比特可以同时拥有多个状态。使用量子比特计算就好像计算工作流中的所有操作都同时执行。这相当于“大量的并行性”。在计算结束时,量子比特的可变状态会坍缩为答案。
 
Mulligan说,作为一种快速的算术机器,经典计算机可以解决很多问题,但它在NP-hard问题方面表现不佳,例如当问题的解决方案是在“无数选项”中选择最佳解决方案时。
 
经典计算机通过迭代来解决这个问题。它一项一项地处理各种可能性,对每一项进行评分,然后返回得分最高的一项。计算机可以轻松地考虑一千、一百万甚至十亿种可能性,“但是当选择涉及数万亿、千万亿或五千万亿时,你将进入一个快速计算机也无法考虑所有可能性的领域。” Mulligan说,“这就是量子计算很酷的地方;与经典计算机一次只能考虑一种可能性不同,量子计算机可以一次考虑多种可能性。”经典比特称为1和0,而量子比特称为状态。状态的数量对应于可能性的数量。这个数字随着系统中每个量子比特的增加而增加一倍,这提供了“在执行难的搜索问题时考虑天文数字的可能性。”生物学充满了那些棘手的搜索问题。
 
Gerstein坦言,他并没有“特别理解”量子计算的所有复杂性,“但它确实有效。”例如,密码破解是量子计算的一个应用领域。在某些类型的攻击中,量子计算机可以通过尝试所有数字来找到密码。他说,这是一种通过“蛮力”找到密码的方式。政府对这种能力很感兴趣。他说,这似乎与生物医学相距甚远,但许多基础生物医学研究人员,而不仅仅是临床医生,需要保护他们使用的患者数据。
 
进行结构分析的实验室可能会考虑量子计算。Gerstein 说,评估“分子抖动”通常涉及牛顿力学,但量子力学有助于研究分子键的产生和断裂。他表示实验室正在试验混合经典计算和量子计算的混合工作流。实验室可能会模拟酶的内部,其中一些计算可能包含量子力学的部分。
 
未来,科学家可能会在经典计算机上运行80%或90%的工作流,然后为了效率,在量子计算机上运行一些计算。他说,需要“巨大算力”的蛋白质折叠将是适用的一个领域,而药物设计和蛋白质设计会是另一些领域。
 
 
在药物设计中,药物分子中原子的排列方式有无数种,研究人员需要寻找最适合他们的药物要执行的特定功能的方式。Mulligan 表示:“如果你想预测蛋白质将折叠成什么样的结构,你必须从氨基酸链可以扭曲成的无数可能构象中找到能量最低的氨基酸链构象。”经典计算机很快就碰壁了,“尽管当代量子计算机的功能仍然非常有限,但希望量子计算机总有一天可以帮助我们远远超越这个极限。” 
 
Mulligan和几家机构和公司的同事将蛋白质设计问题映射到量子计算机上。为了设计肽,他们在D-Wave量子硬件上启用了蛋白质设计软件Rosetta,尤其是它的Packer模块。
 
蛋白质设计涉及优化旋转异构体,即蛋白质侧链的位置和构象。这种设计意味着对每个旋转异构体的许多位置进行尝试和评估,因此,这是一个很难计算的搜索问题。Rosetta在经典计算机上运行,能够模拟原子和分子的相互作用,并包含研究人员用来解决诸如蛋白质结构预测和序列设计等困难搜索问题的算法。肽和蛋白质有一个由氨基酸组成的主链,主链上悬挂着侧链。每种类型的氨基酸都有不同的侧链,大多数侧链类型都具有不同的构象。
 
Mulligan说,设计上的挑战是,给定一个固定的肽或蛋白质主链,人们想要通过特定的氨基酸序列选择来稳定,在每个位置选择一个氨基酸旋转异构体,使能量最小。
 
肽的设计涉及到寻找许多可能性,而量子计算在这方面做得很好。为了完成这项任务,Mulligan和他的团队从Rosetta包中构建了Packer模块的量子版本。图片来源:V. Mulligan, Flatiron Inst.; T. Phillips, Springer Nature
 
即使20种氨基酸类型中的每一种都只有一种构象,对于100个氨基酸的蛋白质来说,这意味着该蛋白质有20的100次方种可能序列。“相比之下,宇宙中大约有10的80次方个原子,”Mulligan说。增加的复杂性是,每种氨基酸类型不是只有一个旋转异构体,而使有多个。毕竟,侧链是灵活的。“这使得它成为一个非常困难的问题,”他说。经典计算机上的完全枚举法并不能解决这个问题。
 
通常,科学家会对此类问题应用蒙特卡罗方法等启发式方法,对可能序列的一小部分执行半随机搜索,以逐步寻找更好的可能性。他说,所有这些都提供了很好的解,但不能保证是最好的。
 
对于量子计算机,有可能考虑所有可能的旋转异构体组合,并将其视为所有可能的1和0字符串的初始相等叠加。人们可以改变状态的概率分布,直到极有可能观察到代表所有旋转异构体中最佳组合的1和0字符串。
 
科学家们研究了如何将序列设计部分映射到D-Wave 2000Q系统上,该系统具有2000个量子比特。他们使用该系统成功设计了肽,在湿实验室中制造并表征了其中一些肽,并确认它们确实折叠成在量子硬件上设计的结构中。
 
最近,该团队使用了D-Wave最新的Advantage系统,该系统拥有5000个量子比特。该团队还在为基于门的量子计算机(例如IBM、霍尼韦尔和其他公司正在开发的计算机)调整序列设计算法,这与D-Wave等量子退火机不同。 
 
Rosetta软件的Packer模块使用蒙特卡罗概率评估方法解决旋转异构体优化问题。科学家们构建了QPacker,即Packer的量子版本。他们划分了设计任务:在普通计算机上进行经典的预计算,计算单个旋转异构体和潜在相互作用旋转异构体对的能量。Mulligan说:“这需要快速的运算——正是经典计算机擅长。量子算法在D-Wave上进行计算,来解决搜索大量所有可能的旋转异构体组合并找出最佳组合的问题。在这种情况下,两种类型的硬件都在做他们最擅长的事情,并避免做他们最不擅长的事情。” 
 
 
D-Wave和其他公司已经制造出量子计算机,D-Wave量子退火计算机使用自旋向上和自旋向下的电子作为量子比特来表示1和0,其计算操作涉及用磁场操纵电子。但电子和磁场并不是实现量子计算的唯一方式。例如,霍尼韦尔、IonQ和其他公司正在探索使用完全不同的物理系统的量子计算机,这些系统允许你做同样的事情。量子计算公司一直在研究制造量子比特的方法,其中包括操纵原子状态、电子自旋或离子振动等等。
 
数字比特不是1就是0;量子比特既可以是1,也可以是0:它们可以有状态的叠加。量子算法将计算作为对这些状态的操作。Gerstein说:“很难将这些量子态隔离,”这就是为什么,例如,量子计算中的一些硬件实现应用超导材料以防止线路相互干扰。这些线路与在硅上蚀刻晶体管的传统芯片不同。但随着公司探索多种类型的实现方法,量子计算机也面临着自己的硬件挑战。Gerstein说,硬件设计中的问题之一是可以部署的量子比特数量以及如何设置量子RAM。
 
Geetha Senthil说,用于量子计算的硬件仍在不断发展,但一些实验室在现有的量子硬件系统上实现了量子机器学习算法。例如,弗吉尼亚大学医学院的Stefan Bekiranov、Kunal Kathuria及其同事开展了NIMH资助的项目,以分析样本中的单细胞神经元基因组拷贝数变异。该团队开发了分类器,并使用量子计算来比较阿尔茨海默病患者和非阿尔茨海默病患者脑组织的合成数据。
 
Bekiranov说,量子计算在核心计算中提供了“指数级加速”。该团队使用了IBM Q 模拟器以及IBM的5量子比特和14量子比特量子计算机。随着量子计算能力和保真度的提高,他们计划使用真实数据。
 
 
牛津大学研究员Charlotte Deane说,需要提醒算法开发人员和用户的是,“量子计算机可能只会在速度方面为有限数量的任务带来优势。”而且,她说,“你不能只是将经典算法移植到量子计算机上。”
 
在经典计算机上,生物医学研究中所使用的算法可以映射序列读取、估算基因组变异和分析行为等。特别是在神经科学中,当表征分子、细胞、组织、有机体和行为时,计算是尺度内和跨尺度进行的。人口规模分析等大数据挑战也可能需要在量子计算机上进行计算。各种类型的机器学习方法如玻尔兹曼机(BM)、变分自编码器、神经网络,可用于这些不同尺度的分析。Gerstein和其他人正在探索如何使算法“量子化”,例如,将玻尔兹曼机变成量子玻尔兹曼机。
 
玻尔兹曼机是一种在处理问题时计算“能量函数”的神经网络。例如,它用于执行作为单细胞分析一部分的计算或估算表观基因组修饰。Gerstein表示,用户经常使用玻尔兹曼机搜索最低能量状态,“量子计算可以帮助你做到这一点”。量子玻尔兹曼机可能在许多计算生物学环境中有用。
 
在科罗拉多大学医学院的Lawrence Hunter看来,考虑到隐马尔可夫模型对序列分析的重要性,它们的量子扩展,无论是新的模型类别还是它们提供的量子加速方面,都可能很快实现。“实用的量子变分自编码器或其他机器学习的量子加速将非常重要的,包括在生物医学研究中,”他说。
 
总体而言,Mulligan说,“设计一个算法的量子版本是很棘手的。”有一些标准的量子算法被设计用于量子计算机,如Grover算法、Shor算法等。如果一个算法可以用这些来表示,那么转换起来可能会更容易。
 
尽管理论上量子计算机有朝一日能够执行经典计算机可以执行的任何操作,并且能够执行难的搜索问题,“但它们在基本算术上很可能总是比经典计算机慢一千到一百万倍,” Mulligan说。因此,使用量子计算机来计算工资、渲染CGI电影或做许多其他在经典计算机上已经做得很好的事情没有任何优势。
 
使用数字比特的经典计算机速度很快。但对于某些类型的计算,量子计算机可以非常快。图片来源: Y. Chino/Getty
 
量子计算在执行难的搜索问题上可能会有优势。“即便如此,思考出将经典算法转换为量子算法的方法仍然是一个挑战,”他说。
 
好在该团队使用了Packer和QPacker,Rosetta试图解决的是一个涉及困难搜索的问题,并且它的结构方式适合D-Wave可以解决的问题。他说,D-Wave系统不是通用的量子计算机。它专注于解决某一类问题。
 
QPacker项目的合作者中有Menten AI的同事,这是一家由Mulligan共同创立的公司。Mulligan说,Menten AI热衷于将量子计算用于药物设计,但他们也使用其他方法,例如“在可靠的经典计算机上”进行机器学习,以及使用Rosetta等软件进行物理模拟。对于他们研究的药物,Menten团队寻求超越传统的小分子药物,转向肽疗法,他认为这是一种尚未开发但非常强大的药物。随着量子计算的发展,他们将探索如何充分利用它的潜力,同时,他们将继续在经典计算机上做大量工作。
 
 
对量子计算感兴趣的科学家有很多选择。在IonQ,Ruffner处理来自许多领域的潜在合作者和用户的咨询,但她对生物学情有独钟。她曾是IBM Quantum团队的一员,当时一位科学家打来电话,要求他们提供“翻译软件”,以便实验室可以在量子计算机上运行其算法和软件。她告诉研究人员说“现在还不太行。” 她说“从本质上讲,你必须为量子计算机重新编程,这确实需要一套特定的技能才能做到这一点。”
 
一些公司已经开发了用于量子计算机编程的开源语言。例如,谷歌有Cirq,微软有Q#,IBM有Qiskit。IonQ决定不再开发另一种语言,Ruffner说:“我们觉得已经有太多这样的语言了。” IonQ用户可以在IonQ计算机上使用这些语言中的任何一种,可以通过公司的云访问。IonQ是唯一一家通过亚马逊Braket、微软Azure和谷歌云直接提供量子系统的公司。
 
她指出了许多研究人员可能会探索的课程——例如MIT OpenCourseWare和edX课程。“要进入量子计算领域,你必须要花费一点精力。一旦你到了那里,你就能在解决问题上发挥自己的创造力。” 她说。这种努力可能会使计算上繁琐甚至难以处理的事情变成一项容易完成的任务。
 
Ruffner曾与一位从事全基因组关联研究(GWAS)的生物学家交谈,她了解到这项研究需要一年半的计算时间。量子计算可以在这种情况下提供帮助。神经科学是另一个可以从量子计算中受益的领域。她说:“鉴于没有太多的生物学家研究过量子计算,加快GWAS的速度固然很好,但是如果你能想到一些新的和不同的事情(你一直想做,但由于计算太复杂而做不了的),那也是很好的。”这些可能包括药物设计、基因组学中的多模态数据分析或神经科学中的各种问题。
 
 
科罗拉多大学医学院的Hunter说:“量子计算终于开始变得实用了。”而且随着科学技术的进一步发展,这种趋势将会继续加速。但他也表示,目前许多有吸引力的理论构想,比如那些需要量子RAM的构想,“可能永远不会成为现实”,人们也需要谨慎。
 
耶鲁大学研究员Gerstein说:“量子力学无疑是科学中最重要的理论之一,”利用量子力学的系统将会引起包括生物医学研究在内的整个科学领域的兴趣。他继续说道:“人们将来会希望利用这些特性进行计算。” 
 
“从长远来看,至于量子计算将如何工作,这仍然是人们的猜测,” 系统生物学研究员Mulligan说。硬件可能总是比经典计算机更笨重、更昂贵,但这取决于哪种物理实现最终胜出。它可能是电子、俘获离子、光子或其他东西。在不久的将来,量子计算可能会成为一种计算服务:用户将问题上传到基于云的量子计算提供商,他们在量子处理器上运行计算,并将其与可能也是基于云的经典计算机一起使用,然后由用户下载结果。这类似于使用现在高性能计算中可用的基于云的计算资源。他说:“我们是否会有一天拥有自己的专用量子计算机的工作场所很难说,但我希望我们能做到。”
 
自然杂志原文:
https://www.nature.com/articles/s41592-021-01199-z

—End—

相关阅读:
基于量子传感器的可穿戴式脑磁图系统正式投入使用
医疗行业的革命!全球第一个适用于脑磁图的室温固态量子传感器
量子机器学习将首次用于癌症治疗
美国启动首个应对妇科疾病的量子药物研发项目
制药行业新的竞争:量子计算
2021年可能是量子药物发现之年

#诚邀共建国内首个量子垂直招聘平台#

光子盒将为中国境内的研究机构和企业提供一个免费的垂直招聘信息发布渠道,欢迎有需求的机构或企业直接联系光子盒。(微信:Hordcore)

你可能会错过:
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存