其他

科技·前沿 | 近期科研成果扫描

2017-09-30 清华大学

交叉信息院曾坚阳研究组发文阐释深度学习解码蛋白质翻译过程


交叉信息院金奇奂研究组刷新单量子比特相干时间世界纪录

量子信息中心段路明研究组发文揭示深度神经网络和量子多体问题的关联


生命学院孙前文实验室发文报道R环影响叶绿体基因组稳定的调控机制

材料学院唐子龙研究组在超长寿命高倍率锂离子电池材料方面取得突破



1                

交叉信息院曾坚阳研究组发文阐释深度学习解码蛋白质翻译过程

9月27日,清华大学交叉信息研究院曾坚阳研究组在《细胞》子刊《细胞·系统》(Cell Systems)发表了题为《利用深度学习分析核糖体停滞现象与蛋白质翻译动态》(“Analysis of Ribosome Stalling and Translation Elongation Dynamics by Deep Learning”)的研究论文,首次利用深度学习技术对蛋白质翻译的动态过程进行建模,提出了一种全新的基于高通量测序技术的深度学习计算框架,并以此揭示了蛋白质翻译这一基本生物过程的调控机制。该成果被第21届国际计算分子生物学大会(RECOMB 2017)接收,并作为计算生物学新兴研究方向的代表性工作被邀请做大会论文口头报告。


▲基于深度学习模型的蛋白质翻译过程的研究框架图。


蛋白质翻译是遗传信息从其携带者DNA到执行者蛋白质传递的关键一环,也是分子生物学中心法则的核心环节。在蛋白质翻译的过程中,一种名为核糖体(ribosome)的细胞器会沿着信使RNA链,按照遗传密码子的对应法则依次将核苷酸序列翻译成氨基酸序列,继而形成多肽链。近年来,生物学家们通过各种高通量测序技术测量发现,蛋白质翻译的过程是动态变化的,其中大量存在一种核糖体翻译停滞(ribosome stalling)的现象,这一现象与翻译过程中的蛋白质折叠和定位等一系列重要过程有关。


作为该领域的一项突破性进展,曾坚阳研究组首次提出了一种基于机器学习的计算框架来研究核糖体停滞现象的调控机制和功能,并成功利用深度学习技术实现了对蛋白质翻译过程中核糖体翻译停滞的精确预测。传统的观点认为,mRNA序列信息只是通过密码子表编码氨基酸序列,而本工作首次对mRNA序列中编码蛋白质翻译的调控信息进行建模。该模型仅以信使RNA的一级序列作为特征输入,没有整合其他的生物学特征。进一步地,研究人员基于深度学习自动提取的隐藏特征以及模型精确的预测结果,对调控核糖体翻译停滞的各种因素以及该现象的生物学功能进行了系统性的分析,在验证前人研究成果的同时,提出了许多新的假设,为进一步探究蛋白质翻译的动态特征打下了坚实的基础。


该文的通讯作者为交叉信息研究院助理教授曾坚阳,论文共同第一作者为交叉信息研究院博士张赛(目前在美国斯坦福大学进行博士后研究)、药学实验班博士生胡海林(目前为医学院在读博士生)以及本科生周镜天(目前在美国加州大学圣地亚哥分校攻读博士学位)。该项工作与美国加州大学河滨分校的姜涛教授(清华大学千人计划讲席教授)合作完成。国际计算分子生物学大会(RECOMB)是计算生物学领域的两大顶级会议之一,该会议历年平均录用率约为20%。《细胞·系统》(Cell Systems)是隶属于Cell出版集团新兴交叉学科期刊,其定位于收录系统生物学和定量生物学研究的高水平文章。作为国际知名顶级期刊《细胞》(Cell)的子刊,《细胞·系统》建刊两年以来,已经在国际上取得了相当广泛的影响力。


此外,本文的姊妹工作,《TITER: 利用深度学习预测蛋白质翻译起始位点》(TITER: predicting translation initiation sites by deep learning),已于2017年7月在国际计算生物学知名期刊《生物信息学》(Bioinformatics)在线发表,同时被国际分子生物学智能系统大会(ISMB 2017)收录为大会口头报告。该研究利用深度学习技术预测转录组中的翻译起始位点,首次将预测范围扩大到了转录组中所有种类的翻译起始位点,并对翻译起始位置的序列特征、调控功能、突变效应做了深度解析。该项工作共同第一作者为张赛和胡海林同学,并与姜涛教授及医学院公共健康研究中心张磊教授合作完成。这两项工作的完成为人类解码蛋白质翻译过程提供了重要信息。


曾坚阳研究组是国内较早将深度学习应用到基因组学数据分析的研究组之一。本系列工作得到中国国家自然科学基金、美国国家科学基金会(NSF)、中组部青年千人计划和清华大学结构生物学高精尖创新中心的经费支持。



论文链接

1. Analysis of Ribosome Stalling and Translation Elongation Dynamics by Deep Learning

http://www.cell.com/cell-systems/fulltext/S2405-4712(17)30337-X


2. TITER: predicting translation initiation sites by deep learning

https://doi.org/10.1093/bioinformatics/btx247


1                

交叉信息院金奇奂研究组刷新单量子比特相干时间世界纪录

清华大学交叉信息院量子信息中心金奇奂副教授带领的离子阱量子计算研究组实现了拥有超过10分钟相干时间的单量子比特储存(量子信息技术中的基本单元),这是目前为止单量子比特相干时间的世界纪录,将之前的世界纪录提高了10倍。此工作的研究论文《相干时间超过10分钟的单量子比特储存》(Single-qubit quantum memory exceeding ten-minute coherence time)于9月25日发表于《自然·光子学》。


▲离子阱量子储存系统示意图。


现今量子信息技术中最重要的基础技术是对单量子比特的相干操作和量子态探测。只有拥有了对单量子比特完整操作能力,才能够实现量子信息的储存、操作和读取。科学家们经过二十多年探索和实验才慢慢掌握了在单量子比特级别实现相干操作和量子态探测的技术。金奇奂研究组此次实现了10分钟相干时间的单量子比特系统,将之前的世界纪录提高了10倍。虽然在离子系综系统中早在20年前就观察到了相近的相干时间,固体系综系统中近期也观察到了更长的相干时间,但此项研究工作是第一次在单量子系统中观察到如此长的相干时间。


实验结果明确地展示了量子信息储存技术的可行性,这成为量子计算机(尤其是基于离子阱的量子计算机)的重要组成部分。目前,离子阱技术是最接近实现大型量子计算机的技术之一。离子阱量子计算机架构由量子储存区域和量子操作区域组成,并通过移动离子来实现两个区域的连接。金奇奂研究组的成果毫无疑问将成为实现量子储存区域最为关键的技术。同时,由于离子光子纠缠过程具有不确定性,为了保证足够小的误差,需要很长相干时间的离子进行操作,因此该成果也成为利用离子光子纠缠实现量子网络的关键技术之一。


单离子系统相干时间不长的主要原因是加热。在没有激光冷却的环境下,离子被环境噪声加热,从而降低了量子态探测的效率。此项研究在实验中利用协同冷却技术解决加热的问题,用138Ba+离子冷却171Yb+离子(量子比特离子)。由于138Ba+离子拥有和171Yb+离子相似的质量,协同冷却效果显著。又因为138Ba+离子的冷却激光波长距离影响171Yb+量子比特的波长很远,所以协同冷却过程不会影响量子比特的相干性。同时研究组施加了上千个动态解耦操作以抵抗环境的磁场噪声,从而延长相干时间。该研究工作的单量子比特操作保真度达到99.99%。最终研究组制备了6个初始量子态,并测量了它们的相干时间。如下图所示,|↑>和|↓>的相干时间为4,740±1,760秒,其它四个态的相干时间为667±17秒。


▲6个不同初始态的相干时间测量结果。


本项研究工作的第一作者为量子信息中心博士生汪野,共同通讯作者为出站博士后廉茶铉和金奇奂副教授。实验系统由量子信息中心博士生汪野、出站博士后廉茶铉搭建;博士生汪野、严马可和出站博士后廉茶铉采集数据。博士生张君华、安硕明、本科生吕铭、助理研究员张静宁、姚期智讲座教授段路明教授提供理论支持。研究成果得到国家重点基础研究发展计划和国家自然科学基金支持。



论文链接

https://www.nature.com/articles/s41566-017-0007-1.epdf?author_access_token=Wue794TclIZq1RJz-cRuIdRgN0jAjWel9jnR3ZoTv0Oa-alZStUfdQeyVj4caj8YvMkAbOdPoGeSrXjLswho3ZSnRz-o8P2LWrnBVDHW5-Zts3Sr3LI8T2wiL1VDac2Fn9O1hhFI7LpG8wXMFFmH4w%3D%3D


1                

量子信息中心段路明研究组发文揭示深度神经网络和量子多体问题的关联

清华大学量子信息中心段路明教授研究组发现深度神经网络和量子多体问题存在紧密关联,证明利用深度神经网络模型可以有效表示几乎所有量子多体系统的波函数,展示了神经网络和深度学习算法在量子多体问题研究中的巨大潜力,该成果的研究论文《利用深度神经网络对量子多体态的有效表示》(Efficient representation of quantum many-body states with deep neural network)近日发表于自然子刊《自然·通讯》(Nature Communications)上。 


▲量子多体波函数的深度神经网络表示示意图。


量子多体问题研究粒子数极其巨大的量子相互作用系统,是凝聚态物理、高能物理、材料科学、量子化学等领域的核心前沿课题。由于量子波函数的直接刻画所需要的参数随粒子数的增加指数增长,即使利用现代超级计算机,也很难在一般情况下对其进行模拟,量子多体问题因而成为各领域的传统难题。


量子多体问题的一个关键难点是如何用尽量少的参数描述大规模量子多体系统中存在的复杂关联和量子纠缠,如果所需要的参数描述随粒子数的增长从指数函数降为多项式函数(例如线性函数),则描述和解决该问题的复杂度将大大降低,这种利用较少的参数表示出来的波函数被称为有效表示。因此,找到量子多体波函数的有效表示是解决量子多体问题的一个关键步骤。


神经网络模型具有表示复杂的多变量函数关联的能力,是深度学习算法和近期人工智能领域突破的基础。一个自然的想法是利用神经网络模型来表示量子多体波函数中的关联和纠缠。最近一种浅层神经网络,称为受限玻尔兹曼机,在数值模拟一些比较基础的量子多体模型方面取得成功,但神经网络模型对于更一般的量子多体波函数的表示能力完全未知。 


▲浅层神经网络(a)和深度神经网络(b)示意图。


段路明教授和其研究生郜勋利用量子计算理论和复杂性理论中的一系列技巧,证明了几个一般性的定理,揭示了深度神经网络和量子多体问题之间的紧密联系。该研究工作首先证明了任何浅层神经网络无法有效表示一般的量子多体波函数,包括很多有能隙系统的基态和动力学过程产生的量子态。研究还进一步利用量子计算模型,证明深度神经网络可以有效表示任何量子动力学演化产生的量子态,表示所需参数的个数随粒子数和演化时间只是线性增长。此外,此项研究还证明了任何常见物理系统的基态,都可以用深度神经网络有效表示,并提出了一种深度学习算法,用于计算基态或量子动力学演化所产生的波函数。


该论文的第一作者和通讯作者分别是清华交叉信息研究院的博士研究生郜勋和姚期智讲座教授段路明,研究工作得到教育部和清华大学的经费支持。



论文链接

https://www.nature.com/articles/s41467-017-00705-2.epdf?author_access_token=v17jJ9OQFwEr6bOj1Xe7udRgN0jAjWel9jnR3ZoTv0PzfoVITWlyk59vVp8SIPuCH8XRY9XOKjMzHcWfvSHwwfQT389vu_ugOyBf2HOE-41Mynwqt-x9v4Tg1wHGwceoIvftQIeBs3t3k7GPVTox_Q==


1                

生命学院孙前文实验室发文报道R环影响叶绿体基因组稳定的调控机制

9月23日,清华大学生命学院孙前文研究员实验室在植物学国际知名期刊《植物细胞》(The Plant Cell)在线发表题为“核糖核酸酶H与DNA解旋酶协作以限制拟南芥叶绿体R环水平并且维持基因组稳定性(RNase H1 cooperates with DNA gyrases to restrict R-loops and maintain genome integrity in Arabidopsis chloroplast)”的研究论文,首次报道了叶绿体基因组稳定性受到R-loop影响的分子机制。


R环是一种特殊的三链核酸结构,其组成包括一条DNA:RNA杂合链(由RNA与其同源DNA序列互补杂交形成)和一条单链DNA。近年来已在多种生物体中发现稳定存在的R环结构,并且越来越多研究表明R环的积累与许多人类疾病有关,例如神经变性疾病,核苷酸扩增疾病以及癌症等。R环的清除受多种因素调节,其中核核糖核酸酶H(RNase H)可以特异地清除DNA:RNA杂合链中的RNA,是去除核糖核酸酶H结构的主要因子之一。


图1:叶绿体定位的核糖核酸酶H蛋白AtRNH1C对叶绿体的发育,R环水平以及基因组的稳定性至关重要。


A:AtRNH1C基因突变后严重影响叶绿体发育。B:相比野生型(Col-0),atrnh1c突变体中叶绿体基因组R环水平大量积累。C:脉冲电泳分析发现atrnh1c突变体中叶绿体基因组稳定性明显降低。


目前对植物中R环调控以及相关功能的研究还非常少,尤其植物半自主细胞器如叶绿体中R环的存在和功能尚属未知。叶绿体被誉为植物的“养料制造车间”,它的正常运转基于其基因组的稳定性。早在上世纪八十年代邓兴旺博士就发现菠菜叶绿体基因组可以自发降解的现象(Deng et al., PNAS USA, 1989),然而叶绿体如何抵抗DNA损伤并精确维持基因组稳定的机制尚不清楚。


孙前文课题组通过分析获得一个新的定位于叶绿体中的核糖核酸酶H蛋白(AtRNH1C),发现该蛋白可以调节叶绿体中R-loop水平的变化,从而维持基因组的稳定性和发育(图1);后续分析揭示核糖核酸酶H蛋白可以与DNA解旋酶协作来解除叶绿体基因组rDNA区转录与复制时发生迎面(Head-on)对撞,从而减少DNA的损伤(图2)。当核糖核酸酶H蛋白和DNA解旋酶的活性减弱或缺失时,R环就会在rDNA区大量积累,同时DNA复制受阻,导致转录与DNA复制叉发生迎面(Head-on)对撞并破坏叶绿体基因组的稳定性(图2)。这一发现详细地解释了叶绿体如何精确抵抗基因组不稳定性,也将加深对真核生物细胞中其它半自主细胞器(如线粒体)基因组组成的认识,并有望为治疗某些线粒体基因组稳定性异常而导致的人类疾病提供理论依据。


▲图2:上图:核糖核酸酶H蛋白AtRNH1C和DNA解旋酶复合体AtGyrases协作以解除叶绿体基因组中高转录与高复制区域发生的迎面(Head-on)对撞从而维持基因组稳定;下图:当核糖核酸酶H失活(atrnh1c)或DNA解旋酶复合体活性被药物抑制(CIP)后,高转录与高复制区域的迎面(Head-on)对撞无法解除,从而导致基因组稳定性降低。


孙前文实验室重点关注植物R环的形成、稳定和解除的调节机制及相应的生物学功能,本研究是继报道R环调节长非编码RNA表达并影响拟南芥开花[《科学》(Science), 2013]、调控水稻根的向地性[《分子植物学》(Molecular Plant), 2017]、以及精准高效高通量全基因组R环分析[《自然·植物》(Nature Plant), 2017]后的又一重要成果。


孙前文实验室2016级博士研究生杨卓、博士后侯全璨和2014级博士研究生程玲玲通力协作共同完成了本项研究,同署共同第一作者;孙前文研究员为本文的通讯作者。该研究主要获得清华大学自主科研计划(青年教师基础研究专项)和科技部国家重点研发计划的资助,其它支持经费来源还包括国家自然科学基金委、生命科学联合中心以及中组部青年千人计划等。侯全璨博士受到清华大学博士后支持计划的资助。清华大学生物医学测试中心蛋白化学平台在本研究中的质谱分析方面给予了大力支持。



论文链接

http://www.plantcell.org/content/early/2017/09/21/tpc.17.00305?rss=1


1                

材料学院唐子龙研究组在超长寿命高倍率锂离子电池材料方面取得突破

9月20日,清华大学材料学院唐子龙教授研究组在《自然 通讯》(Nature Communications)上发表题为《一种钛酸锂水合物——用于快速充放电且稳定循环的锂离子电池》(Lithium Titanate Hydrates with Superfast and Stable Cycling in Lithium Ion Batteries)的研究成果。该成果针对钛基储能材料领域,报道了一系列钛酸锂水合物,应用于超长循环寿命且高倍率性能的锂离子电池,有效拓展了储能材料的研究范围,并提供了电极材料改性的新思路。


▲图1. Li2O-TiO2-H2O三元相图及钛酸锂水合物的合成路线图。


目前常用的锂离子电池均采用有机电解液,其中所含的电解质六氟磷酸锂(LiPF6)是一种遇水易分解的物质,因此传统观念中锂离子电池的电极材料都是需要在高温下煅烧来充分除水。但是这会使得材料发生颗粒团聚和晶粒粗化等难以避免的副反应。而唐子龙教授研究团队发现的锂-氢-钛-氧(Li-H-Ti-O)体系材料与目前国内外报道的性能优异的锂-钛-氧(Li-Ti-O)体系、钛-氧(Ti-O)体系材料(包括纳米化、掺杂和包覆之后的材料)相比,具有相当甚至更加优异的电化学性能。作为含“水”的电极材料,这类钛酸锂水合物能够在高电压有机电解液体系中实现长达上万次的稳定循环,这打破了人们的传统认知。在材料晶体内部牢固结合的所谓“结晶水”,非但没有破坏电极材料在有机电解液体系下的电化学性能,反而促进了晶体结构的多样性(如二维层状)以及纳米复合材料的构筑,从本质上提高了材料的离子扩散系数。


▲图2. 钛酸锂水合物合成过程及材料快速嵌锂/脱锂过程的示意图。


运用锂-氢-钛-氧(Li-H-Ti-O)体系材料的改性新思路及其本质性、普适性的特征规律,可以拓展该体系电极材料性能调整及优化的自由度,还有望对其它含氢组分的过渡金属化合物体系在能源材料领域的应用提供较大的启发与指导依据。


▲图3. 钛酸锂水合物前驱体在加热脱水过程中的X射线衍射分析(a-b)以及电化学性能对比图(c-d)。


论文的通讯作者为清华大学材料学院唐子龙教授、美国阿贡国家实验室的陆俊研究员和美国麻省理工学院的李巨教授,第一作者是清华大学材料学院2012级博士生王诗童。该研究得到了国家自然科学基金、美国国家科学基金以及美国能源部等项目的资助。



论文链接

http://www.nature.com/articles/s41467-017-00574-9

请输入标题     abcdefg

编辑 | 粽



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存