查看原文
其他

直博生第二年,华东师大姑娘独立研究,整版发表科普文!



华东师大化学与分子工程学院博士研究生曹梦瑶《文汇报》整版发表
DNA计算机科普长文整版解读液态电脑极简史


这位宝藏小姐姐是位本科直博生她在很短时间内
快速转型开展独立研究





直博生写科普



曹梦瑶

2016年,曹梦瑶被华东师大化学本科专业录取。2020年,她获得直博名额攻读博士学位,师从裴昊教授。2018年,曹梦瑶以本科生的身份进入到裴昊教授的实验室初试科研。

2020年9月研究生入学之后,曹梦瑶开始接触DNA计算方向,并且在博士生师姐熊谢微的指导下一起完成课题,最早作为第4作者在《自然·机器智能》上,发表题为“基于DNA调控电路的分子卷积神经网络”的论文。

2021年5月份,曹梦瑶开始独立进行科研,从事基于DNA计算的疾病诊断方向的研究。



DNA计算机 整版科普长文
且听这位博士小姐姐为你一一道来


今时初识甲骨文,来日机器可类人


我们日常接触到的计算机大多是由硅和晶体管构成。随着科技的发展,科学家已在尝试超越电子计算机,利用生物分子来实现计算机的功能。
作为一个全新领域,DNA计算机就是一种生物形式的计算机。一支1.5毫升的试管中可容纳1万亿台DNA计算机,运算速度可达每秒10亿次,而计算能耗仅有传统电脑的10亿分之一。发展至今,DNA计算机已能够对手写的甲骨文、数字、希腊文字和英文进行识别和分类。
待到DNA计算技术成熟的那一天,它与人体的结合,或许会像贴上一片创可贴一样简单。那时,它或可随人意念而动,利用人体本身的能量,来完成电子计算机难以实现的医疗诊断和治疗任务,或将给人类文明带来质的飞跃。     
不同于常见的电子计算机,DNA计算机是一种生物形式的计算机,以DNA分子作为“硬件”,以分子之间的化学反应作为“算法”。在DNA计算机中,一系列生物分子以溶液形态组合,因此也有人称之为“液态电脑”。  


DNA计算机已能对手写的甲骨文、数字、希腊文字和英文进行识别和分类。


相较于传统电子计算机,DNA计算机具有体积小、运算速度快、能耗极低等优势。自1994年“DNA计算机”的概念诞生以来,其优点被越来越多的科学家所认识,纷纷投入到该领域的研究中。     
作为所有现存计算设备中最有望与人体良好融合、同时不对人体产生副作用的智能设备,DNA人工智能的发展潜力之大不可限量。最近,利用DNA分子的超强“学习”和“记忆”能力,科学家用DNA人工智能实现了对手写字迹的识别。



01

试管里的“智慧混合物”


DNA计算机设计和构建的基石是DNA分子特殊的结构。     
众所周知,DNA是由四种基本核苷酸组成:腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T)。其中,A、T和G、C之间彼此配对,两条具有特定核苷酸组合的DNA单链可以构成类似于拉链的双螺旋结构。     
在科学家看来,正是这些特定的配对模式使得DNA分子具备了构建计算设备的巨大潜力。人们可以将运算对象编码到DNA的核苷酸序列中,再通过不同DNA分子之间的化学反应来完成计算。     
以DNA分子为“硬件”的DNA计算机,相较于传统的电子计算机有着多重优势:     
第一,DNA计算机的体积更小,一支1.5毫升的小试管就能容纳1万亿个DNA计算机。     
第二,DNA计算机的运算速度更快,可达每秒10亿次。所有电脑问世以来的总运算量只相当于DNA计算机十几小时的计算量,科学家已在尝试多种方法,以进一步加快DNA计算机的运行速度。     
第三,DNA计算机的能耗更低,仅相当于普通电脑的10亿分之一。     
第四,DNA计算机具有并行性。电子计算机的运算是按照指令顺序进行的,而DNA独特的分子间作用形式,使得数以亿计的DNA计算机可在同一试管中处理不同问题,大大提高了计算效率。     
1994年,DNA电脑与生物电脑之父、图灵奖得主、美国南加州大学教授雷纳德·阿德勒曼建立了世界上第一台DNA计算机,并用它解决了一个经典数学问题——“哈密顿路径问题”。     
这是一个开创性的大事件。美国贝尔实验室的物理学家艾伦·米尔斯说:“我们所做的不再是连线路,而是将大量的DNA装进罐子,加入盐和酶,然后加以培养,于是不同的DNA分子就开始互相寻找配对。”但是这个阶段的计算机并不具备通用性,距离实际计算还差得很远很远。     
2004年,日本学者冈本秋光、田中一雄和斋藤勋正式提出了“通用性DNA计算机”这一概念。基于简单的两条单链DNA以碱基互补配对原则形成双链DNA的过程,研究人员构建了一系列简单的DNA计算机。     
2006年,美国加州理工学院教授埃里克·温弗里提出了一种全新的反应体系,开创了一种新的逻辑电路构建途径。在这一反应体系中,不存在各种非DNA物质辅助的DNA计算。温弗里和他的研究在科学史上留下了浓墨重彩的一笔。  
2011年,美国加州理工学院生物工程系钱璐璐博士使用DNA构建了人工神经网络,解决了经典的机器学习问题——识别潦草的数字字迹。DNA神经网络可将输入的分子字迹分为九个类别,每个类别代表从1到9的九个手写数字中的一个。这项工作成为人工智能与合成生物分子电路成功“合体”的重要里程碑。     
优势独到的DNA计算机应用前景十分乐观,它的“输入”可以是细胞质中的RNA、蛋白质或其他化学物质,而“输出”则是很容易被识别的信号,例如颜色变化等。     



02

颠覆性机遇与挑战并存


雷纳德·阿德勒曼的伟大发现,证明了生命细胞和计算是有联系的。在这个化学、生物学和计算机科学的交叉领域里,还有着巨大的谜团等待人们去探索和揭示。

DNA电脑与生物电脑之父雷纳德·阿德勒曼


近年来,随着技术的逐步发展和成熟,DNA测序与合成的成本不断下降,DNA计算机在医学领域显现出极强的竞争力。目前,它已经能够被用于人工培养肾细胞,以及快速准确诊断禽流感、西尼罗河等病毒感染。由于它能检测细胞内生物信息的变化,因此可以用于癌症、心脏病、动脉硬化等疾病的诊断,甚至还能帮助盲人恢复视觉。     
在信息技术领域,DNA计算机有望被用于研究逻辑、破译密码、情报分析或超大规模信息处理等业务。现有安全系统的安全性和可靠性主要源于以现有计算能力破解密码需要几十年、几百年时间,而DNA计算机的计算速度和并行性会使原本的安全系统“溃不成军”。     
DNA计算机甚至可以实现对电子计算机的控制。有研究将DNA计算机隐藏在生物样本中,通过预先编程,在检测样本的过程中入侵电子计算机的应用程序,获取其中信息,并使之按照DNA计算机的意图运行。     
另一方面,随着DNA计算机的不断发展,人们发现DNA分子能够储存海量信息,且具有惊人的并行计算能力。这使人们意识到,DNA计算机蕴藏巨大商业价值。2002年,日本公司首次研制出能够投入到商业应用的DNA计算机。紧接着,美国加州斯克里普斯研究所和以色列理工学院的科学家联合开发出了一种DNA计算机,可用于破译存储在DNA芯片中的加密图像。
尽管发展迅速、充满机遇,但DNA计算机还有很多问题亟待克服。     
首先,DNA计算机得依靠DNA级联反应完成复杂计算任务。DNA级联反应是指把前一个反应的“输出”作为“输入”引发后一个反应。随着计算规模不断扩展,DNA级联反应的数目也会不断增加,从而导致计算速度不断下降,完成计算任务所消耗的时间就会不断延长。当级联反应数为7时,通常需要6到10个小时来完成反应。因此从目前来看,DNA计算机的规模及其复杂性还不能无限扩大。     
其次,大规模的DNA计算机需要在一支试管中使用大量(数万亿个)DNA分子执行计算任务,这使得DNA计算机的设计难度随着规模的扩大迅速上升,副反应也会增加。因此,平衡计算机的规模、计算速度和执行计算的DNA分子数目至关重要,构建具有更强大计算能力的人工分子反应网络仍存在极大挑战。



03

迈出复杂识别第一步


目前人工智能中常用的卷积神经网络,是一类强大的机器学习模型,网络具有稀疏连接和权重共享的特征。与大多数机器学习模型相比,卷积神经网络能够以更低的复杂度实现更复杂的计算任务。科学家自然不会放过在这种模型上尝试DNA分子计算。    
华东师范大学化学与分子工程学院裴昊教授团队一直致力于DNA计算机的设计和开发。基于在核酸化学方面的研究基础,面向分析化学、计算机科学与分子生物学的交叉融合发展,课题组针对发展超大规模DNA分子反应网络这一关键科学难题,与长期从事人工智能与分子科学研究的朱通课题组合作,建立了一种DNA卷积神经网络的系统实现策略。简言之,就是使用模仿人脑功能的卷积神经网络,让DNA计算机“学习”大量训练数据,“记忆”32个类别的分子字迹。

DNA计算机运行原理示意图。图/The Conversation Trust(UK)Limited


最近,国际权威学术期刊《自然·机器智能》报道了裴昊团队设计的一种新的DNA计算模块——“开关门”,用以在分子水平上实现卷积神经网络,进而完成对32类图谱的识别和分类。     
在计算任务中,手写字符首先被转化为12×12的正方形网格上的25个像素格点,被称为“分子笔迹”。这意味着,每个“分子笔迹”都由144个DNA分子库中的任意25个DNA分子组成。接下来,研究人员构建了两个简单的DNA计算机,成功实现了两类“分子笔迹”在360°平面上不同旋转角度下的识别,以及以“火”“土”“木”“水”“天”“气”“人”和“生”这八个甲骨文字作为目标“记忆”模式的分类任务。     
在这项工作中,裴昊研究组进一步构建了具有两层电路结构的DNA计算机,通过粗分类(语言粗略分类)和细分类(特定的手写符号)两个步骤,实现了32个类别的模式识别。这是现有的能够识别最多种类图谱的DNA计算机。     
值得一提的是,完成这项任务的整个DNA卷积神经网络只需512类不同的DNA分子,这一数量远远低于已经被报道的DNA神经网络正确运行所需的DNA分子数,揭示了利用卷积神经网络能够在大规模DNA计算机中有效减少使用的DNA分子数目,这对未来的DNA计算机设计具有重要意义。     
在这篇论文中,研究人员还提出了一种简单的循环冻融策略——将DNA计算机在液氮中迅速冷冻之后再在37℃下解冻,并多次循环这一操作。循环冻融策略成功地将DNA计算机的计算时间从几小时缩短到几分钟。     
这一DNA计算机具有超高的计算能力,且能够实现对复杂信息的准确分类,并可能赋予DNA计算机类似于生物神经网络的“智能”行为。原则上,基于DNA的计算设备可通过连接感官输入,使用数百个目标作为输入,促进在疾病诊断、表达模式分析和精准医学中的更广泛应用。

基于DNA分子的生物计算机。


尽管科学家们才刚刚开始探索在分子体系中创造人工智能的方法,但DNA计算机的潜力不可低估。或许在不远的将来,与人体合二为一的DNA计算机会成为人体的一部分,甚至是外部延伸,完成电子计算机难以实现的医疗诊断和治疗任务。     
 


DNA计算机发展极简史



▌呱呱坠地


1994年的这个夜晚,注定会被DNA计算史铭记。美国南加州大学计算机科学家雷纳德·阿德勒曼对着著名生物学家詹姆士·沃森的DNA教科书《基因分子生物学》发出感慨:“DNA真是一种不可思议的东西。”一旁的妻子开玩笑道:“说不定它能做成计算机呢!”    
这句话突然使阿德勒曼灵光闪现:“人体细胞和计算机处理与储存信息的方式如此相似。计算机以0和1组成字符串存储库,而生物体以A、T、C、G表示的分子存储信息。我们当然可以利用DNA来完成计算机高速运算的任务。”当年10月,他就在《科学》杂志上发表了一篇题为《组合问题的生物电脑解决方案》的论文,首次提出分子计算机的概念,即用DNA分子构建计算机,完成计算任务。     
不久,阿德勒曼设计并构建的第一台利用DNA进行运算的计算机诞生了。为了证明这台DNA计算机的实用性,他将其用于解决一个经典数学问题,并在一周之内完成了这项当时半导体计算机需要花费两年才能解决的问题。就这样,DNA计算机的雏形诞生了。   


▌蹒跚学步


2001年,以色列魏茨曼科学研究所的科学家在《自然》杂志上报道了一种由DNA分子和酶分子构成的微型“生物计算机”,其中酶为计算机“硬件”,DNA为“软件”,输入和输出的“数据”都是DNA链。     
与以往研制的一些DNA计算机不同,这是第一台不需要人工干预、能够自动运算的DNA计算机。“我们已建立一种由生物分子所组成的纳米级计算机,由于体积超小,无法只单独运行一台来执行任务。”以色列魏茨曼科学研究所的艾哈德·夏皮罗教授表示,当数兆台计算机同时被激活时,它们就可执行数十亿个运算作业。     
然而,直至今日,DNA计算机的研制仍处于起步阶段,现在判断这种DNA计算机是否有实用价值还为时尚早。要将其应用到临床,例如帮助基因组测序、进入生物体内寻找异常现象,或有目的地释放或合成药物等,可能还需要等待数十年。    


▌豆蔻年华

基于DNA分子和酶分子混合物的DNA计算机面临着诸多瓶颈。比如,酶分子价格昂贵,且需要温和的反应条件。这使得之前在实验室里制造的生化电路普遍具有局限性。2006年,美国加州理工大学埃里克·温弗里教授研究组提出了一种新型DNA分子元件来构造DNA计算机,这一分子元件的结构非常简单且标准化、运作稳定,容易升级。     
 “DNA分子在溶液中自由运动,有时会碰撞在一起。”温弗里说,“如果两个相遇的DNA分子有着互补的序列,单链就会扣在半双链多出来的单链上,并将之前的半双链解开,释放出一个新的自由单链。”这样的过程会持续下去,直到获得足够的输出信号为止。通过多个DNA反应的级联,就可组成具有多层电路结构的DNA计算机。     
埃里克·温弗里教授利用这种DNA分子元件建立了AND、OR和NOT逻辑门。在这一阶段,这种DNA计算机只有12个不同的DNA分子,从原先一个单独的逻辑门扩展到五层电路,但运算速度却降低了好几个数量级。     


▌风华正茂 

2011年至今,DNA计算机展现出惊人魅力。2011年,华人科学家钱璐璐在实验室中使用DNA分子构建了人工神经网络。基于DNA链置换反应,这种位于试管中的人工智能系统构建了具有反馈功能的霍普菲尔德神经网络,利用四个DNA构建的神经元实现了“读心”游戏,即通过几个简单的问题,就能够“猜测”对方心中所想的内容。     
钱璐璐说:“我们试图借鉴那些算法、编程语言和编译器之类已经由电子计算机验证过的成功理念,并把它们应用到分子生物学当中。”很快,能够模仿大脑工作形成自己“记忆”的DNA计算机就见诸于报道。     
随后,钱璐璐在前一个“试管人工智能”的基础上,开发了一种名叫“赢者通吃”的由DNA制成的人工神经网络,并解决了机器学习界的经典问题——识别手写数字。这项工作是证实人工智能与DNA电路结合的一个重要步骤。
未来,科学家或许会研制出完全由生物材料制成的类人机器人,而不是当前大众传统认知的基于半导体和晶体管的机器人。

原载 | 《文汇报》8月10日 第五版
来源|化学与分子工程学院
通联|曹美萍
编辑|吴潇岚


往期推荐



华东师大首批9个微专业来了!

华东师大3个双学位专业今年首招,祝贺他们被录取!

创课吗?给居民的那种!华东师大邀你组队参赛

向往冷门绝学!华东师大今年上海首封录取通知书签收

这24支一等奖队伍晋级!研电赛上海赛区在华东师大收官(附名单)

华东师大又有大动作,关键词是卓越基础教育!案例征集中】 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存