生命是什么?这一追问至今仍在进行中,目前的答案以定性居多。而随着在自然界发现越来越多新型生命形态,以及新技术所创造的许多类生命系统,生命系统与非生命系统之间的明确边界正在不断受到质疑。近日发表在Theory in Biosciences杂志的一项研究,用信息论分析生命系统与非生命系统在信息架构上的区别,并讨论量化构建“生命光谱”的可能性。论文通讯作者Sara I. Walker任职于亚利桑那州立大学和圣塔菲研究所,从事复杂系统和生命起源、天体生物学研究。
Hyunju Kim, Gabriele Valentini, Jake Hanson & Sara Imari Walker | 作者
信息是一个抽象的概念。虽然由克劳德·香农(Claude Shannon)开创的信息数学理论将某些方面形式化了,但它并非对“信息是什么”的完整描述。尤其,我们并没有一个具体的框架来理解对信息之于物理究竟是什么。信息可以在不同的物理介质之间复制,这意味着它并不是严格意义上只与物理质料相联系的物质属性。例如,信息可以从作者的头脑中复制到这一页文字上(通过写在电脑),或者复制到印刷的纸张上,并最终按照预期功能复制到读者的大脑中(例如这里你阅读到的)。这些事件在空间和时间上是分离的,并且发生在完全不同的物理介质上。就像许多信息传输的例子一样,这表明信息不可能仅仅是大脑的化学湿件、或计算机处理芯片上的一种属性。正是在这个意义上,信息才是“抽象的”(同样人们也可以认为“能量”是抽象的,因为它能在不同的物理系统之间流动,并以不同的方式储存或使用——如化学能、机械能等。但相比之下,我们确实对什么是物理上的能量有一个非常清晰的认识)。然而,信息也必然是物理的。为了使信息存在,它必须在物理自由度中实例化(L&auer et al. 1991),因此信息的动力学取决于物理自由度下动力学。在生物学中,信息的作用更为突出,它似乎具有“自己的生命”(Davies&Walker 2016),对生物过程的解释暗示“信息”本身就具有因果效应(Davies 2011)。生命拥有能够存储和处理信息的惊人能力,不仅对于理解生命本身的起源(Yockey 2005;Walker&Davies 2013),对于理解生命系统如何在我们观察到的时空尺度中组织起来,也是一个具有核心意义的课题。信息传递和信息处理通常被认为是集群行为背后的驱动力,例如蚂蚁和蜜蜂的寻巢行为(house-hunting)、椋鸟群和鱼群的奇妙运动、人类群体中的车道形成等等,直到细胞群的水平(Franks et al. 2002;Couzin,2009;Deisboeck&Couzin,2009;Moussaid et al. 2009;Couzin et al. 2011)。然而,虽然已被大量实验和分析研究过,以上这些集群的信息机制却往往只以生物体的具体物理量为特征、仅以非形式化方式就被定义了。
信息论下形式定义
为超越单纯的描述性分析,或具体的案例研究,有必要引入形式化信息内容和信息流的方法。物质属性已经被量化了几个世纪,信息则相对是更新的进展,它始于香农的开创性工作。在信息论中最基本的量称为熵,H(x) 被定义为(Shannon 1948): 其中 p(x) 是随机变量 X 处于状态 x 的概率。当 p(x) 是所有可能状态的均匀分布时,H(X) 是最大化的,它通常称为香农熵。香农熵可以被描述为你在得知一个事件结果时可能体验到的惊讶程度:事件越不可能发生,你在得知事件时就感觉越惊讶。从这个角度来看,信息的概念与减少不确定性密切相关,因为一个事件的不确定性越小,你对事件结果的惊讶程度就越小,它所包含的信息量也就越少。香农熵构成了信息论的基础,其它大多数信息概念和度量都是基于香农所发展的一般信息概念的基础上衍生出来的。然而仅仅用熵并不能完全体现"信息"的概念,因为信息还需要发送者和接收者(Adami 2016)。在这方面,信息被定义为给定其它过程下某个随机过程不确定性的降低,并由所考虑过程间共享的熵的大小来表示(Cover & Thomas 2005),这被量化为互信息(mutual information): 互信息可以很方便用维恩图来可视化,即每个过程的熵相互重叠的区域(图2a)。当考虑某个过程的熵,去掉与其它所有过程的互信息,我们就得到了条件熵:即了解其它所有过程知识时,该过程还剩下的不确定性。因此,互信息度量的是我们从所有其它过程知识中获得有关某个过程的信息。图2:维恩图表示的 a 互信息;b 传递熵。 互信息也被用来量化存储在一个系统和/与它各个组成部分中的信息量。最常用的测量方法是超额熵(excess entropy)和主动信息(active information)。超额熵(Crutchfield & Feldman 2003)被定义为一个过程过去和未来之间的互信息,衡量某个过程可以通过观察其过去的行为来解释的未来的不确定性;主动信息 A(X) 也提供了类似的度量,但它不考虑整个过程的未来,而只关注和预测过程中即将抵达的下一个状态(Lizier et al. 2012a): (其中代表 X 中从时间点 n 开始过去 k 个状态:{x𝑛-𝑘+1, ..., x𝑛-1, x𝑛}。)
虽然互信息允许定义和量化信息,但它只是一个对称的量,不能捕捉到随机过程之间的方向性关系(如信息传递)。为克服这一信息量化处理的局限性,Schreiber(2000)引入了传递熵(transfer entropy)的概念,它是给定某个随机过程过去(如历史信息)和一个或多个其它过程当前知识了解下,对该过程未来状态的不确定性减少的一种度量(Schreiber 2000; Kaiser & Schreiber 2002): 其维恩图表示如图2。传递熵利用时间方向性来克服互信息对称性的限制,它是对两个或多个过程之间的定向传递的预测信息的度量(Lizier&&Prokopenko 2010),因此也不一定就意味着因果作用(James et al. 2016);但它的逐点变量(point-wise,或局部变量)可以为集群行为的时空动力学提供有用的洞见(Lizier et al. 2008b)。
5. 信息论可以度量什么?
有关信息在生物过程中的作用,以及生物学是否需要一种不同类型信息的形式化(在现代信息论中通常被称为功能信息或语义信息),一直存在着长期争论 [例如, Yockey (2005) & Godfrey-Smith & Sterelny(2007)]。我们认为,目前阐述的信息理论,特别是考虑到分布相关性(Schreiber 2000)和因果信息(Hoel et al. 2013; Ay & Polani 2008)测量方面的最新研究,足以在信息如何构成生命的问题上取得进展。具体而言,我们认为生命系统最与众不同之处是它们的因果结构和信息架构(Walker 2017)。现代信息测量方法,如传递熵(Schreiber 2000)、因果信息流(Ay&Polani 2008)、有效信息(Hoel et al. 2013)、因果特异性(Griffiths et al. 2015)、整合信息(Oizumi et al. 2014)和整合时空模式(Polani et al. 2016)等等,所有这些都有希望从信息论角度对生物过程提供多样而丰富的见解,使我们有能力了解如何在各种时空尺度上描述生命的信息架构和因果结构。例如,速度和方向信息通常是在鱼群(H&egard et al. 2012)和椋鸟群(Cavagna et al. 2010)协调运动的背景下研究的物理量,此类信息在群体中的传播已经用统计物理工具进行了建模(Bialek et al. 2012),各种行为机制 [如群感响应(quorum response)——许多动物采用的一种共识机制(Pratt et al. 2002;Wardal et al. 2008;Sumpter&Pratt,2009)] ——也进行了类似的研究。这些机制允许集体中的个体建立反馈回路,以放大或抑制信息的传递(Couzin 2009)。尽管研究这些群体信息传递、存储和处理的形式化方法还不太成熟(Dall et al. 2005),但对这些现象的大量关注为形式化应用方法和发展新理论提供了有力依据。在下面内容中,我们并不认为存在一种量化生物集群行为"正确的信息度量"立场,而是主张在适当的控制下,通过在不同的生物数据集上应用多样化的测量方法,解决生物系统如何在空间和时间上操纵因果相关结构以执行功能。我们会通过解析生物系统区别于非生物系统的信息架构(Walker et al. 2016),并希望利用这些见解构建解释“生命是什么”的新理论。
信息架构
形式上就我们旨在本节中提出的意义而言,集群行为的信息结构(以生命作为旨趣实例)是相对未被探索的开放的研究领域。尽管如此,一些研究已经概述了它的一些显著特征。例如,Danchin 等(2004)将个体可获得的信息分成个体信息(personal information)和社会信息(social information),前者通过与环境的直接互动获得的,后者则受益于其他同伴的行为获得。进一步又可以将社会信息分为通过信号传递(signaling)和间接观察(indirect observation)获得的社会线索或公共信息。信号传递是有意传递的信息,而社会线索(如觅食者的位置揭示了食物来源)和公共信息(如觅食者的表现提供了食物来源质量的信息)则缺乏此类特征。在集群行为背景下,Moussaid等(2009)强调了直接信息传递和间接信息传递的区别。按照 Danchin等(2004)的说法,直接信息传递对应明确的信号传递以及对社会线索和公共信息的间接观察,间接信息传递则是个人信息的一个子集(Danchin et al. 2004),它只包括个体之间通过环境中介传递的信息。间接信息传递通常被称为共识自主性(stigmergy),它包含了一种沟通形式,在这种形式中环境的功能是一块共享的黑板,个人可以修改黑板来书写信息,也可以感知阅读信息(Grassé 1959)。间接信息传递最突出的例子无疑是某些种类蚂蚁的信息素铺设和跟随行为(Goss et al. 1989;Hölldobler & Wilson 1990)。 然而上述定义,主要关注的是个体获取与可能传递信息的不同方式。一个量化集群行为信息结构的形式框架,还应该考虑信息加工的其它基本方面。事实上,一个集群系统的内部计算不仅是组成部分之间信息传递的结果,还可能要求它们具有存储和转换信息的能力(Crutchfield 1994;Feldman et al. 2008)。这其中一些特征可能存在争议,例如目前还不清楚,在什么意义上,集体趋化作用(collective chemotaxis)会要求个体存储它们位置以外的信息,或可能只是要求它们做出反应——无论这是否是由进化编程存储的一组反应之一。 因此,集群行为信息架构的正式框架可以包含所有这些元素,重点在它们间的相互作用及随时间的演变。在这个方向上的第一步是接受一种独立于应用领域的通用语言,使我们有可能对信息处理的所有方面进行正式建模。当然这种共同语言要由信息论提供。
度量复杂系统的信息架构
信息论度量方法引入后不久就首先被用于研究集群行为:推断蜜蜂的摇摆舞(Haldane & Spurway 1954)和蚂蚁信息素踪迹(Wilson,1962)所编码食物来源的方向信息大小。但应用信息论对集群现象进行系统研究却相当零散(Dall et al. 2005) 。例如,统计物理学将互信息用于研究二维伊辛模型(Ising model)中的相变(Matsuda et al. 1996;Gu et al. 2007),由维切克模型 [1](Vicsek model)驱动的自推进粒子蜂群模拟(Wicks al.,2007),以及调节模型(regulatory models)中的随机布尔网络(Ribeiro et al. 2008)。在所有这些情况下,互信息在无序或接近相变阶段时均达到峰值。互信息和块熵(block-entropy)——一种测量有限连续事件不确定性熵的变体(Shannon 1948),已被用于研究蚂蚁信息素铺设模拟中的群体决策(Klyubin et al. 2004),此项研究表明有限的噪声有利于信息传递(Meyer 2017)。最近,Gelblum 等人(2015)的研究则显示,附着在集体运输上的蚂蚁会向系统输入信息,但这种信息只在短时间内有效。以上这些测量方法不仅被用作分析工具,还被应用于人工进化控制器,设计模块化的集群运动行为(Prokopenko et al. 2006)和多机器人系统(Sperati al et al. 2008)等等。信息论涉及大量不同科技领域信息的量化、存储和传递(Cover & Thomas 2005)。例如在生物学的背景下,信息论被广泛用于研究神经系统的功能并确定相关脑区结构(Honey et al. 2007;Vakorin et al. 2009;Nigam et al. 2016;Ito et al. 2011;Lizier et al. 2011;Vicente et al. 2011)。主动信息(见前面公式)被用于研究元胞自动机的信息存储(Lizier et al. 2012b)、神经信息处理(Wibral et al. 2014)以及蜂群动力学(Wang et al. 2012)等,而超额熵则主要应用于复杂物理现象的研究(Crutchfield&Feldman 2003)。虽然其它信息流和因果信息度量方法的应用将为我们讨论的问题提供更多见解,但这里我们主要会关注传递熵的信息处理的方法。并在后面为所选的传递熵提供了一个说明性的示例,驱动来自大量不同领域传递熵的应用,如神经科学和金融(Bossomaier et al. 2016),包括互信息及传递熵都已被用于研究二维伊辛模型不同阶段的信息流(Barnett et al. 2013)。Lizier 等(2008b)用它来研究元胞自动机,并表明质点(particles,定义为滑翔机(gliders)和域壁(domain walls))是这类模型中传递信息的主要手段。Wang 等(2012)研究了人工粒子群体运动模拟中的信息级联,表明它们以波浪的形式在群中荡漾。在模拟中使用传递熵框架研究的其它集群行为还包括酵母细胞周期的动态调节网络(Kim et al. 2015;Walker et al. 2016)(见下文讨论)和多代理系统中的共识实现(Valentini et al 2018)。此外在动物集群行为研究中也得到了一些应用。例如,研究成对和小群的斑马鱼的信息传递,为识别领导关系提供了有用的工具(Butail et al. 2014,2016;Mwaffo et al. 2017),以及鱼类U型转弯过程中的信息和错误信息交互作用(Crosato et al. 2018);还有研究蝙蝠(Orange & Abaid 2015)或蚂蚁和白蚁的引导者-追随者关系(Valentini et al. 2020),粘液霉中的信息传递(Ray et al. 2019),以及成对鱼群之间的捕食者-猎物关系(Hu et al. 2015)。既然不同度量指标如此宽泛且还都具有广泛适用性,对在不同系统中应用信息理论见解的最佳方法、甚至对这种方法是否可能,目前都尚无明确的共识,每种度量都提供了一种动力系统因果与相关结构在较低维度上的投影,因此并不能捕捉系统全貌。而将不同度量方法结合在一起,可以提供对生命和非生命系统结构更深的洞察,进而可以利用这些度量方法采取下一步行动,再发展出新的理论和度量方法,以了解生命究竟是什么。
例子:行为相似但机制不同集群的信息架构
集群系统经常面临需要做出集体层面共同协商的决定。这种决定是由大量的代理体作出的,往往遵循简单的互动机制:收集、传递和处理集体决定所需要的信息。群体决策过程中的信息传递最重要:没有信息的交流,集体之间就无法达成共识。尽管我们目前对群体决策机制有很好地理解,但个体规则在群体决策信息传递中的贡献却还鲜为人知。为了解决这个问题,更好理解不同决策机制的信息状况,我们研究了源自同一决策问题(Valentini et et al. 2018)信息传递应用情况下的不同决策策略:从两个选项中价值较高的一个达成共识(Valentini et al. 2017)。我们考虑了两种决策机制,多数决规则(majority-rule)和选举模型(voter model),均通过集体中100个代理人产生意见。在我们的模型中(Valentini et al. 2016),代理人总是偏好两个选择中的一个。设其中地点 A 的质量为 1,地点 B ∈ {0.5,0.9}。代理人会在两个阶段交替行动:在探索期前往与当前意见相符的环境区域,对该选项质量进行采样;另外是根据估测的传播质量,在当地向共同地区其他代理人广播其意见的传播期。在传播期和探索期之间,代理人应用决策机制,并可能改变意见。当使用多数决规则时,代理人将把意见切换到大多数邻居所喜欢的意见(Valentini et al. 2015)。当使用选举模型时,代理人会简单地随机选择邻居的意见(Valentini et al. 2014)。在这两种情况下,我们都考虑了邻域构成,它会根据代理人的运动动态变化,但具有固定的基数(cardinality),通常一个代理会有5个邻居左右。
图3. 地点A(红色区域)、巢穴(白色区域)和地点B(蓝色区域)的模拟环境图示。实心圆代表处于传播状态的代理体,空圆圈代表处于探索状态的代理体。颜色代表选择的意见,红色表示选择 A,蓝色表示选择 B。图自 Valentini et al. 2018
多数决规则和选举模型之间的机制差异导致了不同的表现:前者比后者更快(图4a),但准确度更低(图4b)(这一结果更深刻的讨论参见 Valentini et al. 2018)。
图4. a 共识时间(对数尺度),b 模拟收敛于地点A的共识比例,c 在N=100的群体中初始偏好地点A代理数(如 {10,11,...,90} )的传递熵。问题配置:多数决规则 𝜌𝐵(𝑀𝑅) ∈ {0.5,0.9},选举模型𝜌𝐵(𝑉𝑀) ∈ {0.5,0.9} 。数字报告了使用LOESS回归计算平滑条件均值和置信区间估计,数据跨度为0.1。图自 Valentini et al 2018
在此基础上,我们可以解释应用决策规则(即多数决规则和选举模型)的代理体从周围邻居那里接收的信息流。通过将传递熵应用于从空间多体模拟中收集的数据实现这点(见图3),我们发现,与速度和准确度一样,代理体之间传输的信息取决于决策机制。随着集体达成共识的决策时间增加,从邻居传递到应用决策规则的某个焦点代理体的信息量也会增加,并随着最终结果的不确定性宽松调整。这个例子突出了信息结构和局域规则之间的关系,即使在集群行为最终可能导致类似决策的情况下。它强调信息结构不仅是要做出决策的属性,同样是以各组成部分之间相关结构来说明微观动态和宏观尺度特征关系的一个属性。为进一步说明这一点,可以使用我们中一些人的最近工作,将泰诺胸蚁(Temnothorax ants)纵队行进行为(tandem running behavior)的信息流结构与另外两种白蚁进行比较(Valentini et al. 2020),分别是精巢散白蚁(Reticulitermes speratus)和台湾乳白蚁(Coptotermes formosanus)。通过聚焦泰诺胸蚁的纵队行进行为,使用传递熵来研究引导者和跟随者蚂蚁之间的信息流。纵队行进允许对潜在地点知情的蚂蚁(引导者)引导不知情的蚂蚁(追随者)了解其获得的位置。纵队行进过程中,引导者会进行小段直线运动,跟随者则会进行更多种不同运动(如当记忆地标的时候)(Bowens et al. 2013),期间跟随者与引导者的身体接触会触发一系列重复动作。这种双向反馈(引导者引导跟随者跟随)被假设为实现了一种类似于人类教学的学习过程。与泰诺胸蚁不同,白蚁纵队行进的目的是确保新成对的雌雄白蚁夫妇在探索环境、寻找新巢址时不会失去对方。白蚁纵队行进的引导者并不知道潜在的巢址,因此并不试图将这些信息传递给跟随者。我们用传递熵分析了蚁群纵列对之间信息交流的幅度和方向,考虑了三种通信通道:运动、旋转和运动-旋转结合。根据相关信道的不同编码方案,对纵列对的空间连续轨迹进行了离散化处理:
复杂系统研究的主旨之一是理解并理预测出系统涌现的全局动态,例如动态轨迹或最终状态(Liu & Barabási 2016)。这些代表系统集群行为的全局状态可以通过施加外部因果干预来改变。引导整个系统从初始状态到达期望的最终状态。这为许多领域应用都提供了强大的工具,包括从舆论动态相关的问题到流行病,从细胞的分化到社会性昆虫的巢穴选择问题等等。 最近的研究发展了复杂网络控制相关的数学基础,试图通过理解因果结构与各组成部分动态的更新规则来寻找严格的控制机制。Liu 等人(2011)发展了他们的前瞻性框架,将具有线性动态过程的有向复杂网络可控性问题简化为一个图论问题。利用他们的理论可以确定一组能够完全控制整个网络动态的驱动节点(driver nodes)。他们还发现,所确定的驱动节点往往是低度节点,并且总数主要由网络的度分布决定。生物系统模型大多是非线性动力学系统,完全可控性既不可行也没有必要。相反,找到一种特定的控制机制,能够将一个给定的系统从特定的初始状态或轨迹引导到另一组期望状态或轨迹集合,是更为现实的,往往也足够的(Cornelius et al. 2013)。例如,控制基因调控网络的主要目的之一是将系统引导到特定的细胞状态,而非任意的表达水平。这种表型控制通常被定位在整个网络的一小部分中,以能驱动系统到期望吸引子的控制核来定义。不过,控制核的大小通常比一般随机网络还要更大(Liu et al. 2011; Kim et al. 2013; Gates & Rocha 2016; Choo et al. 2018)。这表明生物系统的可控性程度可能存在一定的范围,可以通过控制核的大小来量化。因此我们会将可控性程度视为生物系统信息架构的基本特征(Walker et al. 2016; Kim et al. 2015),以区别于所有非生物集群。
在最近的工作中(Kim et al. 2015),我们通过计算网络中每一对节点之间的传递熵来量化裂变细胞周期网络的信息架构,从结果中识别出生物学的特有的模式,并通过控制核证明它与控制机制之间的密切关系。为了区分生物系统表征的信息模式,我们将传递熵的分析结果与对随机网络集成进行的相同分析进行了比较,这些网络被构建为与每个酵母网络共享某些相同拓扑特征,但不执行相同的生物功能。为了进行比较,我们利用了 Erdös-Rényi (ER)和无标度(SF)两种类型的随机网络集成。ER随机网络与裂变酵母网络,除了网络大小外没有共同的结构偏向。相比之下,SF随机网络集成与细胞周期网络一样,每个节点保持相同数量的激活和抑制连接,这使得SF与生物网络有相同的拓扑度分布。我们将单个网络处理的总信息定义为其中所有节点对之间传递熵的总和。结果显示,酵母细胞周期网络处理的信息量比任何集合中大多数随机网络都多(图6a)。这是一个直接测量结果,支持了与信息处理和临界点相关的假设,即在生物系统中临界点附近存在着信息传输的优化,不像以前没有基于经验数据集的定性或一般模型的研究,在这里这点被定量地清楚展示了出来。通过根据每对节点传递熵的测量值分析缩放标度,我们还研究了处理后的信息在各个网络中的分布。标度关系表明,与随机网络相比,生物网络具有明显异常的值(图6b),生物管理信息最显著的特点是,生物网络中信息被处理得更加均匀。标度模式还表现出了统计学上独特的高-中等级节点对范围,与随机网络中相应尺度的节点相比,生物网络的传递熵明显更大。并且我们发现,这种生物学上独特的范围是由控制核节点和非控制核节点之间的信息处理主导的(图6c)。细胞周期网络在信息结构上表现出与随机网络相区别的特征模式,控制核节点通过控制有关结构的全局因果(状态转换图中的因果流),在网络信息传递中起主导作用,调节着系统全局状态转换。
图5:裂殖酵母细胞周期调节的布尔网络模型。节点代表调控蛋白,边缘表示节点之间的两种生化作用:激活(以箭头结尾)和抑制(以条形结尾)。其中红色节点是控制核,当固定在特定值时,它可以调节网络的全局行为。该图根据 Davidich 和 Bornholdt(2008)和 Kim 等人(2013)的数据重新生成。
图6:裂变酵母细胞周期网络中的信息架构和因果结构。a ER(绿色)和 SF(蓝色)网络集成处理总信息的分布。每个数据点表示在x轴上,传输的给定信息总量的各个集合中的单个网络的数量。b 裂变酵母细胞周期中成对节点间传递熵的标度,ER和SF网络分别用红色、绿色和蓝色表示。对于1000个网络的样本,计算每个随机网络集合的平均值和标准差。虚线之间的区域表示裂变酵母的信息标度在生物学上独特的范围。c 裂变酵母细胞周期网络信息传递的标度关系。CK 表示控制核节点,而 NCK 则是一组不包含在控制核内的节点。所示数据与中间面板中裂变酵母传递熵的标度模式相同。根据一对中每个节点是在CK还是在NCK中,标度模式被分为四类信息传输。这些数字来自 Kim 等(2015)(在线彩色图)
6. 非生命物理系统
到目前为止,我们主要讨论的都是生物学的例子,但为了进一步实现理解生物集群独有特征的目标,我们还必须理解所关心这些特性在非生命系统中出现在哪里。例如,有些非生命的、纯物理系统允许我们在没有生物组织的情况下研究可控性。引力体(Gravitating bodies)、范德瓦尔斯气体(Van der Waals gases)和自旋玻璃(spin glasses)都是潜在作为纯物理复杂系统的例子。不幸的是,这些系统中的绝大多数从未进行过任何形式的可控性分析,因为几乎没有控制它们的实际需求。耦合量子系统是个例外,由于量子计算的潜力人们对其可控性进行了严格的核查。尽管对量子系统可控性的全面回顾超出了本文的范围,但值得指出一些与网络可控性相关比较突出的结果。最值得注意的是,许多耦合的量子系统只需通过操纵一个或两个量子比特就可以实现完全可控性,其作用类似于网络控制理论中的驱动节点。若通过使用某种形式的外部控制可以访问整个希尔伯特空间,那么一个量子系统就被称为是完全可控的(Schirmer et al. 2003)。给定足够的外部控制量,任何系统都应该是完全可控的。例如如果可以控制一个系统每个单独的自旋,那么一个耦合的自旋-1/2粒子链将是在极其精细下完全可控的。更有趣是,为了完全控制系统,量子系统需要的最小外部控制是什么,这与Liu 等人(2011)等人在网络可控性方面提出的问题一样,答案也惊人的相似。具体来说,Burgarth 等人(2009)研究了一种通过各向同性海森堡型(isotropic Heisenberg-type)相互作用耦合在一起自旋为-1/2的粒子链的完全可控性条件,发现通过两个非对易(non-commuting)的外部控制对链末端单个节点的状态,就足以对网络实现完全可控性。类似地,在具有XY型相互作用的海森堡型自旋链中(Z自旋分量之间没有耦合),只需操纵单个位点及与邻近位点的相互作用就可以实现完全可控性(Schirmer et al. 2008;Kay & Pemberton-Ross 2010)。然而也并非所有自旋链系统都如此容易控制。例如,伊辛型(Ising-type)的相互作用需要对每个局部自旋进行控制才能实现完全可控(Wang et al. 2016)。事实上,就像网络可控性一样,很难判断给定的拓扑结构和交互类型是否能在少数驱动节点上产生完全可控性,量子可控性领域的许多研究都集中在解决这个问题上。现在还很难知道量子系统的非经典性是否会影响我们对纯物理系统控制的理解。但可以明确的是,这些系统中的一些系统要么通过少量的局部相互作用实现全局控制,要么需要对每个组件进行操纵。这与"控制核"部分提到的对复杂网络可控性的研究是一致的:与随机网络相比,包括生物网络在内的无标度网络往往需要更多的驱动节点来实现完全可控性,但又少于完全断开连接的网络,仅仅需要对每个节点进行操纵。这可能表明,生物系统的可控性特征程度在于临界状态,与很多时候生物系统动力学中的临界的状态相似(见“临界性”部分)。因此总的来说,在对生命群体进行分析的同时,对物理集群系统进行更广泛的分析,可能会被证明更富有成效,可以准确确定哪些特征是生命中物理所特有的,而非作为物理宇宙中一个更广泛的属性。
7. 讨论
我们当前对所有尺度生命更深的理解,都正趋向于将决定生命属性的概念定义在信息上(Nurse 2008),即使它可能并非真的最重要。正如本文已经部分回顾那样,信息理论的工具已经被用来解释各种生物现象,从大脑神经元的放电(Honey et al. 2007;Vakorin et al. 2009;Ito et al. 2011;Lizier et al. 2011),到鱼群的行为(Butail et al. 2014,2016;Mwaffo et al 2017;Crosato et al. 2018),再到细胞内的化学信号传递(Chong et al. 2011;Rhee et al. 2012;Selimkhanov et al. 2014)。与此同时,要实现真正的“生命系统物理学”,需要对生命有比目前已知的更基本的理解(Bialek 2012)。其中悬而未决最具挑战性的问题之一是缺乏区分生命系统和非生命系统的可量化指标(Clel& & Chyba 2002; Davies & Walker 2016)。虽然现代生物学的大部分研究内容,可以在没有对生命是什么(以及不是什么)有深入的数学理解的情况下进行,但在某些科学领域,客观的、可测量的生命构成标准是绝对关键的:这些标准包括生命的起源和对外星生命的探索(Walker 2017)。在我们努力在实验室(Cronin & Walker,2016)或其他星球(Walker et al. 2018)寻找新生命实例的过程中,可量化的指标将成为决定性因素——允许在实验室中设计可进化的化学系统,穿越从非生命到生命的小径,或允许对生命进行明确探测,即使它可能存在于与已知生命完全不同的化学成分中。在建立对生命的定量理解方面,最大的障碍之一是我们缺乏适当的控制来隔离生命过程的物理机制。虽然标准物理学对生命的运作有了一定合理的理解(Schrödinger 1992; Hoffmann 2012),但我们迄今为止还没有设计出有效的实验隔离,证明生物系统和非生物系统属性是否能够进行直接比较,或是否能解决非生命和生命系统之间集群行为的差异。亦或许没有这样的区分更有意义。为解决研究生命过程中物理机制需要更好的控制的问题,我们提出了一套想法,建立了一个框架,在这个框架中让生命存在于一个连续谱上,从我们目前认为可能表现出一些“类生命”行为的非生命系统,一直到行星规模的文明。这是生命可能存在于一个光谱中想法的自然结果,在这个光谱中,其中一些系统比另一些更有生命力,关键的区别属性是它们的信息架构。虽然我们认为这样尺度的生命可能存在,但还没能为这种尺度建立适当的度量标准,也没有在上面放置特定的例子。其中面临的挑战之一是,对许多群体系统之间的比较分析仍有待严格制定和界定。我们认为信息论方法是最有前途的,因为它们捕捉到了物理系统在时空中存在相关的因果结构,提供了一个足够抽象和严格的数学框架,是我们发现生命过程的各种物理介质和尺度中量化生命的候选方法。而为了做出群体决策,个体必须共享信息,因此对群体系统中信息流的严格量化是可能提供新见解的一种途径,使人们了解新的计算类型(例如决策)如何从单个代理的行动中产生。随着人工智能和信息理论应用的发展,现在可以通过许多不同的渠道提取生物行为的算法来处理生命系统中的信息,例如运动、形态学和生物电场。然而,尽管在概念和技术应用方面都取得了进展,但尚未进行系统的分析,直接将生命系统的信息特性与非生命系统进行比较,对生命系统的信息特性进行量化。大多数生物模型都是用硅片树脂或机器人建造的,这意味着不可能直接将这些模拟系统的物理性质与生物系统进行比较,毕竟后者存在于潮湿、混乱的化学环境中。这在很大程度上限制了当前人工生命模型区分表现为“类生命”和严格作为生命物质的能力。 “一个例子:行为相似但机制不同的跨集体的信息架构”一节中的例子表明,如果它不能捕获局部级别的规则,那么不同系统中相同模拟的行为可能是不够的,因为信息流将有所不同。因此,如果只是天真地构建硅片模拟系统,可能不足以理解真实生物过程中的物理信息流。我们已经证明信息理论对特定规则选择是敏感的,而在计算机中建模者会显式地选择规则,这就使得计算机模拟生命中的信息结构与真实世界生物系统相比会直接存在差异。特别是,真实生命不允许孤立系统中的信息流结构(译注:如封闭的计算机中),不会超越或超出物理和化学法则进行外显编码(译注:如人工智能软件系统的特殊规则),我们假设这是理解生命物理学的关键一步(Walker&Davies 2013)。此外,计算机模型通常是真实世界过程的低维表示,因此不能捕捉到生物体们处理信息的所有多重信道。向前推进的一条可能道路是建立活体系统的物理模拟。例如,油滴混合物中演化的集体行为提供了一种非生命系统物理中模拟生物特性的方法,而不仅仅是在计算机中模拟(Taylor et al. 2017;Points et al. 2018)。因此,解决我们在这里提出的问题的一条途径是开发活体系统的物理模拟,作为探索信息流物理的一种手段。当然,要确定这种方法是否会最终能取得成果,还有很多工作要做;但我们认为,为理解集群行为,何时可归因于生命过程、何时又不能,朝这个方向迈出步伐的努力,尤其是研究并提供新的定量理论和工具,将源源不断提供新的见解并促使生物学持续发展。原文:https://link.springer.com/article/10.1007/s12064-020-00331-5