研究速递:从等待时间分布估算熵产生率
导语
活系统之所以能够远离热平衡态、生长和繁殖,是由于其消耗了ATP。而一个活系统消耗自由能,或相应的熵产生率的上限是多少?8月17日,MIT的研究者在 Physical Review Letters 发表论文“从等待时间分布估算熵产生率”,根据隐马尔可夫模型中的统计量估计熵产生率,并在多种实际数据中,验证了方法的准确性。
研究领域:生命系统,非平衡态,熵生产率,隐马尔可夫过程
郭瑞东 | 作者
梁金 | 审校
邓一雪 | 编辑
论文题目:
Estimating entropy production from waiting time distributions
论文链接:
https://journals.aps.org/prl/accepted/4d075YbbR541d185849704f9f6367aec6ec68f0ef
对一个活系统来说,运动、生长及繁衍,都会产生额外的熵。但是由于我们观察到的生物自由度通常只是一小部分,看到的一个系统能够产生的熵的最大值也只是冰山一角,因此估计系统产生熵的最大值,变得很困难。尤其是,很多系统中观测到的状态,只包含开或关两个状态,例如基因调控网络,但这样的系统实际上是远离平衡态的。
该研究提出的方法是,根据系统在不同状态停留时间的长短变化,估计系统的典型组成,之后通过解最优化问题,找出所有系统都必须满足的熵增速率,由此估计熵产生率。下图所示的是符合马尔可夫性的系统,处于状态A和状态B的时间的概率密度分布。由于状态A的分布不符合单调性,这一特征意味着系统处于非平衡态。
图1. 该模型使用的数据展示
研究中利用了牛的行为动力学数据来说明方法的有效性。根据牛运动和趴下的时间,或处于静态基因调控网络中的基因表达量分布,来预估牛产生的熵的数值。下图中,图 (c) 展示了观察状态是牛趴下或站立的时长,图 (b) 展示在不同状态下,Glutaminase和Bmal1基因调控网络的对应蛋白的表达量概率密度分布。
经过实验,图 (a) 展示了根据多个状态估计的标准化后的熵产生率(横轴)和不同状态间时间的差异(纵轴),由此得出的基因调控网络的熵的产生量,以及不同运动量的牛产生的熵,都和模型预估的数值一致。即奶牛趴下的时间分布最偏左(经常起来),其次是室外的肉牛,而室内养殖的肉牛趴下时间最长,由此预估的其产生的熵也越少。
而在连续状况下,采样率的提升会使得估计更准确。下图展示了根据心电图得到的心率数据估计的不同动物的熵产生率。相比狗来说,小鼠的心跳分布更加集中在特定的时间段上(差异不明显),对应的其产生的熵也比狗低(左图)。而10-19岁处在发育期的少年,比40-49岁的中年产生的熵要多(左图),由此说明了该方法的可行性。
图3. 根据不同动物的心率数据,估计的熵的产生
总结来看,熵的产生是活系统能够对抗热力学第二定律的源泉,而根据粗粒化观察到的状态持续时间,经由算法可以推算熵的产生,为活系统的研究提供了帮助,例如量化不同处于远离平衡态的系统面对的权衡。该发现还未对不同活系统的发育及衰老过程进行对比。甚至对于金融系统、物流网络这样的人造活系统,也可能能使用该模型提出的方法,估算其熵产生率。
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:
推荐阅读
点击“阅读原文”,追踪复杂科学顶刊论文