查看原文
其他

贝叶斯系统地理学中的空间采样模式分析 | 复杂性科学顶刊精选8篇

集智编辑部 集智俱乐部 2022-05-09

集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。


扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:             



Complexity Express 一周论文精选




以下是2021年12月27日-2022年1月2日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:

1、贝叶斯系统地理学中的空间采样模式分析

2、LinearTurboFold:应用于 SARS-CoV-2 的同源RNA保守结构的线性时间全局预测

3、减少意见两极分化:接触有着不同政治观点的相似人群的影响

4、来自微生物呼吸的生态系统碳源的变化受降雨动力学控制

5、人脑中处理声音的“声音斑块”皮层网络层次结构

6、资源理论中的不确定性:你能区分理论吗?

7、时序复杂系统中用于检测高频变化点的随机嵌入

8、揭示神经网络中宽平坦极小值的结构


1.贝叶斯系统地理学中的

空间采样模式分析


论文题目:Accounting for spatial sampling patterns in Bayesian phylogeography期刊来源:PNAS论文地址:https://www.pnas.org/content/118/52/e2105273118


系统地理学为描述和量化生物在进化过程中的扩散提供了有力的工具。分析地理参考遗传数据通常依赖于这样的假设,即优先在种群栖息地的稠密区收集样本。偏离这一假设会对空间和种群动力学的推断产生负面影响。这个问题在系统地理学中普遍存在,影响了将栖息地近似为一组离散群落的分析,以及将其视为一个连续体的分析。本研究首先介绍了一种贝叶斯建模方法,明确了空间采样策略。然后基于统计计算的最新进展,描述了一种独特的推断技术,该技术最适合于对在某一位置优先采集的序列建模,而与进化过程的结果无关。通过对北美西尼罗河病毒(the West Nile virus)地理参考遗传序列和模拟数据的分析表明,关于空间采样的假设可能会影响我们对跨时空的生物多样性形成动力的理解。

图:检测(图1A)和调查抽样(图1B)方案下的西尼罗河病毒数据分析结果。调查和检测方案一致推断出北美西尼罗河病毒流行的起源位于美国东北部地区。与探测方案相比,测量方案推断的位置确定性较低,特别是在纬度分量上。调查方案下的有效种群规模参数较小(图1C),这很可能解释了该方案对最近共同祖先(the most recent common ancestor,MRCA)出现时间的最新估计(图1D)。该参数在调查方案(红色分布)下的推断值明显大于在探测方案(蓝色分布)下的推断值,表明短时间帧内发生了较大的扩散事件(图1E)。这种观察可以解释为什么检测方案获得的种群增长参数估计值比在调查方案下获得的估计值大(图1F)。



2.LinearTurboFold:

应用于SARS-Cov-2的同源RNA

保守结构的线性时间全局预测



论文题目:LinearTurboFold: Linear-time global prediction of conserved structures for RNA homologs with applications to SARS-CoV-2期刊来源:PNAS论文地址:https://www.pnas.org/content/118/52/e2116269118


COVID-19 变种的不断出现降低了现有疫苗和检测试剂盒的有效性。因此,将严重急性呼吸综合征冠状病毒 2 (SARS-CoV-2) 基因组中的保守结构鉴定为抗变异诊断和治疗的潜在靶标至关重要。然而,预测这些同时折叠和对齐多个同源 RNA 的保守结构的算法最好也有随序列长度的立方复杂度,冠状病毒在 RNA 病毒中又拥有最长的基因组(~30,000 nt),因此这些算法对于该类病毒是不可行的。因此,现有的 SARS-CoV-2 结构建模工作求助于单序列折叠以及具有短窗口大小的局部折叠方法,这不可避免地忽略了对 RNA 功能至关重要的长程相互作用。我们在本研究中介绍了 LinearTurboFold,这是一种折叠同源 RNA 的有效算法,该算法与序列长度成线性复杂度,可对 SARS-CoV-2 进行前所未有的全局结构分析。令人惊讶的是,在一组 SARS-CoV-2 和 SARS 相关基因组上,LinearTurboFold 的纯计算机预测不仅接近于局部结构的实验指导模型,而且通过捕获与纯实验工作完美匹配的 5' 和 3' 非翻译区 (untranslated regions,UTR)(相距约 29,800 nt)之间的端到端对结构而远远超出了它们。此外,LinearTurboFold 将未发现的保守结构和保守可及区域识别为设计高效且对突变不敏感的小分子药物、反义寡核苷酸、小干扰 RNA (siRNA)、CRISPR-Cas13 引导 RNA 和 RT-PCR 引物的潜在靶标。LinearTurboFold 是一种通用技术,也可应用于其他 RNA 病毒和全长基因组研究,并将成为对抗当前和未来流行病的有用工具。

图:LinearTurboFold 框架。与 TurboFold II 一样,LinearTurboFold 将多个未对齐的同源序列作为输入,并为每个序列输出一个二级结构和所有序列的多序列对齐(MSA)。但与 TurboFold II 不同的是,LinearTurboFold 采用两种线性化来确保线性运行时间:线性化对齐计算(模块 1)来预测所有序列对的后验重合概率(红色方块)和线性化分区函数计算(模块 2)来为所有序列估计碱基配对概率(黄色三角形)。上述模块利用彼此的信息并迭代地改进预测。经过多次迭代,模块 3 生成最终的多序列比对,模块 4 预测二级结构而模块5可以对这些结构进行随机采样。



4.减少意见两极分化:接触有着

不同政治观点的相似人群的影响


论文题目:Reducing opinion polarization: Effects of exposure to similar people with differing political views期刊来源:PNAS论文地址:https://www.pnas.org/content/118/52/e2112552118


在一项关于非正式政治交流的大规模预注册实验中,我们通过算法两两匹配参与者,改变两个维度:1)非政治特征的偶然相似程度;2)他们在一个有争议的政治话题上的立场一致程度。参与者首先看到由计算机生成其匹配者的社交媒体资料,其中突出显示了所有共享的非政治特征;然后,他们阅读了他们的匹配者写的一篇简短的、个人的但有争议的文章,内容是通过政府重新分配财富来减少不平等。我们表明,无论政治倾向如何,对于观点温和与强烈的参与者来说,对再分配的支持增加,两极分化减少。我们进一步表明,与匹配者的相似感觉将政治观点同化的可能性增加了 86%。我们的分析还揭示了一种不对称性:与持相反观点的人互动会大大减少亲近感;然而,与观点一致的人互动只会稍稍增加亲近感。通过将先前关于偶然相似性和共享身份影响的工作扩展到政治观点变化领域,我们的结果对社交媒体平台的(重新)设计具有现实意义。由于许多人更愿意将政治置于他们的社交网络之外,因此鼓励基于非政治共性的跨领域政治沟通是一种潜在的解决方案,可以就潜在的分歧和党派话题达成共识。

图:匹配过程的概念图。 我们的 2 × 2 实验设计通过系统地改变两个维度为每个参与者分配了一个合作伙伴:1) 大量非政治特征的偶然相似程度;2) 他们在政治问题上的共识(即通过政府再分配减少不平等)。



4.来自微生物呼吸的生态系统碳源

的变化受降雨动力学控制


论文题目:Variability of ecosystem carbon source from microbial respiration is controlled by rainfall dynamics期刊来源:PNAS论文地址:https://www.pnas.org/content/118/52/e2115283118


陆地碳循环的一个重要组成部分是土壤异养呼吸(heterotrophic respiration,Rh,影响着生态系统的碳源功能和碳汇功能。由于控制微生物生长的生物和物理因素之间复杂的相互作用,异养呼吸是不确定和难以预测的,这限制了我们预测气候的能力。在这里,我们分析了 FLUXNET 2015全球数据库,辅之以微生物生长的概率模型,以检查异养呼吸在生态系统尺度的动力学,并确定预测其变化的主要因素。我们发现异养呼吸的时间变化始终符合 Gamma 分布,其形状和尺度参数仅受降雨特征和植被生产力控制。这种分布源于快速水文波动对缓慢的微生物生长动力学的传播,并且与生物群落、土壤类型和微生物生理学无关。这一发现使我们能够随时准确估计异养呼吸平均值及其方差,与另一独立全球数据集的比较证实了这一点。我们的研究结果表明,未来降水情况和净初级生产力的变化将显著改变异养呼吸的动力学和全球碳收支。在逐渐湿润的地区,异养呼吸的增长速度可能快于净初级生产力,从而降低了陆地生态系统的储碳能力。

图:碳循环和水循环通过土壤微生物相互影响。


5.人脑中处理声音的

“声音斑块”皮层网络层次结构


论文题目:Hierarchical cortical networks of “voice patches” for processing voices in human brain期刊来源:PNAS论文地址:https://www.pnas.org/content/118/52/e2113887118


人类在识别同类嗓音上天赋异禀,然而,对于“人声刺激的神经机制是否有别于其它听觉刺激”这一关键问题,目前还没有明确的结论。为了对其神经机制进行探索,我们使用了六种不同类别的语音和非语音作为刺激,同时用颅内电极采集了癫痫患者在听这些刺激时的皮质电信号(electrocorticographic signals)。研究结果发现,颞叶的不同子区域偏好的声音刺激有所不同,这些子区被定义为“声音斑块(voice patches)”。延时分析的结果表明声音斑块具有双重的层级结构。同时,声音斑块间在功能上彼此连通,这种连通在任务状态和静息状态下都存在。此外,在听音任务中,左侧额叶运动区也被激活,且与颞叶的语音斑块激活相关。这项工作揭示了大脑中处理人类语音的神经机制及其层次结构。

图:声音斑块的连接属性。A)三个声音斑块,B)不同斑块内的神经活动序列,C)斑块间的功能连接:神经活动相关性,D)斑块内部的功能连接,E)左右脑的斑块间功能连接。



6.资源理论中的不确定性:

你能区分资源理论吗?



论文题目:Undecidability in Resource Theory: Can You Tell Resource Theories Apart?期刊来源:Physical Review Letters论文地址:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.127.270501


量子资源理论(quantum resource theory)的一个核心问题是,我们是否可以构建一组单调函数,以完全描述由一组自由操作决定的允许的转变。一个类似的问题是,两组不同的自由操作是否生成相同类型的转变。这些问题都可以归结到一个更普遍的问题——是否有可能从资源理论的一种描述到达另一种。在这篇论文中,我们证明了在量子资源理论的背景下,这类问题在一般情况下是不可判定的。这是通过证明完全正的保迹映射(completely positive trace preserving map)的成员问题(membership problem)的不可判定性来完成的,它包含了所有其他结果。


7.时序复杂系统中

用于检测高频变化点的随机嵌入



论文题目:Harvesting random embedding for high-frequency change-point detection in temporal complex systems期刊来源:National Science Review论文地址:https://academic.oup.com/nsr/advance-article/doi/10.1093/nsr/nwab228/6484821

近年来的研究表明,复杂网络和系统的动力学行为严重依赖于时序结构。准确检测系统内部结构发生变化的时刻已成为一项非常重要的任务,有助于充分了解不断演变的系统的基本机制,以及建立模型和预测系统的动力学。在现实应用中,由于对演化系统的显式方程缺乏先验知识,如何仅依据时序数据来开发实用的、无模型的方法是一个公认的挑战。在这里,我们开发了一种无模型的方法,称为时序变化检测(temporal change detection,TCD),并创新地将动力学和统计方法结合起来,以应对这一重要挑战。本文提出的基于高维时序空间信息的时序变化检测方法,不仅能够在缺乏系统方程先验信息的情况下检测出系统的各变化点,而且能够以相对较高的频率获取出现的所有变化点,这是现有的方法和技术无法完成的。从具有代表性的复杂动力学和现实世界系统的数据,到从生物学到地质学甚至社会科学的数据,这一方法都具有实际效用。

图:新西兰1975年记录的一组地震数据(上图),对地震数据变化点的检测(下图)。



8.揭示神经网络中

宽平坦极小值的结构


论文题目:Unveiling the Structure of Wide Flat Minima in Neural Networks期刊来源:Physical Review Letters论文地址:https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.127.278301


深度学习的成功揭示了神经网络在整个科学领域的应用潜力,并开启了基础理论问题。特别地,基于梯度方法简单变体的学习算法,能够找到高度非凸损失函数的接近最优的极小值,这是神经网络的一个意想不到的特征。此外,神经网络算法即使在噪声情况下也能对数据进行拟合,并具有出色的预测能力。一些经验结果表明,在算法能达到的极小值平坦度与泛化性能之间具有可重现的相关性。同时,统计物理结果表明,在非凸网络中,可以同时存在大量的窄极小值和数量少得多的宽平坦极小值,后者具有很好的泛化性能。这里我们证明,宽平坦极小值可以作为复杂可拓展结构出现,来自于围绕“high-margin”(即局部稳健)构型的极小值的聚合。尽管与 0-margin 极小值相比,high-margin 极小值极为罕见,但它们往往集中在特定区域。这些极小值依次被其他 margin 越来越小的解所包围,导致在长距离上出现解的密集区域。我们的分析还提供了另一种分析方法,用于估计随着模型参数数量的变化,平坦极小值何时出现,何时算法开始找到解。

图:部分网络结构空间的表示。点代表 κ margin 不同的解(零误差构型)。红色箭头表示典型解决方案的四个示例。黄色箭头表示在典型解周围发现的具有更大 margin 的非典型解的三个例子。low-margin 解比 high-margin 解的数量要多。典型的 low-margin 解是相互隔离和疏远的。典型的 high-margin 解彼此之间也很远,但没有那么远,而且往往被(非典型的)low-margin 解包围。因此,margin 更大的解很少,但它们位于由 low-margin 解聚集而来的密集的扩展区域内。





集智新栏目 Complexity Express

上线啦!




Complex World, Simple Rules.
复杂世界,简单规则。
复杂性科学(Complexity Science)是集智俱乐部多年以来的主题,我们长期追踪关于自然、生命、社会、认知等各类复杂系统的研究进展,并组织学术研讨。
 
同时由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。
 
为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统的最新顶刊论文。
 

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
 
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

               


Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂性科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。
Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。
 

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
 
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physical Review Letters

  • Physical Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!
 
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
 

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
  • 网络科学各个分支及交叉应用

  • 图数据与图神经网络

  • 计算机建模与仿真

  • 统计物理与复杂系统理论

  • 生态系统、进化、生物物理等

  • 系统生物学与合成生物学

  • 计算神经科学与认知神经科学

  • 计算社会科学与社会经济复杂系统

  • 城市科学

  • 科学学

  • 计算流行病学

  • 以及一些领域小众,但有趣的工作
 
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
 
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
 
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们(小助手微信:swarmaAI),帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生(具体请邮件联系算法组负责人huqiao@swarma.org)

如果你对复杂性科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)




更多论文




更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。
       


点击“阅读原文”,追踪复杂科学顶刊论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存