集智斑图最新论文栏目,关注复杂系统、网络科学、计算社会科学、统计物理等领域的前沿进展,每天即时更新相关顶刊论文,和最新arXiv预印本论文。
本文是对近期arXiv论文的汇总编译(by 彩云小译)。更多最新论文,请扫二维码获取。超级传播者和高变异传染病;
分散非凸有限和优化问题的近最优随机梯度法;
多智能体强化学习的意图传播;
非凸经验风险最小化的分散随机梯度跟踪;
交互复杂动态过程中因果分解的扩展;
电网动态连锁故障;
多个混沌系统信号和的非线性同步;
基于网络表示学习的顾问-被顾问关系挖掘模型;
删除的力量: 对 Twitter 趋势的临时性攻击;
基于武汉市出租车 GPS 数据的网络学习实证研究;
围绕特朗普的故事的计算时间线重建: 故事动荡、叙事控制和集体时间顺序;
控制新冠肺炎在大学校园的传播;
电力与流行病: 探索21新冠肺炎全球电力需求的变化;
实现党派对称: 问题与悖论;
社会距离的不连续转变;
集体遗忘和文化选择在发明者和物理学家群体中的兴起;
拼车经济下大型团队竞赛个人待遇效应的预测;
统计分析和区域表征学习对新冠肺炎流行病的理解;
Superspreaders and High Variance Infectious Diseases
地址:
http://arxiv.org/abs/2008.07352Yaron Oz,Ittai Rubinstein,Muli Safra摘要:新型冠状病毒肺炎等流行病的一个众所周知的特征是感染传播中的高度传播异质性: 并非所有感染者都以同样的速度传播疾病,一些个体(超级传播者)是大多数感染的罪魁祸首。为了量化这一现象,需要分析感染分布的方差和高阶矩的影响。在随机分支过程的框架下,我们推导出一个在感染分布的高方差区域中爆发概率的近似解析公式,用数值方法验证了它,并分析了它在不同实例中的有效性。我们表明,即使基本传染数 r 0大于1,在高方差体制下也有可能不发生疫情,并讨论了我们的结果对新型冠状病毒肺炎和其他流行病的影响。
A near-optimal stochastic gradient method for decentralized non-convex finite-sum optimization
地址:
http://arxiv.org/abs/2008.07428Ran Xin,Usman A. Khan,Soummya Kar摘要:本文提出了一种近似最优的随机一阶梯度法,用于求解光滑非凸函数的分散有限和极小化问题。具体来说,我们提出 GT-SARAH,采用局部 sarah 型方差减少和全局梯度跟踪来解决问题的随机性和分散性。考虑 n 个节点的有向网络平均划分的 n 个代价函数,我们证明了当 n ≤ o (n 1/2(1 -)3,其中(1 -)是网络权重矩阵的谱间隔时,GT-SARAH 在 o (n 1/2-1)梯度计算中找到一个精确的一阶驻点,独立于网络拓扑。因此,据我们所知,在这种体制下,GT-SARAH 是第一个实现这类问题的算法下界的分散方法。此外,GT-SARAH 算法还实现了非渐近线性加速,即每个节点的梯度计算总数比在单个节点处理所有数据的近似最优算法减少了1/n。我们还根据节点数 n、函数总数 n 和网络谱间隔(1 -)的相对大小,建立了 GT-SARAH 在其他情况下的收敛速度。在无限时间域上,我们建立了 GT-SARAH 到一阶驻点的几乎处处收敛和均方收敛。
Intention Propagation for Multi-agent Reinforcement Learning
地址:
http://arxiv.org/abs/2004.08883Chao Qu,Hui Li,Chang Liu,Junwu Xiong,James Zhang,Wei Chu,Yuan Qi,Le Song摘要:人工智能的一个特点就是模仿人类去理解和与他人互动。在本文中,我们提出了一个协作的多代理强化学习算法,通过代理之间的交互来学习一个 emph { joint }策略。为了对群作出联合决策,每个代理作出一个初始决策,并将其策略告诉其邻居。然后,每个代理根据接收到的消息适当修改自己的策略,并展开其计划。在这个意图传播过程中,我们证明了在神经元嵌入概率推理的框架下,意图传播收敛于联合策略的均值场近似。我们在几个大规模的挑战性任务上评估了我们的算法,并证明它优于以前的技术状态。
Decentralized Stochastic Gradient Tracking for Non-convex Empirical Risk Minimization
地址:
http://arxiv.org/abs/1909.02712摘要:针对节点对等网络中的非凸经验风险最小化问题,研究了一种分散随机梯度跟踪(DSGT)算法。为了保证精确收敛和处理分散化数据集之间的方差,每个节点使用一个小批量的样本执行一个随机梯度跟踪步骤,其中批量大小被设计成与局部数据集的大小成正比。我们从网络的代数连通性、小批量、梯度方差等方面,明确地计算了具有常数步长和递减步长的 DSGT 的收敛速度。此外,我们还证明了 DSGT 在一定条件下具有网络独立性,这意味着在一个常数因子以内,网络拓扑只影响收敛速度。因此,DSGT 在迭代次数上的收敛速度可以与集中随机梯度法(SGD)相媲美。然后,在与许多现有算法相同的假设下,可以实现线性加速,因为在有 n 个节点的 DSGT 中,每次迭代的完成速度通常比在单个节点上运行的集中式 SGD 快 n 倍。在 CIFAR-10上对神经网络和 Logit模型问题进行的数值实验最终证明了 DSGT 的优点。。
Extension of causal decomposition in the mutual complex dynamic process
地址:
http://arxiv.org/abs/2008.07135Yi Zhang,Qin Yang,Lifu Zhang,Branko Celler,Steven Su,Peng Xu,Dezhong Yao摘要:因果分解描述的是一种因果关系,它不是基于预测的概念,而是基于时间序列的相位依赖。它已经在随机和确定性系统中得到验证,现在期待它在复杂动态过程中的应用。在这里,我们提出了一个扩展的因果分解在互相复杂的动态过程: 因果关系的时间序列是继承的内在成分的分解在相似的时间尺度。此外,我们阐明了比较研究的主要方法使用的神经科学,并表明该方法的适用性,特别是在生理时间序列的脑-肌肉相互作用,这意味着潜在的因果关系分析在复杂的生物过程。
Dynamically induced cascading failures in power grids
地址:
http://arxiv.org/abs/1707.08018Benjamin Schäfer,Dirk Witthaut,Marc Timme,Vito Latora摘要:基础设施网络的可靠运作对我们的现代社会至关重要。级联故障是大多数大规模网络中断的原因。虽然级联故障通常具有动态瞬态特性,但是级联故障的建模目前主要集中在稳态序列的分析上。在本文中,我们集中在电力传输网络,并介绍了一个框架,既考虑到事件性质的级联和网络动态的要素。我们发现,电网流量中秒级的瞬变对集体行为的出现起着至关重要的作用。最后,我们提出了一种预测方法,以确定关键线路和部件提前或在运行中。总之,我们的工作强调了动态诱发的故障对不同欧洲国家电网同步动态的相关性,并提供了预测和模拟连锁故障的方法。
Nonlinear system synchronization to sum signals of multiple chaotic systems
地址:
http://arxiv.org/abs/2008.07507Robson Vieira,Weliton S. Martins,Sergio Barreiro,Rafael A. de Oliveira,Martine Chevrollier,Marcos Oriá摘要:混沌振子的耦合已经证明了同步是可能的,因此非线性可以通过类似振荡器的输入驱动到一个特定的状态。在这里,我们扩展了非线性状态控制的概念,展示了通过一个或多个可变信号,仅使用来自多个等效系统的部分信息,诱导它遵循一个 textit { linear }叠加的信号是可能的。此外,我们还发现,输入信号中的轨迹数目越多,系统轨迹对和输入的收敛性越好。Challenging Eukaryogenesis: The Story of the Eukaryotic Ancestor
地址:
http://arxiv.org/abs/2008.06608摘要:随着真核生物起源的问题越来越接近答案,真核生物的祖先与环境、分子、细菌、其他影响因素和共生体之间的相互作用变得越来越相关。各种各样的研究都指出,Lokiarchaeota 是真核生物的近亲。2020年初,Imachi 等人发表的一项研究,能够破译 Loki 的蛋白质组和基因组,并由于其发现报道了一个全新的真核生成模型,从而将真核生成的研究从侧重于内吞作用和快速获取 α-变形菌的模型转移到后来的线粒体上。Imachi 和他的同事们提出,洛基人的祖先由于其形状而与其他原核生物共生,并促进了共生体之间的分子转移以及允许这种转移所必需的膜操作,随着时间的推移,在获得原线粒体之前。本文将阐述内共生的历史以及古细菌和 α-变形菌细胞内吞作用的流行理论,并对 Imachi 等人发表之前的已知和未知情况进行整理。他们的新研究结果将进行讨论,并重新整合与这些新发现有关的已知和未知。对两种真核生成模型进行了比较,随着 Imachi 和同事模型的发展,讨论了进一步验证这种方法的可能研究领域,以及其他领域研究工具的潜在用途,以回答真核生物是如何产生的一直未知数。
Shifu2: A Network Representation Learning Based Model for Advisor-advisee Relationship Mining
地址:
http://arxiv.org/abs/2008.07097Jiaying Liu,Feng Xia,Lei Wang,Bo Xu,Xiangjie Kong,Hanghang Tong,Irwin King摘要:顾问与被顾问之间的关系代表了直接的知识传承,而这种关系在学术图书馆和搜索引擎中可能是不容易获得的。这项工作的目的是发现隐藏在科学合作网络背后的顾问和被顾问的关系。为此,我们提出了一种基于网络表示学习(NRL)的新模型,即以协作网络为输入,以确定的顾问-顾问关系为输出的协作网络模型 Shifu2。与现有的 NRL 模型相比,Shifu2不仅考虑了网络结构,还考虑了节点和边的语义信息。Shifu2将节点和边分别编码为低维向量,然后利用这两个向量来识别顾问-咨询者关系。实验结果表明,与现有的方法相比,该模型的稳定性和有效性得到了改善。另外,我们利用 Shifu2生成了一个大规模的学术谱系数据集。
删除的力量:
对 Twitter 趋势的临时性攻击
The Power of Deletions: Ephemeral Astroturfing Attacks on Twitter Trends
地址:
http://arxiv.org/abs/1910.07783Tuğrulcan Elmas,Rebekah Overdorf,Ahmed Furkan Özkalay,Karl Aberer摘要:我们发现并研究了一些短暂的人工草皮攻击,许多自动生成的推文都是通过一系列虚假账户发布的,然后立即删除,人为地将选定的关键词推送到推特趋势的顶端。我们在野外观察到这样的攻击,并确定它们不仅成功地将关键词推向流行趋势,而且非常普遍。我们发现超过19,000个独特的关键词被超过108,000个机器人推向趋势,其中55% 到2020年7月仍然存在于平台上使用互联网档案馆的 Twitter Stream Grab 超过四年。受这些攻击影响的趋势至少占了世界十大趋势的20% 。短暂的草根营销污染了趋势; 允许操纵用户的意见; 允许平台可以过滤的内容,例如针对弱势群体的非法广告、政治虚假信息和仇恨言论。我们的研究结果有助于理解用户在社交媒体上的操纵行为,并且更普遍地揭示了为逃避检测而出现的对抗性行为的类型。
Empirical validation of network learning with taxi GPS data from Wuhan, China
地址:
http://arxiv.org/abs/1911.03779Susan Jia Xu,Qian Xie,Joseph Y. J. Chow,Xintao Liu摘要:在以往的研究中,提出了一种统计廉价的方法来监测运输网络的性能,只需要使用少量的代理,而不需要预测人口流动。利用武汉市出租车 GPS 探测数据,验证了这种“多智能体反向优化”方法。利用一个可控的2062链路网络环境和不同的 GPS 数据处理算法,利用4小时内的实际数据模拟了一个在线监测环境。结果表明,多智能体反向优化方法仅使用一个 OD 对的样本,就可以学习网络参数,使预测的行程时间与观测的行程时间相关性达到0.23。通过从两个 OD 对增加到监测,相关性进一步提高到0.56。
围绕特朗普的故事的计算时间线重建:
故事动荡、叙事控制和集体时间顺序
Computational timeline reconstruction of the stories surrounding Trump: Story turbulence, narrative control, and collective chronopathy
地址:
http://arxiv.org/abs/2008.07301P. S. Dodds,J. R. Minot,M. V. Arnold,T. Alshaabi,J. L. Adams,A. J. Reagan,C. M. Danforth摘要:衡量围绕任何特定主题的故事的特定种类、时间顺序、多样性和周转率,对于发展一个完整的主题的历史影响评估是必不可少的。在这里,我们使用 Twitter 作为一个分布式的新闻和意见聚合来源,来识别和跟踪围绕美国第45任总统唐纳德 · 特朗普(Donald Trump)的主要日间报道的动态。我们使用一个由大约200亿个1克组成的数据集,首先将每天1克和2克的使用频率与一年前的使用频率进行比较,为2016年以后的特朗普故事创建日期和周期时间表。我们衡量的是特朗普的叙事控制力,即关于特朗普的报道或特朗普提出的报道的程度。然后我们量化故事动荡和集体时间顺序失调---- 人们对某个主题的故事似乎随着时间而变化的速度。我们的报告显示,2017年是特朗普最动荡的一年,在2020年新型冠状病毒肺炎流感大流行期间,这个故事的生成速度显著放缓。2017年9月,特朗普在新型冠状病毒肺炎流感大流行期间两个月的故事周转率与3天的周转率持平。我们的方法可以应用于任何被广泛讨论的现象,特别是在新闻、历史和传记的计算方面具有潜力。
Controlling the spread of COVID-19 on college campuses
地址:
http://arxiv.org/abs/2008.07293Molly Borowiak,Fayfay Ning,Justin Pei,Sarah Zhao,Hwai-Ray Tung,Rick Durrett摘要:这项研究是在2020年5月18日至7月10日杜克大学 DOMath 项目期间完成的。当时,杜克大学和全国各地的其他大学正在努力解决如何在秋季安全地欢迎学生回到校园的问题。正因为如此,我们的项目专注于使用数学模型来评估策略,以抑制病毒在校园的传播,特别是在宿舍和教室。对于宿舍,我们发现给学生提供单人间而不是双人间可以大大减少病毒的传播。对于教室,我们展示了如果班级规模超过一定界限,那么移动班级可以使基本传染数 R0 < 1,从而防止流行病的广泛传播。截止时间将取决于这种疾病在课堂上的传染性。
电力与流行病:
探索21新冠肺炎全球电力需求的变化
Power and the Pandemic: Exploring Global Changes in Electricity Demand During COVID-19
地址:
http://arxiv.org/abs/2008.06988Elizabeth Buechler,Siobhan Powell,Tao Sun,Chad Zanocco,Nicolas Astier,Jose Bolorinos,June Flora,Hilary Boudet,Ram Rajagopal摘要:了解限制暴露在新型冠状病毒肺炎中是如何改变电力需求的,不仅能让我们深入了解剧烈的限制是如何影响电力需求的,也能让我们了解 covid-19之后世界的未来用电情况。我们开发了一个统一的模型框架,以量化和比较世界上58个国家和地区从2020年1月至5月的用电量变化。我们发现,在2020年4月,考虑到天气、季节和时间的影响,与模拟需求相比,日电力需求下降了多达10% ,但变化很大。聚类分析显示,四个影响群体在用电量变化的时间和深度上捕捉到了系统性的差异,从2% 的轻微下降到26% 的极端下降。这些集团与地理位置并不一致,几乎每个大陆都至少有一个国家或区域的需求急剧下降,而另一个则没有。相反,我们发现这些变化与政府的限制和流动性有关。政府的限制对需求有非线性的影响,这种影响通常在限制最严格的水平上达到饱和,即使在限制放松的情况下也能维持。流动性更加关注电力需求的变化,工作场所和住宅的流动性与日常需求变化密切相关。用电量的急剧下降与工作日每小时的负荷模式有关,这种模式类似于前 ovid 周末的用电量。量化这些影响是了解大流行病等危机的影响以及相关社会对电力需求的反应的关键的第一步。
Implementing partisan symmetry: Problems and paradoxes
地址:
http://arxiv.org/abs/2008.06930Daryl DeFord,Natasha Dhamankar,Moon Duchin,Varun Gupta,Mackenzie McPike,Gabe Schoenbach,Ki Wan Sim摘要:我们认为政治科学文献中提出的党派对称措施可以实际应用,正如在 Katz-King-Rosenblatt 澄清和发展的那样。初等数学处理表明,从均匀游离摆动导出的对称度量具有令人惊讶的性质。为了配合总体分析,我们研究了犹他州、德克萨斯州和北卡罗来纳州最近的投票模式的党派对称度量,标记了每个案例中的问题。综合来看,这些观察结果应该会引起人们对使用十年一次的重新划分选区的方法——包括平均-中位数得分、党派偏差得分和更普遍的“党派对称标准”——的量化得分的重大关注。
Discontinuous transitions of social distancing
地址:
http://arxiv.org/abs/2008.06863摘要:第一波新型冠状病毒肺炎革命改变了全球的社会距离: 以国家经济为代价阻止流行病的严重封锁,之后又解除了一系列封锁。为了理解社会距离动态,必须将病毒展开的基本流行病学模型(如 SIR)与博弈论工具结合起来,如将个人或政府对疫情损害和经济成本的预测量化为社会距离的功能的效用函数。在这里,我们提出了一个模型,预测了一系列不连续的转变在社会远离后的大流行高潮。每个转变类似于一个相变,因此,可能是一个普遍现象。奥地利、以色列和德国的第一波数据分析证实了该模型的可靠性。此外,这项工作为分析大流行波提供了分析工具。
The rising of collective forgetting and cultural selectivity in inventors and physicists communities
地址:
http://arxiv.org/abs/2008.06592Cristian Candia,Brian Uzzi摘要:这篇论文还要多久才会被人遗忘?集体遗忘是文化片段所获得的注意力随着时间的推移而衰退的过程。最近的研究表明,这种衰退是由两种不同的过程造成的,一种是与交流记忆有关的---- 由人类交流维持的记忆; 另一种是文化记忆---- 由内容的物理记录维持的。然而,关于集体遗忘的动态变化是如何随着时间而变化的,我们知之甚少。旧的文化作品被遗忘的速度比新的文化作品要慢吗?在这里,我们研究的时间变化的集体记忆和注意力集中在两个知识社区: 发明者和物理学家。我们使用来自美国专利商标局(USPTO)和美国物理学会(APS)发表的物理学论文的数据来量化集体遗忘是如何随着时间发生变化的。这个模型使我们能够区分遗忘的两个分支。一个分支是短命的,直接从交流记忆走向遗忘。另一个是从交际到文化记忆再到遗忘的长寿过程。数据分析表明,随着信息的增长,两个群体的遗忘率都在增加。此外,这些知识群体似乎正在提高他们在文化记忆中储存有价值的文化片段的选择性。这些发现为遗忘作为一种废除假说提供了实证证据,并表明知识共同体可以有效地减缓集体遗忘的上升,提高其文化选择性。
Predicting Individual Treatment Effects of Large-scale Team Competitions in a Ride-sharing Economy
地址:
http://arxiv.org/abs/2008.07364Teng Ye,Wei Ai,Lingyu Zhang,Ning Luo,Lulu Zhang,Jieping Ye,Qiaozhu Mei摘要:全世界数以百万计的司机通过拼车经济享受到了经济利益和工作时间的灵活性,但同时他们也因缺乏身份认同感和职业成就感而痛苦。根据社会认同和竞赛理论,经济激励的团队竞赛已经成为提高司机生产力、工作满意度和保留率的有效手段,并提高拼车平台的收入超过成本。虽然这些比赛总体上是有效的,但是治疗效果背后的决定性因素,以及它们如何影响个别车手的结果,在很大程度上是神秘的。在这项研究中,我们分析收集的数据超过500大规模的团队比赛组织了一个领先的拼车平台,建立机器学习模型来预测个人治疗效果。通过对特征和预测因子的仔细研究,我们能够将样本外预测误差降低24% 以上。通过解释表现最好的模型,我们发现了许多新颖的和可行的见解,如何优化设计和执行的团队竞赛的乘坐共享平台。模拟分析表明,通过简单地改变一些竞赛设计方案,一个真正的竞赛的平均处理效果预计将增加高达26% 。我们的程序和研究结果对如何分析和优化大规模在线实验具有普遍意义。
Statistical Analytics and Regional Representation Learning for COVID-19 Pandemic Understanding
地址:
http://arxiv.org/abs/2008.07342Shayan Fazeli,Babak Moatamed,Majid Sarrafzadeh摘要:新型冠状病毒的快速传播已经严重影响了世界上几乎所有的国家。它不仅给卫生保健提供者造成了巨大的负担,而且还给经济和社会生活带来了严重影响。可靠数据的存在和深入的统计分析结果为研究人员和决策者提供了宝贵的信息,以便更清楚地了解这一大流行病及其增长模式。本文结合并处理了大量公开可用的数据集,以提供一个统一的信息源,用于表示地理区域与其大流行相关的行为。根据与之相关的高级概念,将这些特性分为不同的类别,以说明其影响。这项工作使用了几种相关性分析技术来观察特征、特征组和新型冠状病毒肺炎之间的价值和顺序关系。降维技术和投影方法被用来阐述这些代表性特征的个人和群体重要性。本文提出了一种特定的基于 rnn 的推理流水线,称为双窗 wlstm-cp,用于预测事件建模。它利用序列模式,并在使用最少量的历史数据时实现简洁的记录表示。我们统计分析的定量结果显示了许多预期的集体行为及其相关结果的关键模式。使用 doublewindowstm-cp 实例的预测建模在定量和定性评估方面表现出高效的性能,同时减少了对有关大流行的扩展和可靠的历史信息的需求。
从幂律到极值混合分布 | 网络科学论文速递18篇
分析网络的网络 | 网络科学论文速递22篇
新冠疫情期间新浪微博上的注意力动力学 | 网络科学论文速递17篇
基于环境噪声的网络重构 | 网络科学论文速递18篇
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
👇点击“阅读原文”,了解更多最新arxiv论文