时间序列背后的统计力学 | 网络科学论文速递17篇

ComplexLY 集智俱乐部 2021-02-09

核心速递

时间序列背后的统计力学
成对链路预测;
民主党对自由回应调查中的民意总结;
团队存储库采用动态：GitHub提交日志分析;
用于表征重尾网络的度量;
移动电话数据有可能为发展中国家的基础设施规划提供信息;
基于互惠最近邻的层次聚类;
病毒式营销的积极意见影响度量证据;
有限群体SIR疾病暴发规模的分布;
利用志愿者地理信息估算交通中断模式;
波动群体中石头-剪子-布游戏的固定特性;
非平稳平均场博弈中的普遍行为;
多层网络中尺度结构生成模型构建框架;
预测在线社会网络的参与：挑战和机遇;
流动性恢复了在自愿囚徒困境博弈中支持合作的机制;
优先连接树中的异步多数动力学;
探索在线学术论坛的课程排名背景;

时间序列背后的统计力学

原文标题：

Statistical mechanics of time series

地址：

http://arxiv.org/abs/1907.04925

作者：

Riccardo Marcaccioli, Giacomo Livan

摘要： 通过可观察量的同时和时间间隔测量来研究无数的自然和社会多变量系统，这些测量值驱动它们的动态，即通过时间序列集。通常，这通过假设检验来完成：经验时间序列的统计特性针对在合适的零假设下预期的那些进行测试。在复杂的交互系统中，这是一项非常具有挑战性的任务，由于缺乏平稳性和遍历性，统计稳定性通常较差。在这里，我们描述了一个无监督的数据驱动框架，以便在这种情况下执行假设检验。这包括统计力学理论 - 源自第一原理 - 用于时间序列的集合，旨在平均保留在经验时间序列集上观察到的一些统计特性。我们在纽约证券交易所的一系列股票市场回报中展示其可能的应用。

成对链路预测

原文标题：

Pairwise Link Prediction

地址：

http://arxiv.org/abs/1907.04503

作者：

Huda Nassar, Austin R. Benson, David F. Gleich

摘要： 链路预测是跨学科内容的网络科学中的常见问题。目标是预测新链接的出现或查找网络中缺少的链接。用于链路预测的典型方法使用网络的拓扑来预测一对节点之间最可能的潜在或丢失的连接。然而，网络演化通常由涉及多个节点对的高阶结构调解;例如，三个节点（也称为三角形）上的小集团是社会网络结构的关键，但标准链路预测框架并不直接预测这些结构。为了解决这个差距，我们提出了一种新的链路预测任务，称为“成对链路预测”，它直接针对新三角形的预测，其中一个任务是找出哪些节点最有可能形成具有给定边的三角形。我们为成对链路预测问题开发了两种基于PageRank的方法，并对现有的链路预测方法进行了自然扩展。我们在各种网络上的实验表明，基于扩散的方法对所使用的图类型不太敏感，并且在结果中更加一致。我们还展示了如何使用成对链路预测框架在标准链路预测评估的上下文中获得更好的预测。

自由回应调查中的民意总结

原文标题：

Democratic summary of public opinions in free-response surveys

地址：

http://arxiv.org/abs/1907.04359

作者：

Tatsuro Kawamoto, Takaaki Aoki

摘要：社会调查被广泛用作获取公众意见的方法。有时通过以自由响应的方式提出问题而不是多项选择的方式来收集意见更为理想。尽管它们具有优势，但在实践中很少使用自由回答这种方式，因为它们通常需要手动分析。因此，自由格式文本的分类在大规模调查中可能是一项艰巨的任务，并且可能受到分析师解释的影响。在本研究中，我们提出了一个基于网络的调查框架，其中回应按统计原则自动分类。这可以实现，因为除了文本之外，每个答复者还评估了答复之间的相似之处。我们通过对2016年美国总统大选的民意调查和特定大学毕业生的调查来证明我们方法的有效性。所提出的方法有助于分析师解释大规模调查中响应的基本语义。

团队存储库使用得
动态：
GitHub提交日志分析

原文标题：

Dynamics of Team Library Adoptions: An Exploration of GitHub Commit Logs

地址：

http://arxiv.org/abs/1907.04527

作者：

Pamela Bilo Thomas, Rachel Krohn, Tim Weninger

摘要：当一群人努力了解新信息时，各种想法在争夺注意力。随着团队一起学习，陡峭的学习曲线被克服。为了理解这些团队动态如何在软件开发中发挥作用，我们探索了Git日志，它提供了软件开发的完整变更历史。在这些存储库中，我们观察代码添加，代表想法的成功实现。代码删除，代表失败或被取代的想法。通过检查这些提交类型之间的模式，我们可以开始了解团队如何采用新信息。我们专门研究在项目采用软件库之后发生的事情，即在项目中第一次使用库时。我们发现，各种因素，包括团队规模，参考资料存储库流行度以及Stack Overflow上的流行程度，都与团队学习和成功采用新软件库的速度有关。

用于表征重尾网络的度量方法

原文标题：

A measure for characterizing heavy-tailed networks

地址：

http://arxiv.org/abs/1907.04808

作者：

Scott A. Hill

摘要： 通常的，我们通过网络度分布与幂律的相似性来描述重尾网络。然而，现实生活中的许多重尾网络没有幂律度分布，并且在许多应用中，只要网络拥有集线器，网络的无标度性质就无关紧要。在这里，我们提出了Cooke-Nieboer指数（CNI），这是对网络度分布的重尾性的非渐近度量，它不假定幂律形式。CNI易于计算，并且清楚地区分具有幂律，指数和对称度分布的网络。

移动电话数据有可能为发展中
国家的基础设施规划提供信息

原文标题：

Mobile phone data’s potential for informing infrastructure planning in developing countries

地址：

http://arxiv.org/abs/1907.04812

作者：

Hadrien Salat, Zbigniew Smoreda, Markus Schläpfer

摘要： 发展中国家并不总是提供高质量的人口普查数据。相反，移动电话数据正成为评估人口密度，活动和社会特征的代名词。它们为基础设施规划提供了额外的优势，例如实时更新，包括移动信息和记录临时访客的活动。我们结合塞内加尔的各种数据集来评估移动电话数据在发展中国家替代基础设施规划的人口普查数据不足的潜力。作为一个应用案例，我们测试它们准确预测国内电力消耗的能力。我们表明，与普遍看法相反，平均手机活动与人口密度没有很好的相关性。但是，它可以提供比基本人口普查数据更好的电力消耗估算。更重要的是，我们成功地使用曲线和网络聚类技术来提高预测的准确性，恢复了移动电话的人口估计潜力，并减少信息数据的收集，以便规划到更小的样本。

基于互惠的最近邻层次聚类

原文标题：

Hierarchical Clustering Supported by Reciprocal Nearest Neighbors

地址：

http://arxiv.org/abs/1907.04915

作者：

Wen-Bo Xie, Yan-Li Lee, Cong Wang, Duan-Bing Chen, Tao Zhou

摘要：聚类是一种基本的分析工具，旨在根据数据点的相似性或距离将数据点分类。它已成功应用于包括生物学，物理学，经济学，化学，天文学，心理学等所有自然科学和社会科学中。在众多现有算法中，分层聚类算法具有特别的优势，因为它们可以在不具有任何预定数量的聚类的情况下在不同分辨率下提供结果并且展开所得聚类的组织。同时，它们具有各种缺点，因此耗时或不准确。我们基于一个简单的假设提出了一种新颖的层次聚类方法，即两个相互最近的数据点应该分组在一个聚类中。对多个域中的数据集进行的广泛测试表明，我们的方法比最先进的基准测试更快，更准确。我们进一步扩展了我们的方法来处理实际网络中的社区检测问题，与著名的Girvan-Newman算法相比，实现了非常好的结果。

可证的病毒式营销市场
正面观点影响力的衡量

原文标题：

Evidential positive opinion influence measures for viral marketing

地址：

http://arxiv.org/abs/1907.05028

作者：

Siwar Jendoubi (LARODEC), Arnaud Martin (DRUID)

摘要：病毒式营销是一种相对较新的营销形式，利用社会网络来推广品牌，产品等。其背后的想法是在网络上找到一组可以触发大规模传播和使用的影响者。在本文中，我们将介绍一种基于证据观点的病毒式营销影响最大化模型。此外，我们的方法针对现实世界中的病毒式营销解决了三种基于意见的场景。第一种情况涉及对产品持积极看法的影响者。第二种情况涉及对产品持积极看法并对也持积极看法的用户产生影响的影响者。第三种情况涉及影响对产品持积极看法的用户，并对其他用户对该产品的负面看法产生影响。接下来，我们提出了六种影响因素，每种情景都有两种。我们还使用影响最大化模型，即针对每个场景检测到的影响因子集。最后，我们通过对生成的数据集和从Twitter收集的真实世界数据集进行的一些实验，展示了所提出的模型与每种影响度量的表现。

有限群体SIR疾病暴发规模的分布

原文标题：

Distribution of outbreak sizes for SIR disease in finite populations

地址：

http://arxiv.org/abs/1907.05138

作者：

Joel C Miller

摘要：我们考虑通过有限群体传播易感染-感染-恢复模型的（SIR）疾病，并得出最终大小分布的表达式。我们的推导允许任意分配由受感染个体引起的传输次数。我们展示了如何通过在多个小群体中观察来使用该计算来推断传染病的参数。该推论存在一些可识别性困难，并且需要许多观察来区分对应于相同复制能力的参数组合。

利用志愿者地理信息
估算交通系统中断规律

原文标题：

Estimating Traffic Disruption Patterns with Volunteered Geographic Information

地址：

http://arxiv.org/abs/1907.05162

作者：

Chico Q. Camargo, Jonathan Bright, Graham McNeill, Sridhar Raman, Scott A. Hale

摘要：准确理解和预测交通问题是决策者关注的当代问题。道路网络越来越拥挤，但交通数据通常很难获得，这使得制定明智的政策变得更加困难。本文探讨了自愿地理信息站点OpenStreetMap（OSM）中静态特征可以估计交通中断的程度。我们使用OSM功能作为英国牛津郡112个地区道路网中6,500个点的交通中断和交通量的线性回归的预测因子。我们表明，只有静态特征可以解释一半以上的交通量和中断变化，并使用交叉验证和递归特征消除来评估不同土地利用类别的预测能力和重要性。最后，我们表明，使用OSM的粒度重要点数据可以比运输和土地使用研究中通常使用的聚合类别更好地进行预测。

波动群体中石头-
剪子-布游戏的固定特性

原文标题：

Fixation properties of rock-paper-scissors games in fluctuating populations

地址：

http://arxiv.org/abs/1907.05184

作者：

Robert West, Mauro Mobilia

摘要： 石头-剪子-布游戏隐喻模拟生态学和微生物学中的循环优势。在静态环境中，这些模型的特征在于在大型和小型混合群体中遵循两种不同“规律”的固定概率。在这里，我们研究了这三种物种模型的演变，这些模型受到随机转换的承载能力的影响，模拟了资源稀缺和丰富状态之间的无休止变化。我们主要关注零和石头-剪子-布游戏，相当于循环Lotka-Volterra模型，我们研究了人口统计和环境噪声的 it耦合如何影响固定属性。更具体地说，我们研究哪些物种在波动大小的群体中最有可能占优势，以及结果如何取决于环境变化。我们通过平衡选择的效果，表明人口噪声加上环境随机性“平衡了循环竞争的领域”。特别是，我们表明快速切换有效地降低了选择强度与承载能力的方差成比例。我们确定了出现新固定情景的条件，其中最可能的物种随着转换率和承载能力的变化而变化。随机切换对平均固定时间的影响有限，该平均固定时间与平均种群大小呈线性关系。因此，环境随机性使得循环竞争更加平等，但不会延长物种共存。我们还展示了如何通过重新调整选择强度来从零和模型中获得接近零和的石头-剪子-布游戏的固定概率。

非平稳平均场博弈中的普遍行为

原文标题：

Universal behavior in non stationary Mean Field Games

地址：

http://arxiv.org/abs/1907.05374

作者：

Thibault Bonnemain, Thierry Gobron, Denis Ullmo

摘要： 平均场博弈提供了一个强大的框架来分析交互中大量受控对象的动态。虽然这些模型比他们在某些限制中描述的底层差异博弈简单得多，但他们的行为仍然远未被完全理解。当系统受限时，引入了“遍历状态”的概念，其表征了长时间优化时间的大部分动态。在这里，我们考虑一类没有这种遍历状态的模型，并显示存在类似角色的尺度解决方案。它的普遍性和尺度行为可以从映射到静电问题推断出来。

多层网络中尺度
结构生成模型构建框架

原文标题：

A Framework for the Construction of Generative Models for Mesoscale Structure in Multilayer Networks

地址：

http://arxiv.org/abs/1608.06196

作者：

Marya Bazzi, Lucas G. S. Jeub, Alex Arenas, Sam D. Howison, Mason A. Porter

摘要：多层网络允许人们表示多种和耦合的连接模式 - 例如，时间依赖性，多个子系统或两者 - 在许多应用中出现并且难以或难以并入标准网络表示中。在多层网络的研究中，重要的是研究中尺度（即中等规模）结构，例如称为群落的密集节点集，以发现在微观尺度或宏观尺度上不明显的网络特征。在本文中，我们介绍了多层网络中尺度结构的生成模型。我们的模型非常通用，能够产生经验多层网络的许多特征，并且它明确地在层之间结合了用户指定的依赖结构。我们的结果提供了一套标准化的零模型，以及一组相关的原理，用于研究多层网络中的中尺度结构。我们讨论了生成模型的参数和属性，并举例说明了它与多层网络中社区检测方法和算法的基准模型的使用。

预测在线社会
网络的参与：
挑战和机遇

原文标题：

Predicting engagement in online social networks: Challenges and opportunities

地址：

http://arxiv.org/abs/1907.05442

作者：

Farig Sadeque, Steven Bethard

摘要： 自社交媒体引入以来，用户参与或参与几乎没有受到研究关注。在这篇调查文章中，我们建立了参与社交媒体的概念以及研究人员在探索这一现象时可能面临的主要挑战。我们调查了一些在该领域已经完成的研究文章，并试图提取，分析和总结研究人员所执行的技术。我们根据我们的任务定义对这些作品进行了分类，并探索了用于任何参与预测的机器学习模型。我们还探索了大量已证明有用的功能，并将其分类为更好的理解和易于重新实现的类别。我们发现技术的成功主要取决于已经研究过的网络的类型，并且没有通用的机器学习算法或功能集在所有类型的社交媒体中都能很好地工作。在实施像神经网络这样的最先进的机器学习技术方面缺乏尝试，并且还没有探索转移学习和领域适应的可能性。

流动性恢复了在自愿囚徒
困境博弈中支持合作的机制

原文标题：

Mobility restores the mechanism which supports cooperation in the voluntary prisoner’s dilemma game

地址：

http://arxiv.org/abs/1907.05482

作者：

Marcos Cardinot, Colm O’Riordan, Josephine Griffith, Attila Szolnoki

摘要：人们普遍认为，在个人和集体利益发生冲突的情况下，选择性参与的可用性是维持合作的关键机制。令人惊讶的是，这种效应对微观动态的使用很敏感，并且当主体人在他们的策略更新期间做出完全理性的决定时，很容易被打破。在著名的囚徒困境博弈的框架中，如果我们不考虑完全占用的交互图背后严格和高频的人为条件，并且让单体随着时间进展自己衍生策略和在图中的位置。这种差异是可以自动修复的。在这种条件下，主体可以移动的稀释图提供了一种自然的和替代的方式来处理由于应用特定的，有时是笨拙的微观规则而产生的伪像。

优先连接树中的异步多数动力学

原文标题：

Asynchronous Majority Dynamics in Preferential Attachment Trees

地址：

http://arxiv.org/abs/1907.05823

作者：

Maryam Bahrani, Nicole Immorlica, Divyarthi Mohan, S. Matthew Weinberg

摘要：我们研究了单体做出二元决策（标记不正确或正确）的网络中的信息聚合。单体最初形成关于更好决策的独立决是正确的概率为。我们考虑的动态是异步的（每一轮，一个主体更新他们宣布的决定）和非贝叶斯（主体只是复制他们的邻居之间的多数公告，打破他们的私人信号打破）。我们的主要结果证明，当网络是根据优先附着模型形成的树时，概率很高，过程稳定在正确的大多数。我们将结果扩展到其他树结构，针对任何M有M-ary树都成立。

探索在线学术论坛
的课程排名的背景

原文标题：

Exploring the context of course rankings on online academic forums

地址：

http://arxiv.org/abs/1907.05846

作者：

Taha Hassan, Bob Edmison, Larry Cox II, Matthew Louvet, Daron Williams

摘要： 大学生经常使用在线课程排名论坛提供的工具来分享和讨论他们对各种课程的教学质量和内容的满意度。学生对课程中使用的教学法效果的看法反映了教授，教学设计师和大学管理者的众多决定。这种复杂性推动了大量关于课程排名的效用，可靠性和行为相关性的研究。然而，对于这些论坛上（潜在的）隐性学生偏见在机构层面取得理想的课程成果的调查很少。为此，我们根据两个流行学术评级论坛的数据，检查课程结果（学生报告的GPA）与初级课程教师的整体排名之间的关系，以及课程结果的性质评级差异。我们在弗吉尼亚理工大学及其25个SCHEV认可的同行机构中教授的超过一万个课程的排名数据的实验表明，在学生注册的教授评级中，对于课程结果存在明显的复杂偏见。