COVID-19大流行的现象动力学:调整参数的综合分析
使用SIR模型的修订版对C0VID-19在意大利的扩散进行建模;
- 关于预测COVID-19流行过程的数据驱动模型的说明;
全国性措施对COVID-19大流行的影响研究:隔室模型和机器学习;
- 使用NLP分析伊朗COVID-19大流行期间波斯/波斯推文的内容;
- 巴西COVID-19动态流行病模型中复杂网络的社交互动层;
- COVID-19传播的流行病学模型:南非案例研究;
- 图上的特征函数:见微知著,从统计描述量到参数模型;
- 年轻人的优秀学业成绩与睡眠时间少和就寝时间晚有关;
- 基于图划分和图神经网络的层次图匹配的图相似度计算;
- Facebook用户数量偏差如何?比较Facebook用户的人口统计数据与人口普查数据以生成校正因子;
- 多重网络中特征向量非局部化的普遍性和SIS相变的性质;
- 优化了在地理位置分散的参与者的共同地点开会的旅行;
- 带外生输入(NARX)神经网络非线性自回归在宏观经济预测、国家目标设定和全球竞争力评估中的应用;
COVID-19大流行的现象
动力学:调整参数的综合分析
Phenomenological dynamics of COVID-19 pandemic: meta-analysis for adjustment parametershttp://arxiv.org/abs/2005.08686Sergio A. Hojman, Felipe A. Asenjo摘要:我们提出了一种现象学方法来处理由八个不同国家的政府卫生机构提供的COVID-19数据。我们没有使用SIR(或其他)模型的(精确或近似)解,而是尝试调整那些模型中包含的时间无关参数,而是引入了动力学参数,其时间相关性可以通过充分外推从现象学上获得。每日提供数据的选定子集。对于我们考虑的国家/地区,这种现象学方法非常有效,可以及时适当地调整受感染(和移走)的人数。使用SIR模型的修订版对
Covid19在意大利的扩散进行建模
Modelling the spread of Covid19 in Italy using a revised version of the SIR modelhttp://arxiv.org/abs/2005.08724Andrea Palladino, Vincenzo Nardelli, Luigi Giuseppe Atzeni, Nane Cantatore, Maddalena Cataldo, Fabrizio Croccolo, Nicolas Estrada, Antonio Tombolini摘要:在本文中,我们提出了一个模型来预测Covid-19流行病的蔓延并将其应用于意大利的特定病例。我们从一个简单的“易感,感染,恢复”(SIR)模型开始,并添加了这样的条件:在一定的时间后,基本再现数R0随时间呈指数衰减,这是世界数据凭经验表明的。使用该模型,我们能够在5%的置信区间内重现流行病的真实行为。此外,我们说明了与R0的不同间隔相关的可能的未来情景。自2020年3月以来一直使用该模型,预测2020年4月意大利流行高峰,约有10,000例被发现的活动病例。真正的流行高峰发生在2020年4月20日,有108,000例活跃病例。该结果表明该模型具有精确的预测能力。
Escaping an epidemic: Movement optimization via Minority Gamehttp://arxiv.org/abs/2005.08684Soumyajyoti Biswas, Amit Kr Mandal摘要:我们研究了在感染不断扩散的一个国家( D )州之间持续流行期间主体商的最佳移动策略。假设有一部分特工可以选择留在任何两个给定州,那么我们可以证明,该国的总感染人数可能会与长时间停止州际行动完全停止所达到的感染人数一样低特工遵循少数派博弈中的随机策略来制定行动决策。由于主体的随机选择(但在时间上是固定的),该系统实质上形成了同时玩的一组 D / 2 耦合少数博弈。我们进一步证明,在旅行过程中被感染的风险为零时,遵循随机策略的任何一个州在两个州之间移动一次,与没有(或不选择)这种移动方式的州相比,被感染的可能性较小。不考虑。关于预测COVID-19流行
过程的数据驱动模型的说明
Remarks on a data-driven model for predicting the course of COVID-19 epidemichttp://arxiv.org/abs/2005.08711摘要:Norden E. Huang,Fanggli Qiao和Ka Kit Tung提出了COVID-19流行病的数据驱动模型,其中相关功能取决于从可用数据的统计分析中获得的七个参数。这些参数不是独立的,而是通过一组称为“主要结果”的关系进行链接,这些关系通过对数据的统计分析进行了验证。问题中的参数及其之间的关系并不总是由作者明确指出。通过在此处给他们提供他们的(简单的)数学公式,可以明确地写下描述动态的所有相关功能。所有明确的公式均基于以下事实:受感染人数的对数是时间的二次函数。这里介绍的公式本身并不是近似值-但它们所涉及的参数当然是从数据中得出的统计量。这些公式可能对验证数据,模型本身,更新模型或查找相关量的近似值都有用。
全国性措施对COVID-19大流行
的影响研究:隔室模型和机器学习
Impact studies of nationwide measures COVID-19 anti-pandemic: compartmental model and machine learninghttp://arxiv.org/abs/2005.08395Mouhamadou A.M.T. Balde, Coura Balde, Babacar M. Ndiaye摘要:在本文中,我们研究了全球国家措施对COVID-19抗大流行的影响。我们推动两个过程来分析考虑措施的COVID-19数据,然后对塞内加尔进行预测。我们展示了确定性和两种机器学习技术之间的比较预测。
使用NLP分析伊朗COVID-19
大流行期间波斯/波斯推文的内容
Content analysis of Persian/Farsi Tweets during COVID-19 pandemic in Iran using NLPhttp://arxiv.org/abs/2005.08400Pedram Hosseini, Poorya Hosseini, David A. Broniatowski摘要:在COVID-19传播的第一波中,伊朗,中国,韩国和意大利受到了严重打击。Twitter是伊朗人在国内外广泛使用的在线平台之一,用于分享他们对广泛问题的看法,想法和感受。在这项研究中,我们使用波斯语/波斯语上超过530,000条关于COVID-19的原始推文,分析了在以伊朗为主要用户的用户中讨论的主题,以评估和跟踪对大流行的反应及其随着时间的演变。我们结合了对随机推文样本的手动注释和主题建模工具的组合,以对每个主题类别的内容和频率进行分类。我们确定了家庭隔离中的生活经验成为主要话题的前25个主题。我们还对较广泛的推文内容进行了分类,这些内容显示讽刺,紧随其后的新闻是伊朗用户中占主导地位的推文类型。虽然可以使用此框架和方法来跟踪公众对与COVID-19相关的持续发展的反应,但对该框架的概括可以成为衡量伊朗公众对正在进行的本地和国际政策措施或事件的反应的有用框架。
Epidemic parameters for COVID-19 in several regions of Indiahttp://arxiv.org/abs/2005.08499摘要:报告了2020年4月印度不同地理区域的可公开获得的病例和死亡时间序列的贝叶斯分析。发现最初明显的感染快速增长可能部分是由于诸如疾病监测的初始快速上升之类的混杂因素。简要讨论了如果忽略这种可能性而产生的谬论。4月10日之后的增长与时间无关但与区域相关的指数一致。由此,使用已知病例和死亡人数提取R0。在许多情况下,这两个估计被认为是一致的。报告了这些病死率。可以看出CFR和R0一起增加。讨论了该观察结果对公共卫生的影响,包括如果医疗设施要保持足够的话,则将目标间隔延长一倍。
Controlling epidemic diseases based only on social distancing levelhttp://arxiv.org/abs/2005.08052Samaherni M. Dias, Kurios I. P. de M. Queiroz, Allan de M. Martins摘要:世界卫生组织(WHO)评估认为,COVID-19在2020年3月11日开始大流行。控制COVID-19爆发的唯一方法是持续的物理距离。在这项工作中,提出了一种简单的控制法,以使COVID-19爆发期间的感染个体保持在所需数量以下。拟议的控制法仅通过调整社会距离水平来控制受感染者的价值。对所提出的控制律进行了稳定性分析,并考虑了参数的不确定性。开发了建议的控制器的每日更新版本。这是开发控制律的非常简单的方法,可以在电子表格中进行计算。最后,进行了数值模拟,以显示当拟议的控制法用于调整社会疏远程度时,流行病期间受感染个体数量的行为。
巴西COVID-19动态流行病
模型中复杂网络的社交互动层
Social Interaction Layers in Complex Networks for the Dynamical Epidemic Modeling of COVID-19 in Brazilhttp://arxiv.org/abs/2005.08125Leonardo F. S. Scabini, Lucas C. Ribas, Mariane B. Neiva, Altamir G. B. Junior, Alex J. F. Farfán, Odemir M. Bruno摘要:由于Sars-CoV-2病毒引起的大流行,我们目前处于不确定状态。流行病的传播涉及多个因素,例如每个城市/国家/地区的个人特征。流行病动态的真实形状是一个大型,复杂的系统,例如大多数社会系统。在这种情况下,由于复杂的网络具有处理结构和动力学特性的能力,因此是一个不错的选择。因此,本研究提出了一种使用多层复杂网络来建模和表征COVID-19流行病的新方法,其中节点代表人,边代表社交,层代表不同的社交活动。该模型对传统的SIR进行了改进,并通过分析可能的未来行动及其后果,用于研究巴西的流行病。该网络的特点是考虑到感染,死亡和住院时间的统计数据。为了模拟孤立,疏远社交或采取预防措施,我们移除了层次并/或降低了社交联系的强度。结果表明,即使采取各种乐观假设,巴西目前的隔离水平仍可能导致医疗体系崩溃和相当大的死亡人数(平均168,000)。如果所有活动恢复正常,疫情增长将比目前的模式急剧增加,对ICU病床的需求将超过该国能力的3.5倍。这肯定会导致灾难性的后果,因为即使考虑到所有病例均得到有效治疗,我们的估计平均死亡人数为240,000。孤立性的增加(直至锁定)显示出是将情况保持在医疗保健系统容量之下的最佳选择,除了确保更快地减少新病例的发生(相异月份),并且显著减少死亡人数(平均) 79,000)。
An epidemiological model for the spread of COVID-19: A South African case studyhttp://arxiv.org/abs/2005.08012摘要:为在南非传播COVID-19建立了一种流行病学模型。使用经典隔室SEIR模型的一种变体,称为SEIQRDP模型。由于南非仍处于全球COVID-19大流行的早期阶段,已确认的感染病例尚未达到峰值,因此首先将德国,意大利和韩国的数据作为参数对SEIQRDP模型进行参数化-这些国家的感染病例数远远超过了高峰。通过合理地预测COVID-19确诊病例的数量,死亡和康复病例的结局以及截止时间,可以实现良好的拟合。然后使用2020年3月23日至2020年5月8日的南非数据来获取SEIQRDP模型参数。发现该模型非常适合初始疾病进展,但是该模型的长期预测能力相当差。随后,将南非的SEIQRDP模型重新计算,并将基本复制数量限制为报告值。所得模型非常适合数据,并且长期预测似乎是合理的。南非SEIQRDP模型预测,确认感染者的数量将在2020年10月底达到峰值,死亡总数将在10,000至70,000之间,名义价值约为22,000。所有这些预测在很大程度上取决于现有的疾病控制措施以及对这些措施的遵守。这些预测进一步显示出对用于确定基本再现数量的参数特别敏感。未来的目标是将反馈控制方法与南非SEIQRDP模型一起使用,以确定南非政府提议的不同锁定水平的流行病学影响。
Toward ultrametric modeling of the epidemic spreadhttp://arxiv.org/abs/2005.08761摘要:提出了一种基于经典SIR模型的感染流行病学超测模型。介绍了基于相对于感染接触平均时间的层次聚类的一组个人的超测技术。写下了超测量SIR模型的一般方程,并给出了使用 p -adic参数化的特定实现。对 p -adic SIR模型进行了数值分析,并将其行为与经典SIR模型进行了比较。考虑了等级隔离的概念及其管理方案,以减少流行病的传播水平。
Characteristic Functions on Graphs: Birds of a Feather, from Statistical Descriptors to Parametric Modelshttp://arxiv.org/abs/2005.07959Benedek Rozemberczki, Rik Sarkar摘要:在本文中,我们提出了在图顶点上定义的特征函数的灵活概念,以描述多个尺度上顶点特征的分布。我们引入FEATHER,这是一种计算效率很高的算法,用于计算这些特征函数的特定变体,其中特征函数的概率权重被定义为随机游走的转移概率。我们认为,此过程提取的功能对于节点级机器学习任务很有用。我们讨论了这些节点表示的合并,从而生成了可以用作图分类算法功能的图的紧凑描述符。我们通过分析证明,FEATHER以相同的表示形式描述了同构图,并且表现出对数据损坏的鲁棒性。使用节点特征特征函数,我们定义了参数模型,其中,函数的评估点是监督分类器的参数。在现实世界中的大型数据集上的实验表明,我们提出的算法可以创建高质量的表示,有效地进行传递学习,对超参数变化具有鲁棒性,并且可以随输入大小线性地尺度。
Neural Stochastic Block Model & Scalable Community-Based Graph Learninghttp://arxiv.org/abs/2005.07855Zheng Chen, Xinli Yu, Yuan Ling, Xiaohua Hu摘要:本文提出了一种新颖的可扩展的基于社区的图学习神经框架。该框架通过社区检测和链路预测的任务来学习图拓扑,方法是使用我们建议的联合SBM损失函数进行优化,该函数是对经典随机块模型(SBM)的似然函数进行了非平凡的调整后得出的。与SBM相比,我们的框架灵活,自然地允许软标签和复杂节点属性的摘要。主要目标是对复杂图数据进行有效评估,因此我们的设计谨慎地旨在容纳大数据,并确保进行有效评估的单向通过。对于大型图,如何有效地利用其底层结构进行各种图学习任务仍然是一个悬而未决的问题。以前,这可能是繁重的工作。使用我们基于社区的框架,这变得不那么困难,并且允许任务模型基本上即插即用并执行联合培训。当前,我们研究两个特定的应用程序:图对齐和异常相关检测,并讨论如何利用我们的框架来解决这两个问题。进行了广泛的实验以证明我们方法的有效性。我们还对经典技术作了一些贡献,这些发现对性能和可伸缩性很有帮助。例如,1)GAT +,改进的GAT(图注意力网络)设计,比例余弦相似度,以及基于卷积/注意力和基于随机游走的神经图模型的统一实现。
Simulation Pipeline for Traffic Evacuation in Urban Areas and Emergency Traffic Management Policy Improvementshttp://arxiv.org/abs/2002.06198Yu Chen, S. Yusef Shafi, Yi-fan Chen摘要:交通疏散在挽救诸如飓风,山火,洪水,地震等毁灭性灾难中挽救生命方面发挥着至关重要的作用。能够针对这些罕见事件提前评估疏散计划的能力,包括识别交通流瓶颈,改善交通管理政策以及理解交通管理政策的稳健性对于应急管理至关重要。考虑到此类事件的稀有性和相应的实际数据的缺乏,交通模拟为这种情况提供了一种灵活而通用的方法,此外还允许与模拟疏散进行动态交互。在本文中,我们建立了一个交通仿真管道来探讨上述问题,涉及疏散的许多方面,包括地图创建,需求生成,车辆行为,瓶颈识别,交通管理策略改进和结果分析。我们将管道应用于加利福尼亚的两个案例研究。第一个是天堂,该天堂在2018年被一场大火烧毁,在疏散期间遭遇了灾难性的交通拥堵。第二个城市是米尔山谷,由于该城市地处狭窄的山谷中,因此有发生野火和潜在交通问题的高风险。
High academic performance is associated with shorter sleep and later bedtimes for young adultshttp://arxiv.org/abs/2005.07806Sofia Dokuka, Ivan Smirnov摘要:众所周知,睡眠时间短与学习成绩负相关。但是,大多数在同质样本(例如,来自一所大学的学生)中,或者在使用相对的学业成绩(例如平均成绩)时,都会发现此结果。因此,人们对人群中学业成绩和睡眠方式之间的关系还没有很好的了解。在本文中,我们使用一项在全国范围内代表一个年龄组(20-21岁)的俄罗斯小组研究(N = 4,400)的数据,检查了通过标准化测试测得的学业成绩与睡眠方式之间的关系。除了自我报告的睡眠模式外,该数据集还包含有关参与者长达10年的在线活动的信息,这使我们能够跟踪这种关系随时间的演变。我们发现,高学业表现与睡眠时间缩短,就寝时间增加以及夜间在线活动增多有关。在5年内,高学业成绩与夜间在线活动之间的关系稳定。我们的研究结果表明,学业成绩与睡眠方式之间的关系可能比以前认为的更为复杂,并且可能以牺牲个人幸福感为代价来实现高性能。
A Picture for the Words! Textual Visualization in Big Data Analyticshttp://arxiv.org/abs/2005.07849Cherilyn Conner, Jim Samuel, Andrey Kretinin, Yana Samuel, Lee Nadeau摘要:数据可视化已成为大数据分析的重要方面,并且在复杂性和多样性方面也不断增长。我们特别确定需要一个具有文本信息的数据可视化分析框架。数据可视化是一种表示数据的强大机制,但是需要更好地理解和分类特定图表示的用法,以验证文本数据上下文中的适当表示,并避免对基础文本数据的扭曲描绘。我们确定了突出的文本数据可视化方法并讨论了它们的特征。我们讨论了文本数据可视化中多种图类型的使用,包括数量,意义,趋势和上下文文本数据可视化的使用。我们创建了一个解释性分类框架,以独特的方式定位文本数据可视化,以便提供见解并协助进行适当的方法或图表示分类。
Measuring and Characterizing Hate Speech on News Websiteshttp://arxiv.org/abs/2005.07926Savvas Zannettou, Mai ElSherief, Elizabeth Belding, Shirin Nilizadeh, Gianluca Stringhini摘要:网络已经成为新闻获取的主要来源。同时,新闻讨论变得更加社交化:用户可以在新闻文章上发表评论或在Reddit等其他平台上讨论新闻文章。这些功能使用户之间能够进行讨论并进行讨论;但是,它们也充当了传播有毒言论和仇恨言论的媒介。研究界对哪种类型的内容会引起仇恨的言论以及社会网络对新闻评论活动的可能影响缺乏普遍的了解。在这项工作中,我们在19个月的时间内对412K新闻文章上发布的125M条评论进行了大规模定量分析。我们使用时间分析,基于用户的分析和语言分析来分析所收集文章的内容及其评论,以阐明哪些元素吸引了对新闻文章的仇恨评论。当文章张贴在4chan的政治不正确的委员会或六个选定的子索引上时,我们还将调查评论活动。我们发现,围绕现实世界的分裂事件,例如夏洛茨维尔的“团结起来”集会,以及政治事件(例如2016年第二和第三次美国总统辩论),仇恨评论活动在统计上显著增加。同样,我们发现与不吸引仇恨评论的文章相比,吸引了大量仇恨评论的文章具有不同的语言特征。此外,我们观察到在或六个子reddit上的新闻文章的发布与对新闻文章的(讨厌的)评论活动的增加相关。
On the stability of the Brazilian presidential regime: a statistical analysishttp://arxiv.org/abs/2005.07999Frederico Fetter, Daniel Gamermann, Carolina Brito摘要:巴西的总统制的特点是存在许多当选为众议院的政党,并联合立法联盟组成多数。自1985年重新民主化以来,巴西进行了8次直接总统选举,其中两次弹two了当选总统。在这项工作中,我们通过分析1991年至2019年在众议院举行的选票来描述总统制的稳定和破裂时期的特征。我们首先通过衡量政党和国会在选票上的凝聚力,量化国会议员之间的共识,并观察到在没有弹imp的立法期间,国会议员之间的两极分化更加强烈,这里称为稳定立法时期。使用聚类算法,我们能够将在稳定时期观察到的这些两极分化的群体与对政府和政府基础的对立联系起来。为了描述2016年发生的迪尔玛·罗塞夫(Dilma Roussef)弹imp事件的特征,我们分析了国会议员和政府之间的协议随着时间的推移如何演变,并使用聚类算法确定了属于总统多数联盟的所有政党,但她本人和另一党除外一是在弹before之前移交给反对派。我们的分析使我们能够通过弹imp找出稳定的总统任期与立法条款之间的某些差异。
Graph Partitioning and Graph Neural Network based Hierarchical Graph Matching for Graph Similarity Computationhttp://arxiv.org/abs/2005.08008Haoyan Xu, Ziheng Duan, Jie Feng, Runjian Chen, Yida Huang, Yueyang Wang摘要:图相似度计算旨在预测一对图之间的相似度分数,以便于下游应用,例如查找与查询化合物或Fewshot 3D动作识别, etc最相似的化合物。近来,已经提出了一些基于神经网络的图相似度计算模型,其基于图级交互或节点级比较。然而,当图中的节点数量增加时,不可避免地会带来表示能力降低或时间复杂度过高的问题。基于这种观察,我们提出了一种基于图划分和图神经网络的模型,称为PSimGNN,以有效解决此问题。具体地,将每个输入图划分为一组子图,以首先直接提取局部结构特征。接下来,使用可学习的嵌入函数将每个子图映射到一个嵌入向量中。然后,选择这些子图对中的一些对进行节点级比较,以用细粒度信息补充子图级嵌入。最后,将子图之间的粗粒度交互信息和不同子图中的节点之间的细粒度比较信息进行集成,以预测最终的相似度得分。使用近似图编辑距离(GED)作为图相似性度量,在不同图尺寸的图数据集上的实验结果表明PSimGNN在图相似性计算任务中优于最新方法。该代码将在本文发表时发布。
Exploring Low-degree Nodes First Accelerates Network Explorationhttp://arxiv.org/abs/2005.08050Stefania Costantini, Pasquale De Meo, Angelo Giorgianni, Valentina Migliorato, Alessandro Provetti, Federico Salvia摘要:我们考虑在类似Web的网络上传播信息,以及随机游走如何模拟它。在该领域中,一个经过充分研究的问题是部分覆盖时间,即,随机游走者访问网络的给定部分所需的预期步数的计算。我们注意到,实际上一些最快的解决方案实际上要求节点具有其邻居的度分布的完备知识,在许多实际情况下,例如出于隐私原因,这是无法获得的。因此,我们引入了一个考虑以下限制的Cover问题版本:部分涵盖预算时间。预算是对可以检查其程度的邻居数量的限制;我们根据文献调整了最佳随机游走策略,以在这种预算下运行。我们的解决方案称为最小度(MD),从本质上讲,它使随机游走者偏向于首先访问网络的外围区域。在六个真实数据集上进行的广泛基准测试证明了-也许是违反直觉的策略-MD策略实际上具有很高的竞争力。最先进的封面算法。
Adaptive Influence Maximization: If Influential Node Unwilling to Be the Seedhttp://arxiv.org/abs/2005.08060摘要:影响最大化问题试图找到一小部分节点,使期望的影响散布到最大,这已经在前面进行了深入研究。他们都假定成功选择了我们选择的种子集中的每个用户,然后分散了影响。但是,在实际情况下,并非种子集中的所有用户都愿意成为影响者。基于此,我们认为每个用户都具有将其激活为种子的概率,并且可以尝试多次激活她。在本文中,我们研究了多重激活的自适应影响最大化(Adaptive-IMMA)问题,其中我们在每个步骤中选择一个节点,观察她是否接受为种子,如果是,则等待观察影响扩散过程。如果否,我们可以尝试以更高的成本再次激活她,或者选择其他节点作为种子。我们用数学方法对多个激活进行建模,并在整数晶格的域上对其进行定义。我们提出了一个新的概念,自适应DR次模量,并表明我们的Adaptive-IMMA是在背包约束下最大化自适应单调和DR次模函数的问题。已有的研究从未涉及自适应DR次模最大化问题。因此,我们总结了它的性质,并对它的逼近性进行了全面的研究,这是现有关于自适应亚模量分析的非平凡概括。此外,为了克服估计影响扩散的困难,我们将自适应贪婪策略与采样技术相结合,而不会丢失近似率,但降低了时间复杂度。最后,我们在几个真实的数据集上进行实验,以评估所提出算法的有效性和效率。
Facebook用户数量偏差如何?
比较Facebook用户的人口统计数
据与人口普查数据以生成校正因子
How Biased is the Population of Facebook Users? Comparing the Demographics of Facebook Users with Census Data to Generate Correction Factorshttp://arxiv.org/abs/2005.08065Filipe N. Ribeiro, Fabrício Benevenuto, Emilio Zagheni摘要:全世界的人口普查是指导政府投资和公共政策的关键数据来源。但是,这些资源的获取非常昂贵,并且收集起来相对很少。在过去的十年中,人们越来越关注使用社交媒体中的数据来补充传统数据源。但是,社交媒体用户并不代表一般人群。因此,基于社交媒体数据的分析需要统计调整,例如后分层,以消除偏见并做出可靠的统计声明。仅当我们掌握使用社交媒体的人口统计信息频率时,才可以进行这些调整。与官方统计数据相比,这些数据使研究人员能够生成适当的统计校正因子。在本文中,我们利用Facebook广告平台来编制相当于Facebook用户总体普查的数据。我们的汇编包括针对美国不同地理级别的七个人口统计属性(例如性别和年龄)的人口分布。通过将Facebook数量与美国人口普查和盖洛普提供的官方报告进行比较,我们发现相关性非常高,尤其是在政治倾向和种族方面。我们还确定了一些实例,其中官方统计数据可能低估了移民人数。我们使用收集到的信息来计算所有计算属性的偏差校正因子,以评估不同人口群体在Facebook上或多或少地代表的程度。我们提供了第一个全面的分析,用于评估Facebook用户在多个方面的偏见。该信息可用于在官方统计数据发布之间的及时且以良好的地理粒度生成偏差调整后的人口估计值和人口统计数据。
多重网络中特征向量非局部化
的普遍性和SIS相变的性质
Universality of eigenvector delocalization and the nature of the SIS phase transition in multiplex networkshttp://arxiv.org/abs/2005.08074Guilherme Ferraz de Arruda, J. A. Méndez-Bermúdez, Francisco A. Rodrigues, Yamir Moreno摘要:多重网络的通用谱特性使我们能够评估SIS流行病传播模型中无病阶段和地方病阶段之间过渡的性质。在多路网络中,取决于耦合参数 p ,邻接矩阵前导特征向量的逆参与比( IPR )可以处于两种不同的结构形式:(i)局部层化和(ii)本地化。在这里,我们将这两种状态之间的结构转变点 p ^ 形式化,表明关于层大小 n 和层配置都具有通用属性。即,我们显示了 IPR sim n ^ - delta ,其中 delta 约为1 ,并且揭示了 p ^ 与图层平均度差之间的近似线性关系。此外,我们证明了这种多重结构转变与SIS相变的本质具有内在联系,使我们能够理解和量化这一现象。由于这些结果与主导特征向量的通用特性有关,因此我们希望我们的发现可能与复杂网络中的其他动力学过程有关。
Neutral Bots Reveal Political Bias on Social Mediahttp://arxiv.org/abs/2005.08141Wen Chen, Diogo Pacheco, Kai-Cheng Yang, Filippo Menczer摘要:试图遏制滥用和错误信息的社交媒体平台已被指控存在政治偏见。我们在Twitter上部署了中立的社交机器人,以探究用户操作,平台机制以及不真实行为者之间的交互作用中可能出现的偏见。我们发现有偏见影响美国Twitter用户可能会接触到的新闻和信息的偏见,具体取决于他们自己的政治立场。有党派的账户,尤其是保守派账户,往往会吸引更多的追随者,遵循更多的自动化账户,暴露于更多低信誉的内容中,并发现自己在回声室中。自由主义者的账目暴露于适度的内容,使他们的经验转向政治中心,而保守派的账目则倾向于向右倾斜。在保守帐户的新闻提要排名算法中,我们发现自由主义偏见的证据微弱。这些发现有助于公众讨论社交媒体如何影响政治信息的曝光。
Deep Learning for Community Detection: Progress, Challenges and Opportunitieshttp://arxiv.org/abs/2005.08225Fanzhen Liu, Shan Xue, Jia Wu, Chuan Zhou, Wenbin Hu, Cecile Paris, Surya Nepal, Jian Yang, Philip S. Yu摘要:由于社区代表着相似的观点,相似的功能,相似的目的等,因此社区检测在科学查询和数据分析中都是重要且极其有用的工具。但是,随着深度学习技术显示出以令人印象深刻的性能处理高维图数据的能力日益增强,诸如谱聚类和统计推断之类的经典社区检测方法正在逐渐被淘汰。因此,对通过深度学习进行社区发现的当前进展进行调查是及时的。在该领域分为三个广泛的研究流-深度神经网络,深度图嵌入和图神经网络,本文总结了每个流中各种框架,模型和算法的贡献以及当前尚未解决的挑战和未来的研究机会有待探索。
Optimized Travel to Meetings on a Common Location of Geographical Distributed Participantshttp://arxiv.org/abs/2005.08633Peter Hillmann, Bastian Kühnel, Tobias Uhlig, Gabi Dreo Rodosek, Oliver Rose摘要:国际组织的成员通常在同一地点亲自见面进行讨论。由于成员不同的出差工作,会议的地点和时间经常存在分歧。他们通常乘飞机旅行,其旅行费用取决于航班连接。本文提出了一种计算最佳位置和时间,分布式伙伴应在何时何地开会的方法。提出的系统考虑了每个成员的要求和规格。它尊重事件和非夜间航班的最早开始时间。针对多个目标评估了优化结果。我们专注于最小化成本和旅行时间。我们的搜索算法可为潜在事件的所有成员识别出单独的旅行数据。输出为全球最佳约会提供建议,并为合作伙伴提供更多信息。我们的系统为所有成员节省了开支和时间,并允许进行调整和补偿。
带外生输入(NARX)
神经网络非线性自回归在
宏观经济预测、国家目标设定
和全球竞争力评估中的应用
Application of Nonlinear Autoregressive with Exogenous Input (NARX) neural network in macroeconomic forecasting, national goal setting and global competitiveness assessmenthttp://arxiv.org/abs/2005.08735摘要:本文通过文献综述选择NARX神经网络作为方法,并在涉及宏观经济预测,国家目标设定和全球竞争力评估的应用场景下构建特定的NARX神经网络。通过对中国,美国和欧元区的案例研究,本研究探索了那些有限的和部分的外来投入或丰富的和全面的外来投入,一小部分最相关的外来投入或一大堆涵盖宏观经济所有主要方面的外来投入,整个区域相关的外部输入或整个区域和细分区域相关的外部输入都特别影响NARX神经网络对特定宏观经济指标或指标的预测效果。通过对俄罗斯的案例研究,本文探索了有限和最相关的外部输入集或丰富而全面的外部输入集如何特别影响那些特定的NARX神经网络对国家目标设定的预测性能。最后,对NARX神经网络在预测各种经济体全球竞争力指数(GCI)中的应用进行了比较研究,以探索基于某些经济体的GCI相关数据训练的特定NARX神经网络是否可以对其他经济体的GCI做出足够准确的预测,以及基于某种类型经济体的数据训练的特定NARX神经网络是否可以对相同类型经济体的GCI提供比不同类型经济体更准确的预测。基于以上所有成功的应用,本文提供了有关应用经过充分训练的NARX神经网络的政策建议,这些网络被评估为有资格在各种适当的任务中协助甚至替代人脑的演绎和归纳能力。
Random walks in time-varying networks with memoryhttp://arxiv.org/abs/2005.08809Bing Wang, Hongjuan Zeng, Yuexing Han摘要:网络上的随机游走过程在理解节点的重要性及其相似性方面起着根本性的作用,已广泛应用于PageRank,信息检索和社区检测等领域。事实证明,个人的记忆对于影响网络的发展非常重要。和动态过程正在网络上展开。在此手稿中,我们通过考虑个人记忆来研究扩展活动驱动的网络模型上的随机游走过程。当随机游走过程的时间尺度与网络演化可比时,我们分析了个人的记忆如何影响网络上的随机游走过程。在长期演化的约束下,我们得出了稳态Wa的分布和随机行走过程的平均首次通过时间(MFPT)的解析解。我们发现,与无记忆活动驱动模型相比,个人记忆增加了度数分布的波动,从而降低了为节点收集步行者的能力,特别是在活动较大的情况下,并且延迟了平均首次通过时间。真实网络上的结果也支持人工网络的理论分析。声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!