查看原文
其他

图上的机器学习:模型和综合分类法 | 网络科学论文速递14篇

The following article is from 网络科学研究速递 Author ComplexLY


本文由机器翻译,仅供参考,感兴趣请查阅论文原文

核心速递


  • 图的机器学习:模型和综合分类法;
  • Covid-19增长的长程相关性;
  • 预测COVID-19对S&P500的影响;
  • 战略性时空疫苗分配可以将传染病导致的死亡人数减少一半;
  • 基于规范的消息对阅读和理解COVID-19大流行反应政府规则的影响;
  • 暴露:密闭空间的乘员暴露模型,以在大流行期间改进人群模型;
  • 在社交媒体上发现东亚偏见;
  • 在剪刀石头布的演化博弈中,死亡率使共存变得脆弱;
  • 网络中非回溯中心性的局部化及其物理后果;
  • 分年龄人口总体空间分布的分形格局;
  • 足球比赛中的控球动力学:从数据分析到建模;
  • 社会影响力的多胜者选举控制;
  • 社会网络上公平影响力最大化的对抗图嵌入;
  • 从数据中提取几何图,以利用图卷积网络帮助分类任务;




图的机器学习:

模型和综合分类法


原文标题:
Machine Learning on Graphs: A Model and Comprehensive Taxonomy
地址:
http://arxiv.org/abs/2005.03675
作者:
Ines Chami, Sami Abu-El-Haija, Bryan Perozzi, Christopher Ré, Kevin Murphy

摘要:最近对于学习图结构化数据表示法的兴趣激增。基于标记数据的可用性,图表示学习方法通常分为三大类。第一种是网络嵌入(例如浅图嵌入或图自动编码器),着重于学习关系结构的无监督表示。第二种是图正则化神经网络,它利用图来增加神经网络的损失,并具有用于半监督学习的正则化目标。第三类是图神经网络,旨在学习具有任意结构的离散拓扑上的可微函数。但是,尽管这些领域很受欢迎,但在统一这三种范式方面却很少有令人惊奇的工作。在这里,我们旨在弥合图神经网络、网络嵌入和图正则化模型之间的差距。我们提出了一种用于图结构数据的表示学习方法的综合分类法,旨在统一几个不同的工作主体。具体来说,我们提出了一种图编码器解码器模型(GRAPHEDM),该模型概括了流行的算法,用于将在图上进行半监督学习(例如GraphSage,图卷积网络,图注意网络),并在无监督的情况下学习图表示(例如DeepWalk,node2vec等) )整合为一个一致的方法。为了说明这种方法的一般性,我们将30多种现有方法纳入该框架。我们认为,这种统一的观点不仅为理解这些方法的直觉提供了坚实的基础,而且使该领域的未来研究成为可能。




Covid-19增长的长程相关性


原文标题:
Long-range correlations in Covid-19 growth
地址:
http://arxiv.org/abs/2005.03779
作者:
Nigora Turaeva, Nigina Aripova, Boris L. Oksengendler

摘要:分形统计数据应用于美国每天新增的COVID-19病例。赫斯特(Hurst)参数指示增长的长程相关性,它是根据美国多个州每日增长的波动,使用简单的R/S方法计算得出的。使用两个控制参数(居家令的顺序和人口密度)分析了不同状态的赫斯特参数值。




预测COVID-19对S&P500的影响


原文标题:
Forecasting the effect of COVID-19 on the S&P500
地址:
http://arxiv.org/abs/2005.03969
作者:
Arias-Calluari Karina, Alonso-Marroquin Fernando, Nattagh-Najafi Morteza, Harré Michael

摘要:新型冠状病毒(COVID-19)的爆发给全球金融和经济市场造成了空前的破坏,从而导致美国股市跌幅为历史上最快。但是,在过去,我们看到市场正在复苏,就像我们将看到当前市场再次恢复一样,因此在此基础上,市场的恢复将达到最小值,然后在不远的将来有时会有所增加。在此,我们根据华盛顿大学于2020年4月2日发布的COVID-19死亡预测,以及自美国首例确诊病例以来的两个月考虑时间,提供标准普尔500指数的两种预测模型。估计接下来三个月该指数的下降和恢复。该预测是对预测的预测,其中不确定性由q-高斯分布描述。我们的预测是在以下前提下做出的:(a)该预测基于自COVID-19的病毒传播开始以来数据集的确定趋势,并且(b)不确定性是根据S &P500的模式拟合得出的。最近24年。




战略性时空疫苗分配可以将

传染病导致的死亡人数减少一半


原文标题:
Strategic Spatiotemporal Vaccine Distribution Halves Deaths due to an Infectious Disease
地址:
http://arxiv.org/abs/2005.04056
作者:
Jens Grauer, Hartmut Löwen, Benno Liebchen

摘要:Covid-19已造成数十万人死亡,经济损失总计达数万亿美元,人们对疫苗的快速开发产生了渴望。一旦可用,疫苗就会逐渐产生,引发了关于如何最佳分配疫苗的问题。虽然官方疫苗接种指南主要关注应首先向谁提供疫苗(例如,针对风险人群)的问题,但在此我们提出了一种通用的策略,以指定其在时间和空间上的分布,从而优先考虑具有较高局部感染增长率的地区。为了证明这一策略,我们开发了一种基于主体的模型来描述感染模式的时间演变及其对疫苗接种的反应。对于异质感染模式,与按人口密度成比例分配疫苗的标准做法相比,在我们的模拟中建议的策略至少使死亡人数减少了一半。这适用于广泛的繁殖数量和疫苗生产速率,并且可能会激发关于疫苗时空分布对于官方指南的重要性的讨论。




基于规范的消息对

阅读和理解COVID-19

大流行反应政府规则的影响


原文标题:
The effect of norm-based messages on reading and understanding COVID-19 pandemic response governmental rules
地址:
http://arxiv.org/abs/2005.03998
作者:
Ennio Bilancini, Leonardo Boncinelli, Valerio Capraro, Tatiana Celadin, Roberto Di Paolo

摘要:新的冠状病毒疾病(COVID-19)威胁着全球数百万人的生命,使其成为近来最大的健康威胁。全世界数十亿人被要求遵守严格的就地庇护规定,并最终确定下来以减慢病毒的传播速度。领导人和政策制定者正在使用呼吁和信息来促进大流行应对。考虑到风险的发挥,因此对于社会科学家来说,探索哪些信息在促进大流行应对中最有效非常重要。实际上,上个月的一些论文探讨了几种信息对人们进行大流行应对行为的意图的影响。在本文中,我们做出了两个贡献。首先,我们探讨信息对人们的实际参与而不是意图的影响。具体来说,我们的因变量是通过理解性问题衡量的对官方COVID-19大流行应对政府信息专家小组的理解水平,以及阅读这些规则所花费的时间。其次,我们测试了一套基于规范理论的新颖诉求。一则信息针对个人规范(人们认为做对的事情是正确的),一则信息针对描述性规范(人们认为他人在做的事情),一则针对禁令规范(人们认为他人赞成或不同意的事情)。我们的实验是在线进行的,其中包括具有代表性的意大利人(关于性别,年龄和地理位置)。使用传单可以使规范更加突出。我们发现,基于规范的传单对理解和小组花费的时间没有影响。这些结果表明,通过传单进行基于规范的干预对人们阅读和理解COVID-19大流行应对政府法规的影响很小。




暴露:密闭空间的

乘员暴露模型,以在

大流行期间改进人群模型


原文标题:
EXPOSED: An occupant exposure model for confined spaces to retrofit crowd models during a pandemic
地址
http://arxiv.org/abs/2005.04007
作者:
Enrico Ronchi, Ruggiero Lovreglio

摘要:人群模型可用于模拟建筑环境中的人员移动。人群模型输出已用于评估行人的安全性和舒适性,告知人群管理并进行法医调查。微观人群模型可以表示每个人,并获得有关其随时间推移的位置以及与物理空间/其他人的交互作用的信息。鉴于建筑物居民之间存在疾病传播的风险,诸如COVID-19等大流行病已对建筑物的安全使用提出了若干问题。在这里,我们展示了如何使用人群模型来评估密闭空间中的乘员暴露。大流行期间有关建筑物使用和社会隔离的政策可能会有很大不同,它们主要基于对疾病传播的宏观分析,而不是基于建筑物级别的安全评估。所提出的模型允许基于微观人员运动的分析来调查建筑物中的人员暴露。通过用通用的暴露评估模型对人群模型进行改造来进行风险评估,该模型可以解释不同类型的疾病传播。这项工作使决策者可以在大流行期间就建筑物的使用情况做出明智的决定。




在社交媒体上发现东亚偏见


原文标题:
Detecting East Asian Prejudice on Social Media
地址:
http://arxiv.org/abs/2005.03909
作者:
Bertie Vidgen, Austin Botelho, David Broniatowski, Ella Guest, Matthew Hall, Helen Margetts, Rebekah Tromble, Zeerak Waseem, Scott Hale

摘要:随着政府应对大流行的健康,经济和社会成本,COVID-19的爆发改变了世界各地的社会。它还引起了人们对网络仇恨语言和偏见的传播的关注,特别是针对东亚的敌对行为。在本文中,我们报告了一个分类器的创建,该分类器将Twitter上的社交媒体帖子检测和分类为四个类别:对东亚的敌视,对东亚的批评,对东亚偏见的元讨论和中立类型。在所有四个类别中,分类器的F1分数均达到0.83。我们提供了最终模型(使用Python编码),以及用于分类器的新的20,000条推特训练数据集,与东亚偏见相关的主题标签的两种分析以及注释代码本。该分类器可以由其他研究人员实施,以协助进行在线内容审核流程,并进一步研究这种全球性大流行期间在线东亚偏见的动态,流行和影响。




在剪刀石头布的演化博弈中,

死亡率使共存变得脆弱


原文标题:
Mortality makes coexistence vulnerable in evolutionary game of rock-paper-scissors
地址:
http://arxiv.org/abs/2005.03686
作者:
Sirshendu Bhattacharyya, Pritam Sinha, Rina De, Chittaranjan Hens

摘要:人们认为,生态系统中的多种物种会周期性竞争生存,从而保持自然平衡。随机性在这种动态中也具有不可避免的作用。考虑到自然的这些属性,基于循环支配性思想的剪刀石头布模型的随机动力学成为捕获生态系统各个方面的有效工具。该模型的演化动力学至关重要地取决于代表不同自然习惯的不同相互作用。在这个框架中,我们探索了个体生物的死亡率在物种集体生存中的作用。为此,引入了一个称为“自然死亡”的新参数。它意在引起个体的死亡,而不考虑任何种内和种间相互作用。我们执行蒙特卡洛模拟,然后对定义的速率方程的不同固定点进行稳定性分析,并观察到自然死亡率令人惊讶地是决定生态系统是共存还是单物种生存的最重要因素之一。




网络中非回溯中心性的

局部化及其物理后果


原文标题:
The localization of non-backtracking centrality in networks and its physical consequences
地址:
http://arxiv.org/abs/2005.03913
作者:
Romualdo Pastor-Satorras, Claudio Castellano

摘要:在确定网络系统的各种结构和动力学特性方面,非回溯矩阵的谱起着至关重要的作用,范围从债券渗透和非周期性流行过程的阈值到社区结构,再到节点重要性。在这里,我们为不相关的随机网络计算了非回溯矩阵的最大特征值和相关的非回溯中心性,找到了与数值结果非常吻合的表达式。但是,我们表明,对于许多现实世界网络而言,相同的公式并不适用。我们在网络子图的非回溯中心性本地化中确定了造成这种违规的机制,这种子图的形成在不相关的网络中极不可能,而在现实世界的结构中却很常见。利用这些知识,我们为最大特征值提供了一种启发式的广义公式,该公式对于大型经验数据集的所有网络都非常准确。我们表明,这种新发现的本地化现象使您能够了解许多实际结构中渗透阈值的消息传递预测的失败。




分年龄人口总体空间分布的分形格局


原文标题
Fractal Patterns in Spatial Distribution of Population by Age Group
地址:
http://arxiv.org/abs/2005.03935
作者:
Mariko I. Ito, Takaaki Ohnishi

摘要:多重分形是人口空间分布中观察到的模式之一。在这项研究中,我们对日本首都地区按年龄段划分的人群进行了多重分形分析。每个人口群体通常表现出人口稠密的位置相对相互联系的特性。我们还研究了多重分形对年龄组的依赖性。多重分形测度表明,由年轻劳动年龄组组成的群体表现出较强的异质性和人口集中度,而由老年人组成的群体表现出相对均质的特性。




足球比赛中的控球动力学:

从数据分析到建模


原文标题:
Ball possession dynamics in the game of Football: From data analysis to modeling
地址:
http://arxiv.org/abs/2005.04020
作者:
A. Chacoma, N. Almeira, J.I. Perotti, O.V. Billoni

摘要:团队运动(如足球)的集体动力学研究是一项艰巨的任务,涉及大量数据和分析。在此贡献中,我们旨在解决这一广泛领域的特定主题,例如控球间隔的动态。为此,我们分析了一个新颖的足球数据库,其中包括欧洲五个主要联赛的一个赛季。首先,我们从数据库的统计分析中获得了控球动力学的关键要素。使用此输入,我们基于三个特工,两个队友和一个防守者建立了一个简单的随机模型。该模型包括四个参数,并且可以捕获数据库中控球间隔的主要紧急统计可观察值:(i)控球时间,(ii)传球次数以及(iii)传球时的球距分布。在最后一部分中,我们表明模型的动力学可以映射到具有漂移和吸收势垒的维纳过程中。




社会影响力的多胜者选举控制


原文标题:
Multi-Winner Election Control via Social Influence
地址:
http://arxiv.org/abs/2005.04037
作者:
Mohammad Abouei Mehrizi, Gianlorenzo D’Angelo

摘要:在选举中,我们得到了一组选民,每个选民都具有在一组候选人上的偏好列表,这些选民分布在社会网络上。我们考虑了这样一种情况,选民可能会由于邻居在社会网络中收到的消息而更改其偏好列表。具体来说,我们考虑一场政治运动,该运动在社会网络中传播消息以支持或反对给定候选人,并且传播遵循动态的信息传播模型。当消息到达投票者时,后者根据更新规则更改其偏好列表。选举控制问题要求找到一个有限的节点集,以作为支持(建设性问题)或反对(破坏性问题)给定目标候选人 c 的政治运动的起点,其方式为:c  wrt它的投票最多的对手是最大的。业已表明,可以在最优值的恒定因子近似值下解决问题的几种变体,这表明借助社会网络控制选举是可行的,并且构成了现代民主国家的实际问题。但是,大多数文献都集中在单胜者选举的情况下。在本文中,我们以“国会议员选举”为模型,定义了“多赢者选举”社会网络中的选举控制问题。与单赢者案例不同,我们证明了在建设性和破坏性案例中,多赢者选举控制问题都是NP难以在任何因素内近似的问题。然后,我们研究了一个放松问题的方法,该问题是在政党(而不是单一候选人)的基础上汇总选票,这是在某些真正的议会选举中使用的所谓“直党投票”的变体。我们表明,后一个问题仍然是NP-hard,但可以在一个恒定因子内近似。




社会网络上公平影响力

最大化的对抗图嵌入


原文标题:
Adversarial Graph Embeddings for Fair Influence Maximization over SocialNetworks
地址:
http://arxiv.org/abs/2005.04074
作者:
Moein Khajehnejad, Ahmad Asgharian Rezaei, Mahmoudreza Babaei, Jessica Hoffmann, Mahdi Jalili, Adrian Weller

摘要:影响最大化是网络科学中广泛研究的主题,其目的是达到最大可能的节点数,同时仅针对一小批初始个体。它在病毒营销,信息传播,新闻传播和疫苗接种等许多领域具有关键应用。但是,该目标通常不考虑受影响的节点的最终集合在敏感属性(例如种族或性别)方面是否公平。在这里,我们着眼于公平影响力最大化,旨在更公平地触及少数群体。我们介绍了对抗图嵌入:我们共同训练用于图嵌入的自动编码器和鉴别器来区分敏感属性。这导致嵌入在敏感属性之间类似地分布。然后,我们通过对嵌入进行聚类来找到一个好的初始集合。我们相信,我们是第一个将嵌入用于公平影响力最大化任务的人。尽管通常在公平性和影响力最大化目标之间进行取舍,但我们在合成数据集和真实数据集上的实验表明,我们的方法可以极大地减少差异,同时与最新的影响力最大化方法保持竞争优势。




从数据中提取几何图,

以利用图卷积网络帮助分类任务


原文标题:
Geometric graphs from data to aid classification tasks with graph convolutional networks
地址:
http://arxiv.org/abs/2005.04081
作者:
Yifan Qian, Paul Expert, Pietro Panzarasa, Mauricio Barahona

摘要:分类是数据分析中的经典问题,并且已从许多不同角度进行了分类,包括机器学习。传统上,机器学习方法仅根据样本的特征对样本进行分类。这种范例正在发展。图卷积网络的最新发展表明,显式使用不直接存在于特征中的信息来表示样本之间的关系类型可以显著提高分类性能。但是,图并不经常立即出现在数据集中,因此限制了图卷积网络的适用性。在本文中,我们探讨了从特征本身提取的图是否可以帮助分类性能。首先,我们证明了直接从数据特征构造最佳几何图可以帮助对来自不同域的综合和真实数据集进行分类任务。其次,我们引入了两个指标来表征最优图:i)通过测量子空间之间的对齐方式,这些子空间由与图卷积的特征和地面实况所跨越。ii)图卷积网络的输出激活中类分离的比率:这表明最优图最大程度地分离了类。最后,我们发现稀疏最佳图可以潜在地提高分类性能。

来源:网络科学研究速递
编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


使用人类移动数据量化COVID-19在中国大陆的经济影响 | 网络科学论文速递18篇

利用夜光和空气数据测算COVID-19对中国人口活动的影响 | 网络科学论文速递16篇

弱关系加剧了社交媒体中的愤怒情绪蔓延 | 网络科学论文速递15篇

提前采取针对COVID-19的遏制措施的决定有多重要?| 网络科学论文速递21篇

量化美国社会疏离政策对COVID-19结果的预期影响 | 网络科学论文速递14篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存