查看原文
其他

深度图映射:通过神经网络视角观察图 | 网络科学论文速递25篇

ComplexLY 集智俱乐部 2022-04-08

本文由机器翻译,仅供参考,感兴趣请查阅论文原文


核心速递



  • 深度图映射:通过神经网络视角观察图;

  • Gillespie算法用于非马尔可夫随机过程;
  • 高阶标签同质性和图传播;
  • TIES:时间互动嵌入改进Facebook社交媒体的完整性;
  • 互联网级别图的实时无索引单源SimRank处理;
  • BB_Evac:位置敏感的基于行为的建筑物快速疏散;
  • 量化科学演化中的扩展适应;
  • 使用地理空间移动代表性特征(ReFGeM)区分人口空间行为;
  • BatchLayout:共享存储的批并行力导向图布局算法;
  • 块内嵌套性的分辨率极限缺失;
  • ITeM:使用独立含时模体总结和比较含时网络;
  • 建筑特征的机器学习和城市指标的幂律恢复;
  • 非线性网络动态与共识-分歧的分叉;
  • 特征值问题迭代方法的Entrywise收敛;
  • 基于连续影响的社会网络社团划分;
  • 公路交通电气化的经济活力和基础设施要求;
  • COVID-19扩散的尺度特征;
  • 利用异步更新的演化博弈进行网络重构;
  • 通过不可观测链接的随机抽样进行链路预测的快速评估;
  • 社交媒体资料策展;
  • 基于资产交换模型的区域不平等模拟;
  • 复杂网络舆论动态的迟滞和无序诱发的连续动力学类型有序;
  • 基于局部流的超图聚类;
  • 参数化目标和算法聚类二部图和超图;
  • 聚类用于临床领域的分类多关系数据知识表示嵌入评价;
 



深度图映射:通过神经网络视角观察图


原文标题: 
Deep Graph Mapper: Seeing Graphs through the Neural Lens
地址: 
http://arxiv.org/abs/2002.03864
作者: 
Cristian Bodnar, Cătălina Cangea, Pietro Liò


摘要: 图表示学习的最新发展,出现压缩编码刻画图的主要特性的工作。然而,尽管这些抽象的表征在下游任务中表现的很强大,却不那么适合可视化的目的。在这项工作中,我们整合了拓扑数据分析(TDA)领域的映射算法和图神经网络(GNNS)的表达能力,产生分层的基于拓扑的图可视化。这些可视化不仅有助于洞悉复杂图的结构,还提供了理解适用于他们解决各种任务的模型的一种手段。通过数学证明与最小割和差异池化的等价性,我们进一步证明映射适合作为图池化的拓扑框架。在此框架的基础上,我们介绍了基于PageRank的新颖池化算法,获得了相比图分类基准的现有技术方法的有竞争力结果。



Gillespie算法用于非马尔可夫随机过程


原文标题: 
A Gillespie algorithm for non-Markovian stochastic processes
地址: 
http://arxiv.org/abs/1601.01490
作者: 
Naoki Masuda, Luis E. C. Rocha

摘要: Gillespie算法提供用于模拟建模为离散的交互的事件,包括社会网络上的生化反应或地震发生,排队过程或尖峰的神经元网络,和流行性和意见形成过程的系统的序列随机动态统计精确的方法。根据经验,对各种现象的,事件之间的时间服从长尾分布。吉莱斯皮算法和它的变体或者假定泊松过程(即,指数分布事件间的时间),使用特定的功能的事件发生率,或工作的非泊松更新过程的时间进程,包括长尾分布的情况下事件间的时间,但在计算成本高。在本研究中,我们提出了拉普拉斯变换的基础上创新的吉莱斯皮算法的更新过程。该算法利用了一个类点过程被表示为泊松的混合物具有不同的事件发生率处理该事实。该方法适用于多元更新过程,其的事件之间的时间生存函数完全单调。它是一种精确算法和作品比最近提出的吉莱斯皮算法一般更新过程,这是确切的只有无穷多个过程的极限速度。我们还建议与事件之间的时间之间的正相关性的可调谐量来生成的事件时间序列的方法。我们证明我们的算法对网络流行过程精确模拟,发现在事件间的时间呈正相关的一个现实的量影响很小疫情动态。




高阶标签同质性和图传播


原文标题: 
Higher-Order Label Homogeneity and Spreading in Graphs
地址: 
http://arxiv.org/abs/2002.07833
作者:
Dhivya Eswaran, Srijan Kumar, Christos Faloutsos

摘要: 做高阶的网络结构图援助半监督学习?给定一个图和几个标记的顶点,标记剩余的顶点是高冲击的问题,在一些任务,如推荐系统,欺诈检测和蛋白质鉴定申请。然而,传统的方法依赖于边的传播标签,因为所有的边是不相等的被限制。有更强的联系顶点参加高阶结构图,这对于可以在半监督学习任务,利用这些结构的方法调用。为此,我们提出了高阶标签传播(HOLS)使用更高级的结构传播的标签。 HOLS具有较强的理论保证和降低标准标签的基本情况蔓延。通过大量的实验,我们表明,高阶标签除了传播使用三角形边是高达4.7%,好于标签单独使用边扩散。相较于之前传统的国家的最先进和方法,所提出的方法,因而在所有的,但是,1箱子统计显著准确性收益,而其余的快速和可扩展到大图。




TIES:时间互动嵌入改进

Facebook社交媒体的完整性


原文标题: 
TIES: Temporal Interaction Embeddings For Enhancing Social Media Integrity At Facebook
地址: 
http://arxiv.org/abs/2002.07917
作者: 
Nima Noorshams, Saurabh Verma, Aude Hofleitner

摘要: 公司自成立以来,Facebook已经成为了在线社交社区的一个组成部分。人们依靠在Facebook上做出与他人建立社区联系。其结果是,这是极为重要的保护这样一个快速增长的网络的完整性的快速和可扩展的方式。在本文中,我们提出了我们对保护各种社会化媒体在实体实的人谁试图滥用我们的平台的努力。我们提出,旨在捕捉流氓的社会交往和标志他们更合适的行动新颖的时空互动的嵌入(领带)模型。领带是一种监督,深度学习,生产准备在Facebook的规模网络模型。诚信问题,在此之前的作品主要集中于捕捉任何社会实体的只有静态或动态的某些特征。相比之下,领带可以捕捉因近期在图嵌入和深序列模式学习的领域取得长足进步的统一模型这两个变种的行为。显示纽带的现实世界的影响,我们提出了几个应用程序特别是对防止误报,假帐户检测蔓延,并减少广告支付,以提高平台的诚信风险。




互联网级别图的实时

无索引单源SimRank处理


原文标题: 
Realtime Index-Free Single Source SimRank Processing on Web-Scale Graphs
地址: 
http://arxiv.org/abs/2002.08082
作者: 
Jieming Shi, Tianyuan Jin, Renchi Yang, Xiaokui Xiao, Yin Yang

摘要: 给定图G和G中一个节点u,单个源SimRank查询评估u和在G.每个节点V之间的相似性的现有方法到单个源SimRank计算招致任何长的查询的响应时间,或昂贵的预先计算,这需要每当图G改变要再次执行。因此,我们对它们的认识都不是理想的情形,其中(i)查询处理必须实时完成,及(ii)底层的图G是大规模的,频繁的更新。这个启发,我们提出SimPush,一种新的算法,答案单一来源SimRank查询没有任何预先计算,并在同一时间达到显著较高的查询处理速度甚至比目前最快的基于指数的解决方案。此外,SimPush提供严谨的成绩的好坏保证,其高性能不依赖于底层图的任意很强的假设。具体而言,相对于现有的方法,采用SimPush完全不同的算法设计侧重于(i)识别少数与查询相关的节点,并且随后(II)计算的统计数据,并从仅这些节点执行残余推。我们证明SimPush的正确性,分析它的时间复杂度,并与现有的方法比较其渐近性能。同时,我们评估SimPush通过对8个真实数据集了广泛的实验的实用性能。结果表明,SimPush始终优于所有现有的解决方案,往往在一个数量级。特别是,一种商品的机器上,SimPush答案在含有超过1.33亿节点和下62毫秒5.4十亿边的web图单个源SimRank查询,具有0.00035经验误差,而最快基于索引的竞争者需要1.18秒。




BB_Evac:位置敏感的

基于行为的建筑物快速疏散


原文标题: 
BB_Evac: Fast Location-Sensitive Behavior-Based Building Evacuation
地址: 
http://arxiv.org/abs/2002.08114
作者: 
Subhra Mazumdar, Arindam Pal, Francesco Parisi, V.S. Subrahmanian

摘要: 在疏散计划以前的工作假设撤离将遵循指令 - 但是,有充分证据表明,这种情况并非如此。虽然有些人会按照指示,别人会按照自己的愿望。在本文中,我们提出在计划撤离时,人的行为模式是考虑到基于行为的疏散问题(BBEP)的正式定义。我们表明,约束的具体形式可以用来表达这种行为。我们表明,BBEPs可以准确地通过一个叫做BB_IP整数规划通过更快的算法,我们称之为BB_Evac解决,不精确。我们进行了适用于建筑(虽然原则上算法可以应用到任何图)和show两种算法的详细的实验分析,后者是一个数量级比BB_IP快而产生的结果是几乎在一个良好的现实世界上几个综合生成的图表建设图和和。




量化科学演化中的扩展适应


原文标题: 
Quantifying exaptation in scientific evolution
地址: 
http://arxiv.org/abs/2002.08144
作者: 
Márcia R. Ferreira, Niklas Reisz, William Schueller, Vito D.P. Servedio, Stefan Thurner, Vittorio Loreto

摘要: 重新发现的东西,新的功能可以是一样的发现本身一样重要。 1982年,斯蒂芬·杰·古尔德和伊丽莎白·弗巴命名这种现象扩展适应描述生物演化过程中一个特定性状的功能,一个根本性的转变。虽然扩展适应被认为是产生适应性的创新性,多样性和复杂的功能的基本机制,相对较少的努力已经取得了量化生物演化的话题之外扩展适应。我们认为,这一概念提供了用于表征科学创新的出现,一个有用的框架。本文探讨了扩展适应源于科学思想在比它们最初被应用到该地区的其他领域使用的概念。特别是,我们采用归一化熵和逆参与率作为揭示和量化扩展适应的概念可观。我们确定扩展适应的独特的模式和揭露的是显示这些模式的文件的具体例子。我们的做法代表着的扩展适应现象在科学发展的背景下,量化的第一步。




使用地理空间移动代表性特征

(ReFGeM)区分人口空间行为


原文标题: 
Differentiating Population Spatial Behavior using Representative Features of Geospatial Mobility (ReFGeM)
地址: 
http://arxiv.org/abs/2002.08168
作者: 
Rui Zhang (1), Kevin G. Stanley (1), Daniel Fuller (2), Scott Bell (1) ((1) University of Saskatchewan, (2) Memorial University)

摘要: 了解人类如何使用和比较分层组占用的空间,无论是通过观察或对照研究,关键是要设计出更好的空间,城市和政策。 GPS数据跟踪提供个人详细的运动模式,但可以是难以解释,由于收集到的数据的规模和范围。对于可操作的见解,GPS轨迹通常是减少到表达的感兴趣的空间现象的一个或多个特征。然而,它并不总是很清楚哪些空间功能应采用,并大量精力可以投入到设计功能,这些可能或可能不会提供洞察力。在本文中,我们提出了一种替代的方法:标准化的功能集以及可对许多数据集可以有效地运行可行的解释。我们发现,这些功能可以不同的人才流动模式的区别,虽然没有单一的特征可以单独区分它们。




BatchLayout:共享存储的

批并行力导向图布局算法


原文标题: 
BatchLayout: A Batch-Parallel Force-Directed Graph Layout Algorithm in Shared Memory
地址:
http://arxiv.org/abs/2002.08233
作者:
Md. Khaledur Rahman, Majedul Haque Sujon, Ariful Azad

摘要: 力导向算法被广泛用来生成许多科学学科出现图表或网络的美观的布局。为了显现大型图,几个并行算法已经在文献中所讨论的。然而,现有的并行算法不有效地利用存储器层次结构,并通常提供有限的并行性。本文讨论了与BatchLayout这些限制,一种算法,组顶点到minibatches和并行处理它们。 BatchLayout还采用缓存阻断技术,以有效地利用存储器层级。更多的并行的和改进的存储器存取加上力近似技术,更好的初始化,和优化学习率化妆BatchLayout显著快于国家的最先进的其他算法如ForceAtlas2和OpenOrd。从BatchLayout布局的可视化质量比同类的可视化工具相当或更好。我们所有的源代码,链接数据集,结果和日志文件可在https://github.com/khaled-rahman/BatchLayout




块内嵌套性的分辨率极限缺失


原文标题:
Absence of a resolution limit in in-block nestedness
地址: 
http://arxiv.org/abs/2002.08265
作者: 
Manuel S. Mariani, María J. Palazzi, Albert Solé-Ribalta, Javier Borge-Holthoefer, Claudio J. Tessone

摘要: 最初在生态网络推测模式中,混合或化合物嵌套模块化模体已被证实,在过去十年中,作为在各种情况下—in生态系统互惠及以后出现的一个相关的结构布置。这意味着移位从嵌套性的测量结果作为一个全局属性(宏观层面)的焦点,该检测块(中间一级),其内部表现出高度的嵌套性的。不幸的是,可用性和方法的理解正确检测块嵌套分区躺在后面的实证研究结果:尽管已经提出了块嵌套结构的精确质量的功能,我们缺乏其可能的内在制约因素的理解。具体来说,虽然众所周知,纽曼 - 格文的模块,以及相关的质量功能,出了名的,从分辨率极限遭受其损害自己的能力来检测小块,分辨率限制在块嵌套结构的潜在存在是未知。在这里,我们提供的经验,数字和分析的证据表明,在块嵌套性功能缺乏分辨极限,因此我们检测到正确的分区在网络中通过其最大化完全取决于优化算法的准确性容量。




ITeM:使用独立含时

模体总结和比较含时网络


原文标题: 

ITeM: Independent Temporal Motifs to Summarize and Compare Temporal Networks
地址: 
http://arxiv.org/abs/2002.08312
作者: 
Sumit Purohit, Lawrence B. Holder, George Chin

摘要: 网络是代表不同复杂系统的一个基本的和灵活的方式。如通信,引文,采购,生物学,社会化媒体,交通多个领域可以模拟为一组实体和它们之间的关系。时空网络是一般网络的专业化,其中系统的时间演变是重要的,了解的实体和关系的结构。我们提出独立态基序(项目),以从不同的域表征的时间曲线图。的项目是可用于结构和图的演化模型边不相交的时间基序。对于给定的时间曲线图,我们生产项目频率的特征向量与该分布适用于测量含时图的相似性的任务。我们表明,项目具有比其他主题基于频率的方法更高的精度。我们定义基于项目,揭示时间网络的显著性能的各种指标。我们还提出重点取样为有效估计项目计数的方法。我们评估我们在人工和真实时间网络的方法。



建筑特征的机器学习

和城市指标的幂律恢复


原文标题: 
Machine learning for buildings characterization and power-law recovery of urban metrics
地址: 
http://arxiv.org/abs/2002.08355
作者:
Alaa Krayem, Aram Yeretzian, Ghaleb Faour, Sara Najem

摘要: 在本文中,我们专注于这个城市的一个重要组成部分:它的建筑存量,持有其大部分的社会经济活动。在我们的例子中,缺乏对他们的特点和它的局限性的调查子集的综合数据库,导致我们采用数据驱动技术就我们所知,延伸到接近全市规模。神经网络和随机森林被应用到识别建筑物的层数和建设时期的一组形状特征的依赖关系:用一年的耗电量沿面积,周长和高度,在贝鲁特市依托调查数据。预测的结果再与城市形态,构成我们的工作流的进一步一致性检查和确认,建立了定标律相比。




非线性网络动态与共识-分歧的分叉


原文标题: 
Non-linear network dynamics with consensus-dissensus bifurcation
地址: 
http://arxiv.org/abs/2002.08408
作者:
Karel Devriendt, Renaud Lambiotte

摘要: 我们研究了由音叉分岔范式启发网络非线性动力系统。该系统有几个有趣的解释:如几杈系统的互连,梯度动力系统和一般的类非线性动态系统的主导的行为。系统的平衡行为表现出全局分岔相对于所述系统参数,与来自一个单一的恒定静止状态到大范围的可能的固定状态的过渡。我们的主要结果进行分类(的一个子集)的底层图的有效电阻的方面这些静止状态的稳定性;这种分类清楚地辨别其中地方杈系统互连的具体拓扑结构的影响。我们进一步描述了用于与外部公平分区图的精确解和表征树图吸引盆。树图,完全图和杠铃图表:我们的技术分析是通过对系统的一些典型网络的研究为辅。我们描述了一些关于这些网络的动态定性性质的,有希望的造型后果。




特征值问题迭代方法的Entrywise收敛


原文标题: 
Entrywise convergence of iterative methods for eigenproblems
地址: 
http://arxiv.org/abs/2002.08491
作者: 
Vasileios Charisopoulos, Austin R. Benson, Anil Damle

摘要: 在机器学习,统计学等领域的几个问题依靠计算特征向量。对于大规模的问题,这些本征矢量的计算通过迭代方案,诸如子空间迭代或克雷洛夫方法通常进行。虽然有古典和综合分析的子空间收敛保证相对于谱规范,在许多现代应用子空间距离的其他概念是比较合适的。最近的理论工作集中在  ell 2 到 infty 规范测量子空间的扰动,但不会考虑特征向量的实际计算。在这里,我们针对子空间迭代的收敛,当距离在  ell 2 到 infty 标准进行测量,并提供确定性的边界。我们用实际停止准则补充了我们的分析,并通过数值实验证明其适用性。我们的研究结果表明,虽然需要较少的迭代,从而节省大量的计算时间可以得到下游的任务相当的性能。




基于连续影响的社会网络社团划分


原文标题: 
Continuous Influence-based Community Partition for Social Networks
地址: 
http://arxiv.org/abs/2002.08554
作者: 
Qiufen Ni, Jianxiong Guo, Weili Wu, Chuanhe Huang

摘要: 社区分区的,因为快速增长的网络规模,数据和应用的社会网络非常重要。我们认为,在社会网络下LT模型社区划分问题,这是一个组合优化问题划分的社会网络不相交 M 的社区。我们的目标是通过每个社区内最大限度地提高它的影响力最大化传播的总和。社区划分问题的影响力传播的功能是在LT模型超模,我们使用Lov区急性一 SZ扩展的方法来放松目标的影响作用,并转移我们的目标是在拟阵最大限度的放松功能多面体。接下来,我们建议用轻松的函数的性质来解决我们的问题,需要在具体的实施进行离散化连续贪心算法。然后,随机舍入技术被用于分数溶液到整数解转换。我们提出了一个理论分析用1-1  / E 近似比对所提出的算法。大量的实验进行网上评价的现实世界所提出的连续贪心算法的性能社会网络数据集,结果表明,连续的社区划分方法可以有效地改善社区划分的影响蔓延和准确性。




公路交通电气化的

经济活力和基础设施要求


原文标题: 
Economic Viability and Infrastructure Requirements for the Electrification of Highway Traffic
地址: 
http://arxiv.org/abs/2002.08696
作者: 
Thiemo Pesch, Hans-Josef Allelein Dirk Müller, Dirk Witthaut

摘要: 电池电动汽车正在迅速进入市场。他们的成功提供了运输部门的脱碳巨大的机遇,但也对能源基础设施的新挑战。公共充电站必须建立和电网可能会变得拥挤。在这篇文章中,我们分析了沿使用高分辨率优化模型的高速公路收费系统的优化布局和操作。我们讨论了经济活力和识别潜在的障碍阻碍了快速集结电动汽车的。我们发现区域配电网的拥塞成为电动车的中等市场渗透率已经是一个严重的问题。虽然峰值负载可通过电池的蓄电系统来处理,电网连接根本限制了可以每天送达汽车的总量。我们的研究结果进一步突出不同部门之间的相互依赖性和区域性基础设施的改造,可持续能源体系中的重要性。由于需要规划和实现的基础设施措施的长的时间段,快速决策是必要的。




COVID-19扩散的尺度特征


原文标题:
Scaling features in the spreading of COVID-19
地址:
http://arxiv.org/abs/2002.09199
作者: 
Ming Li, Jie Chen, Youjin Deng

摘要: 自COVID-19爆发以来已有众多数据分析工作。有的研究基于假设指数增长的经典流行病学方法,另有少量研究指出幂律尺度对当前可得数据拟合更优。本文我们研究了中国(2020年1月20日至2020年2月19日)的数据,确实发现显著长的时间病例生长极为遵循幂律动力学。确诊病例、死亡和治愈案例数的幂指数分别为2.42(20),2.21(8)和4.14(20),表明大规模流行传播下可能有小世界网络结构。尽管死亡和治愈病例数仍未明显偏离幂律增长,但感染人数已出现了明显的负偏差,特别是湖北以外的区域。这表明病毒传播在大量控制措施下开始变慢。我们同时发现,尽管量级存在显著差异,湖北省和湖北以外的区域感染人数的增长动力学有很多相似之处。在此基础上,我们在双对数坐标下重新调整了湖北之外地区的感染人数尺度,使其尽可能多地与中国总感染人数重叠,从中大致外推得到病毒达峰时间约为2020年3月3日,届时感染人数约83000名。此外通过分析双对数尺度下的死亡率的动力学,我们粗略估计3月3日前后湖北省COVID-19死亡率约为4.0%~4.5%,湖北以外区域约为0.8%-1.2%。我们强调,我们的预测可能数量上并不可靠,因为数据分析只基于纯粹经验数据并使用了各种假设。




利用异步更新的演化博弈进行网络重构


原文标题: 
Network reconstruction from asynchronously updated evolutionary game
地址:
http://arxiv.org/abs/2002.09105
作者:
Hong-Li Zeng, Shu-Xuan Wang, Yan-Dong Guo, Shao-Meng Qin

摘要: 囚徒困境(PD)博弈玩家间的相互关系与重建演化的博弈数据。所有参加每一轮的比赛中发挥与他们的同行和增益相应的奖励博弈。然而,他们的策略是演化PD比赛中异步更新。玩家之间的交互的两种推理方法得出与天真的平均场(NMF)近似和最大相似度分别估计(MLE)。这两种方法被测试数值也为完全连接不对称谢林顿-帕特里克(SK)的模型,不同的数据长度,非对称度,收益和系统噪声(耦合强度)。我们发现,MLE方法的重建均方误差(MSE)成正比,数据长度的倒数,通常一半NMF的是(受益的更新次数的额外信息)。这两种方法都是稳健的不对称程度,但适用于大回报更好。与MLE相比,NMF是对接头强度,其倾向于弱耦合更加敏感。




通过不可观测链接的随机

抽样进行链路预测的快速评估


原文标题: 
Fast Evaluation of Link Prediction by Random Sampling of Unobserved Links
地址: 
http://arxiv.org/abs/2002.09165
作者: 
Jingwei Wang, Yunlong Ma, Zeyu Chen, Xuheng Wang, Yuan Yun, Weiming Shen, Min Liu

摘要: 链路预测算法的评估需要估计网络中的所有未观测到的链接的存在的可能性。然而,未观察到的链路的数量与节点的数量的增加,这限制了链路预测在大型网络中呈指数增长。在本文中,我们提出了链路预测算法,即链路预测随机抽样一种新的评价方案。我们用这种方法来评估在不同环境和规模十个真实世界的网络链接12个预测性能。结果表明,业绩排名这些算法不会受到来自未观测到的链接随机抽样的很小一部分进行实验,无论是使用AUC或精密计量。此外,该采样方法可以降低计算复杂度的链路预测算法选自O在大型网络中的评价(N ^ 2)至O(N)。我们的研究结果表明,该方案是一个快速和有效的评价方法。




社交媒体资料策展


原文标题: 
Curating Social Media Data
地址: 
http://arxiv.org/abs/2002.09202
作者: 
Kushal Vaghani

摘要: 社会化媒体平台已经授权的人在当今时代脉搏的民主化。由于其巨大的知名度和极高的使用率,在社交媒体网站(例如,Twitter的,Facebook和Tumblr)公布的数据是信息的丰富的海洋。因此,社会印记的数据驱动的分析已经成为组织和政府的重要资产,以进一步提高其产品和服务。然而,由于动态和社交媒体数据的嘈杂本质,进行原始数据准确的分析是一项具有挑战性的任务。一个关键的要求是,收录的原始数据之前馈送到分析管线。这个策展过程将原始数据转化为背景化数据和知识。我们提出了一个数据管道策,即CrowdCorrect,使分析师洁面策划社会数据,并准备好应对可靠的分析。我们的管道提供了从使用现有的内部工具的社交媒体数据的语料库自动特征提取。此外,我们还提供采用自动和人群来源的办法是双纠错机制。这条管线的实现还包括自动创建微任务,以促进策划的原始数据人群用户贡献的一组工具。对于这项研究的目的,我们使用Twitter作为我们的激励社交媒体数据平台由于其受欢迎程度。




基于资产交换模型的区域不平等模拟


原文标题: 
Regional inequality simulations based on asset exchange models
地址: 
http://arxiv.org/abs/2002.09272
作者:
Takeshi Kato, Yasuyuki Kudo, Hiroyuki Mizuno, Yoshinori Hiroi

摘要: 为了深入了解地区差别问题,我们提出了基于通过设置空间交换范围和等价交换增加偏置资产比例的概率存在于经济动能物理学收入交换模型新的地区性资产交换模型。资产分布和基尼系数的模拟表明,抑制地区差距需要,第一,提高了区域内经济循环率,第二,缩小的交换范围(区域间经济区)。避免资产的过度集中,由于反复的交流,但是,需要第三,增加本地支持偏差(分布标准)。包含这三种措施的综合解决方案使换档从过度集中的资产分布指数分布,最终接近正态分布,并进一步降低了基尼系数。展望未来,我们将进一步根据的视差设定在二维空间基于资产的产能,路径依赖和偏置拓展模型,并验证措施,以减少实际的社区区域不平等。




复杂网络舆论动态的迟滞和

无序诱发的连续动力学类型有序


原文标题: 
Hysteresis and disorder-induced order in continuous kinetic-like opinion dynamics in complex networks
地址: 
http://arxiv.org/abs/2002.09366
作者: 
A. L. Oestereich, M. A. Pires, S. M. Duarte Queirós, N. Crokidakis

摘要: 在这项工作中,我们解决一个动力类与多个淬火和极化赋联网的人口动态意见模型。此外,我们认为是限制性的,这是仿照具有光滑的有界信心两两相互作用。我们的研究结果表明非平衡的滞后性和异质性辅助排序的有趣出现。这种有悖常理的现象是稳健的,以不同类型的网络架构,如随机,小世界和无标度。




基于局部流的超图聚类


原文标题: 
Localized Flow-Based Clustering in Hypergraphs
地址: 
http://arxiv.org/abs/2002.09441
作者: 
Nate Veldt, Austin R. Benson, Jon Kleinberg

摘要: 当地图聚类算法被设计为高效地检测被偏置到一个大的图的局部区域节点的小簇。虽然很多技术已经在当地图表集群发展,很少算法已被设计用来检测超图本地集群,包括数据对象之间的关系,多路这更好的模型复杂的系统。在本文中,我们提出了本地集群的框架的基础上削减最低和最高流量超图。我们的方法扩展上基于流的局部图聚类以往的研究,但在一些关键方面已一概而论。首先,我们将演示如何把广义超图 S 的最新结果 -   T 切的问题。这使我们能够适应宽范围的不同的超图切的功能,其可以分配基于每个超边是如何跨越不同的簇分割不同的惩罚。此外,我们的算法附带了一些吸引人的理论性与低超图电导和超图规范化切痕的恢复节点套的条款。最后,也是最重要的是,我们的方法是强的地方,这意味着它的运行时间只取决于输入集的大小。在实践中,这让我们的方法来快速找到本地化集群没有探索的整个输入超图。我们证明了我们在本地群集检测实验在Amazon产品超图和一个堆栈溢出问题的超图法的力量。虽然这两个数据集涉及到几百万个节点,数以百万计的边,而大超边的平均尺寸,我们能够探测到本地集群在几秒钟或几分钟的事情,这取决于簇的大小。




参数化目标和算法聚类二部图和超图


原文标题: 
Parameterized Objectives and Algorithms for Clustering Bipartite Graphs and Hypergraphs
地址: 
http://arxiv.org/abs/2002.09460
作者:
Nate Veldt, Anthony Wirth, David F. Gleich

摘要: 图聚类目标函数具有可调谐的解析参数使得能够检测不同类型的在同一图表中聚类结构。这些目标也提供其他非参数目标,这经常可以被捕获作为特殊情况的统一视图。以前的研究主要集中在标准曲线的参数目标,其中所有节点都是同一类型的,和模型边的成对关系。在我们的工作中,我们介绍了参数化的目标函数和近似算法专为集群二部图和超图的基础上,相关的聚类。这使我们能够与不同的节点类型(二部图)或多路的关系(超图)聚类数据集开发原则的方法。我们的目标超图涉及模块化和标准化切的高阶概念,并且是经由超图扩展技术适合于近似算法。我们的二分客观标准一般化二分相关聚类,并在一定的参数政权相当于bicluster缺失,即,除去边的最小数量的二部图分离成不相交bicliques。一般的问题是NP难的,但我们表明,在一定的参数制度就相当于一个双边匹配问题,这意味着它在这一制度多项式时间内可解。对于其他的制度,我们提供了基于LP-四舍五入近似保证。我们的研究结果包括bicluster删除第一个常数因子近似算法。我们说明了几次实验我们的框架的灵活性。这包括汇聚食物网和基于高阶序结构的电子邮件网络,检测零售产品在产品审核超图集群,并在几个真实世界的二部图评估我们在一系列的参数设置算法。




聚类用于临床领域的分类

多关系数据知识表示嵌入评价


原文标题: 
Clustering as an Evaluation Protocol for Knowledge Embedding Representation of Categorised Multi-relational Data in the Clinical Domain
地址: 
http://arxiv.org/abs/2002.09473
作者:
Jianyu Liu, Hegler Tissot

摘要: 学习知识表示是适用于许多特定领域的机器学习问题的一个日益重要的技术。嵌入知识表示在临床领域分类的多关系数据时,我们讨论传统的链路预测或知识图完成评估协议的效力。链路预测使用到的数据分割为训练和评估子集,导致沿培训信息的丢失和损害知识表示模型的准确性。我们提出了一个聚类评价协议作为替代替代传统使用的评估任务。我们使用嵌入的已评估的临床数据集知识嵌入方法训练的模型。与Pearson和Spearman相关实验结果表明了强有力的证据,所述新型提议的评价协议是pottentially能够替换链路预测。


来源:网络科学研究速递

编辑:张爽


声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


交互网络对于信息寻求口碑效应的动态的影响 | 网络科学论文速递22篇

跨学科合作网络混合模式:通过多视角评估跨学科性 | 网络科学论文速递26篇

疫苗接种和疾病蔓延之间的竞争 | 网络科学论文速递16篇

基于城市共同能源的空间相关性分析方法 | 网络科学论文速递17篇

社会集中和语义崩溃:网络和文本的双曲嵌入 | 网络科学论文速递23篇

联合推断真相/谣言及其社会网络源 | 网络科学论文速递25篇

加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存