核心速递
网络嵌入的对抗训练方法;
季节性收益变化与社会困境中的合作演变;
推特上的网络仇恨及其对社交媒体治理策略的启示;
Adversarial Training Methods for Network Embeddinghttp://arxiv.org/abs/1908.11514Quanyu Dai, Xiao Shen, Liang Zhang, Qiang Li, Dan Wang摘要: 网络嵌入是学习网络连续节点表示的任务,它在诸如链路预测和节点分类的各种任务中都效果良好。大多数现有工作旨在保留低维嵌入向量中的不同网络结构和属性,同时忽略许多现实世界网络中存在的噪声信息以及嵌入学习过程中的过度拟合问题。最近,基于生成对抗网络(GAN)的正则化方法被应用于规范嵌入学习过程,从而促进嵌入向量的全局平滑性。这些方法具有非常复杂的架构,并且受到广泛的GAN非收敛问题的困扰。在本文中,我们旨在介绍一种更简洁有效的局部正则化方法,即对抗训练,用于网络嵌入,以实现模型的鲁棒性和更好的泛化性能。首先,通过在嵌入空间中定义对抗性扰动来应用对抗性训练方法,其具有取决于节点对的连接模式的自适应 L2 范数约束。虽然它作为一个正则化器是有效的,但它受到可解释性问题的困扰,这可能会妨碍它在某些现实场景中的应用。为了改进这一策略,我们进一步提出了一种可解释的对抗性训练方法,通过在离散图域中强制重建对抗性示例。这两种正则化方法可以应用于许多现有的嵌入模型,我们将DeepWalk作为本文的基准模型进行说明。链路预测和节点分类的实证评估证明了本文所提方法的有效性。Seasonal payoff variations and the evolution of cooperation in social dilemmashttp://arxiv.org/abs/1908.11805Attila Szolnoki, Matjaz Perc摘要: 不同的环境条件,会影响社会困境中相互作用的个体之间的关系,从而影响合作的演变。这些环境变化通常是季节性的,因此可以在数学上描述为周期性变化。因此,我们在此研究社会困境的不同表现之间的周期性变化如何影响合作。我们观察到固有的时空动力学之间的非平凡的相互作用,这种动力学刻画了在特定社会困境类型中,合作的传播和收益变化的频率。特别是,我们证明了,对于促进合作而言,两个可用全球采购博弈(global ordering games)之间的周期性变化最好是快速发生,而全球和本地采购博弈(local ordering games)之间的周期性变化最好缓慢发生。我们还表明,两个本地采购社会困境之间的周期性变化的频率是无关紧要的,因为这个过程很快,并且简单地返回到两者的平均合作水平。交互网络的结构也起着重要作用,栅格结构促进了本地采购,而随机图阻碍了紧凑合作集群的形成。相反,对于本地采购,交互网络的常规结构仅略微相关,因为角色分离的模式不依赖于远程订购。 A Study of Cyber Hate on Twitter with Implications for Social Media Governance Strategies http://arxiv.org/abs/1908.11732Rob Procter, Helena Webb, Marina Jirotka, Pete Burnap, William Housley, Adam Edwards, Matt Williams摘要: 本文探讨了通过增强新数字空间自我治理的机制可以减轻网络仇恨的有害影响的方法。我们报告了针对网络仇恨帖子的反应的混合方法研究的结果,其旨在:(i)通过进行定性交互分析和开发统计模型,以解释发布到Twitter网络的仇恨帖子的响应数量,来了解人们如何在这种情况下进行交互。以及(ii)探索使用机器学习技术来帮助识别网络仇恨言论。
Fast and Accurate Network Embeddings via Very Sparse Random Projectionhttp://arxiv.org/abs/1908.11512Haochen Chen, Syed Fahad Sultan, Yingtao Tian, Muhao Chen, Steven Skiena摘要: 我们提出了FastRP,一种可扩展的高性能算法,用于学习图中的分布式节点表示。 FastRP比DeepWalk和node2vec等最先进的方法快4000倍,同时在多个真实网络上对各种下游任务实现了可比较甚至更好的性能。我们观察到大多数网络嵌入方法由两部分组成:构造节点相似性矩阵,然后将降维技术应用于该矩阵。我们表明,这些方法的成功应该归功于这种相似性矩阵的正确构造,而不是所采用的降维方法。我们提出一种可拓展的网络嵌入算法—— FastRP。 FastRP的两个关键特性是:1)它明确地构造了一个节点相似性矩阵,该矩阵捕获图中的传递关系,并根据节点度对矩阵条目进行归一化; 2)它利用非常稀疏的随机投影,这是一种可扩展的无优化方法,适用于降维。结合这两种设计选择的额外好处是,它允许迭代计算节点嵌入,因此不需要显式地构造相似性矩阵,这进一步加速了FastRP。 FastRP还有易于实现、并行化和超参数调整的优点。源代码可从https://github.com/GTmac/FastRP获得。http://arxiv.org/abs/1908.11549摘要: 标度(Scaling)描述了一个系统的属性大小 Y 如何随系统大小(规模) P 而变化。对于大多数复杂系统,它的形式为 Y 正比于 P ^ beta ,其指数值为 beta ,通常由回归方法确定。噪音的存在使得很难用 β≠1 来判断是否存在非线性行为,我们建议通过调查两个不同大小的系统 P1 和 P2 来规避彼此相关的拟合问题。这使我们定义了一个局部标度指数 βloc ,我们研究它与比率 P2 / P1,并提供某种“断层扫描(tomography scan)”,可以在不同的尺寸比值上进行缩放。这种分析使我们能够评估系统中非线性的相关性,并确定一个有效的指数,使得该指数最小化误差,用于预测 Y 的值。我们在城市的各种真实世界数据集上说明了这种方法,并表明我们的方法在某些情况下强化了标准分析,但也能够在不确定的情况下提供新的见解,并检测缩放形式中的问题,例如缺少单个标度指数或阈值效应的存在。Recursive patterns in online echo chambers http://arxiv.org/abs/1908.11583Emanuele Brugnoli, Matteo Cinelli, Walter Quattrociocchi, Antonio Scala摘要: 尽管社交问题的目的是为了好玩,但的确改变了用户访问信息、辩论和形成意见的方式。事实上,最近的研究表明,在线用户倾向于推广他们喜欢的叙述,从而形成围绕共同信念系统的两极化群体。确认偏见有助于用户是否决定传播内容,从而在可识别的社区内创建信息级联。与此同时,这些社区内有利信息的汇总,加强了选择性接触和群体极化。沿着这条道路,通过彻底的定量分析,我们处理超过1.2M Facebook用户的连接模式,这些用户参与了两个非常矛盾的叙述:科学新闻和阴谋新闻。通过分析这些数据,我们定量研究了确认偏见背后的两种机制(即回避挑战和寻求强化)的作用,它们社交媒体中人类行为的主要驱动因素之一。我们发现避免挑战的机制,触发了两个不同的、极化的用户群(即回声室)的出现,这些用户也倾向于被具有相似信念系统的朋友包围。通过基于网络的方法,我们展示了寻求强化的机制,是如何在用户甚至那些志同道合的用户中,限制邻居的影响、驱动内容的选择和扩散,从而促进在同一回声室内形成高度极化的子簇。最后,我们表明,两极分化的用户通过利用他们志同道合的邻居的活动,来强化他们先前存在的信念,并且这种趋势随着用户参与度的增加而增长,这表明同伴影响是如何支持“寻求强化机制”的。How emotions drive opinion polarization: An agent-based model http://arxiv.org/abs/1908.11623 Frank Schweitzer, Tamas Krivachy, David Garcia摘要: 我们提供基于主体agent的模型来解释集体意见的出现,而不是基于不同意见之间的反馈,而是基于主体之间的情感交互。驱动变量是主体人的情绪状态,情绪状态的特征取决于他们的价态(valence)和觉醒(arousal)。两者都决定了主体的情绪表达,从而产生了集体情感信息。这些信息被以非线性方式反馈给情绪状态和个体意见的动力学。我们推导出情绪互动的关键条件,以获得意见共识或两极分化。基于随机主体的仿真和模型的形式分析,解释了我们的结果。并讨论了验证模型的可能方法。 Fast Algorithms for Intimate-Core Group Search in Weighted Graphshttp://arxiv.org/abs/1908.11788Longxu Sun, Xin Huang, Rong-Hua Li, Jianliang Xu摘要: 寻找依赖于查询的社区搜索已经在各种图上进行了研究。作为社区搜索的一个实例,在加权图上的亲密核心群(intimate-core group)搜索,是找到包含具有最小组权重的所有查询节点的k核(k-core)。然而,现有的最先进的方法从最大的 k-core开始,以改进答案,这对于大型网络来说实际上是低效的。在本文中,我们开发了一个有效的框架,称为局部探索k核搜索(LEKS),以在图中找到亲密核心群。我们提出了一个小加权生成树来连接查询节点,然后逐级将树扩展为连接的 k-core,最终将其细化为一个亲密核心组。我们还为关键节点设计了一种保护机制,以避免 k-core 崩溃。对真实网络的广泛实验验证了我们方法的有效性和效率。Optimal Legislative County Clustering in North Carolinahttp://arxiv.org/abs/1908.11801Daniel Carter, Zach Hunter, Dan Teague, Gregory Herschlag, Jonathan Mattingly摘要: 北卡罗来纳州的法律要求,州立法区不应该分裂成县(country)。但是,必须将各县分开,以符合美国最高法院的“一人一票”的要求。鉴于必须拆分县,北卡罗来纳州立法机构和法院已经提供了指导方针,旨在减少跨地区划分的县,同时也遵守“一人一票”标准。根据这些准则,各县分为若干集群。这项工作的主要目标是根据法院在2015年制定的指导方针,开发、展示和公开发布算法,以优化对县的聚类。我们使用此工具调查2017年重新划分选区过程中,已实施集群的最优性和唯一性。我们验证所制定的聚类集群是否是最佳的,但还发现了其他更好的聚类选择。我们强调,我们提供的工具列出了所有可能的最佳县聚类集群。我们还在探讨了在全州人口不断变化下,聚类的稳定性,并预测在2020/2021年开始的下一个重新划分周期中县聚类集群的情况。On the Ethereum Blockchain Structure: a Complex Networks Theory Perspectivehttp://arxiv.org/abs/1908.11808Stefano Ferretti, Gabriele D’Angelo摘要: 在本文中,我们使用复杂网络建模框架分析以太坊区块链。作用于区块链的账户被表示为节点,而记录在区块链上的这些账户之间的交互行为,被视为网络中的链接。使用这种表示,可以得出有趣的数学特征,以提高对区块链中发生的实际交互的理解。不仅如此,通过回顾区块链的历史,还可以验证区块链演变过程中是否发生了根本变化。 Field theory for recurrent mobility http://arxiv.org/abs/1908.11814Mattia Mazzoli, Alex Molas, Aleix Bassolas, Maxime Lenormand, Pere Colet, Jose J. Ramasco摘要: 了解人员流动对于预测流行病传播、规划交通基础设施和城市化等应用至关重要。传统上,移动信息是通过调查收集的,而移动技术的广泛应用带来了大量(实时)数据。这些信息很容易获取,这打开了研究迄今尚未探索的理论问题的大门。在这项工作中,我们展示了一系列全球城市,每日流量的通勤可以映射到一个表现良好的矢量场,这个矢量场满足高斯散度定理,并且具有无旋转。这个属性允许我们定义该领域的潜力:该领域可以成为确定独立的流动盆地和辨别相邻城市区域的主要工具。我们还表明,经验通量和势可以使用所谓的引力模型很好地再现和分析表征,而介入机会模型对此则无能为力。Making Communities Show Respect for Order http://arxiv.org/abs/1908.11818Vaiva Vasiliauskaite, Tim S. Evans摘要: 在这项工作中,我们提供了一种社区检测算法,在该算法中,社区既尊重有向非循环图的内在顺序,又发现相似节点。我们从文献计量学的经典相似性度量中汲取灵感,用于根据相对引用模式评估两种出版物的相似程度。我们研究了算法在人工模型和实际网络中的性能和反链特性,如引文图和食物网。我们展示了这种分区算法如何区分并将相同来源的节点组合在一起(在引文网络中,起源点是主题或研究领域)。我们在分区算法和标准分层分层工具以及社区检测方法之间进行了比较。证明了我们的算法从标准分层算法中产生了不同的社区。 Efficient limited time reachability estimation in temporal networks http://arxiv.org/abs/1908.11831 Arash Badie Modiri, Márton Karsai, Mikko Kivelä摘要: 时间限制状态描述了在网络顶部发展的若干动力学过程。在流行病传播期间,感染者可能会在一段时间后恢复,在信息传播期间,人们可能会忘记新闻或认为新闻过时了,在旅行路线系统中,乘客可能不会永远等待联系。这些系统可以被描述为有限的等待时间过程,它可以沿着可能的网络路径发展,这些路径由相互作用节点的时间限制状态强烈确定。这对于时间网络尤其重要,其中相互作用的时间尺度是异构的,并且以各种方式相关联。先前的研究已经通过从采样的源集合中找到可达性或通过模拟扩展过程,来研究时间路径的结构。最近提出时间事件图(temporal event graphs)作为时间网络的有效表示,它可以同时映射所有时间相关路径,从而研究它们如何在时间网络结构中形成连接结构。然而,以往分析仅限于时间网络的弱连接组件,这些组件仅仅给出了其物理上重要的输入和输出上限,以确定任何动力学过程的下游结果。在这里,我们提出了一种概率计数算法,该算法可以对时间网络中的每个起始事件即时和精确地估计内部和外部可达性(具有任何选定的等待时间限制)。该方法是可扩展的,允许测量具有数亿个事件的时间网络。这开辟了以全新的方式分析大型含时网络中的可达性、传播过程和其他动力学的可能性;根据所有事件的全局可达性计算中心性;或者以较大概率发现可能导致最大的流行病爆发的确切的节点和时间。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!