通过LSTM历史跟踪进行动力学图嵌入;
- FAIRY:一个理解用户行为及其社交资讯之间关系的框架;
- ColluEagle:利用马尔可夫随机场进行串通审查垃圾检测;
- 当地联盟和竞争塑造基地组织、ISIS和叛乱分子的近重复恐怖活动;
Dynamic Graph Embedding via LSTM History Trackinghttp://arxiv.org/abs/1911.01551Shima Khoshraftar, Sedigheh Mahdavi, Aijun An, Yonggang Hu, Junfeng Liu摘要:许多真实世界的网络都非常大,并且随着时间不断变化。这些动态网络存在于社会网络、交通网络和生物交互等各个领域。为了处理诸如链路预测和异常检测等下游应用中的大型动态网络,将这些网络转移到低维空间是非常必要的。最近,网络嵌入,一种将大的图转换成低维表示的技术,由于其在保存网络结构方面的优势而变得越来越流行。然而,有效的动态网络嵌入还没有得到充分的研究。在本文中,我们提出了一种动态网络嵌入方法,将节点随时间的变化历史集成到节点的当前状态。我们工作的主要贡献是1)结合动态和静态节点信息进行动态网络嵌入2)使用LSTM追踪历史的邻居节点3)使用时间漫步而不是常用的邻接矩阵的方式训练自编码的LSTM模型,从而大大减少了时间和内存。我们在多个领域的应用(如异常检测、链接预测和来自不同领域的数据集中的节点分类)对我们的方法进行了评估。
FAIRY:一个理解用户行为
及其社交资讯之间关系的框架
FAIRY: A Framework for Understanding Relationships between Users’ Actions and their Social Feedshttp://arxiv.org/abs/1908.03109Azin Ghazimatin, Rishiraj Saha Roy, Gerhard Weikum摘要:如今的用户越来越依赖社交媒体来获取推荐信息(例如:新闻、提问、歌曲等)。这些推荐通常是基于用户的社交联系、兴趣和在平台上的行为相互作用。然而,用户行为与推荐之间的关系常常令人费解。许多用户也希望了解推荐的机制。因此,推荐机制的透明性和可解释性成为了其中的关键。这两种特性也是如今认知过载、过滤气泡、用户追踪和隐私风险领域的关键问题。我们在本文提出了一个框架(FAIRY),该框架能系统地发现、排列和解释用户的行为和社交媒中的推荐之间的关系。首先,我们将将用户的本地邻居建模为交互图。这是一种仅由有关用户容易访问的信息构成的异构信息网络。然后,我们将网络中的路径通过一个获取相关性和异构性的学习-排名模型进行评分。最后,我们假设交互图中用户与推荐信息之间的路径既是推荐原因的解释。我们在两个社交平台上的用户研究证明了FAIRY方法的实际可行性和用户收益。Constrained Spectral Clustering for Dynamic Community Detectionhttp://arxiv.org/abs/1911.01475Abdullah Karaaslanli, Selin Aviyente摘要:网络能够很好的表示具有相互作用的实体的系统,例如社会、生物和物理系统。网络科学中的一个重要问题:描述中尺度组织,即社区结构。社区检测的目的是将网络划分为多个节点集,这些节点集内部连接紧密,但与其他密集节点集的连接稀疏。目前的社区检测工作主要集中在静态网络上。然而,现实世界中很多网络都是动态的,即网络的结构和性质会随着时间的变化而变化,这就需要动态的社区检测方法。在本文中,我们提出一种新的随机块模型(SBM)来模拟社区成员的演化。与现有的SBMs不同,我们所提出的模型允许每个社区以不同的速度发展。我们利用该模型推导出了一个最大后验估计量,该后验估计量可表示为一个约束谱聚类问题。特别是,每个社区的转移概率在每个时间点修改图的邻接矩阵。该公式为动态网络的统计网络推理和谱聚类提供了一种关系。我们最终将模型在模拟和真实网络中继续了验证。Engel’s law in the commodity composition of exportshttp://arxiv.org/abs/1911.01568Sung-Gook Choi, Deok-Sun Lee摘要:不同商品部门在生产、贸易和消费中的不同份额说明了资源和资本是如何分配和投资的。经济进步被认为可以普遍地改变份额分配,例如恩格尔家庭支出定律和三部门模式中从初级到制造业和服务业的转变。为了寻找这种相关性的大规模定量证据,我们分析了1962年至2000年间基于标准国际贸易分类(SITC)的国内生产总值(GDP)和国际贸易数据。在SITC的十个类别中,有三个类别的出口份额在国家和时间上与GDP显著相关:机械类为正,食品与原材料类为负相关。商品类别的出口份额与GDP之间存在幂律关系,指数表征了出口份额的GDP弹性。衡量两国在出口组合方面的距离,是为了确定1962年和2000年共有类似组合的几个国家集群。我们发现:在这段时期内,国内生产总值显著增长的国家很可能会转向在机械类中占有较大份额的集群。Adversarial Enhancement for Community Detection in Complex Networkshttp://arxiv.org/abs/1911.01670Jiajun Zhou, Zhi Chen, Min Du, Lihong Chen, Shanqing Yu, Feifei Li, Guanrong Chen, Qi Xuan摘要:社区检测在网络分析中起着重要的作用。然而,它也面临着许多挑战,如对抗性攻击。如何进一步提高真实网络中社区检测的性能和鲁棒性成为人们关注的问题。摘要提出了一种用于社区检测的对抗增强算法,并给出了两种对抗增强算法:一种是基于遗传算法(AE-GA)的对抗增强算法。另一种是基于顶点相似度的对抗增强算法(AE-VS),该算法综合了不同顶点相似度所捕获的群落结构的多种信息,在大规模网络中具有良好的可扩展性。这两种算法与六种现有的社区检测算法一起在四个真实的网络上进行了测试。综合实验结果表明,与两种传统的增强策略相比,我们的方法帮助六种社区检测算法实现了更显著的性能改进。对相应的对抗网络的实验表明,我们的方法可以在一定程度上重建被对抗攻击破坏的网络结构,实现对社区检测欺骗的更强防御。
ColluEagle:利用马尔可夫
随机场进行串通审查垃圾检测
ColluEagle: Collusive review spammer detection using Markov random fieldshttp://arxiv.org/abs/1911.01690Zhuo Wang, Runlong Hu, Qian Chen, Pei Gao, Xiaowei Xu摘要:社区检测在网络分析中起着重要的作用。然而,它也面临着许多挑战,如对抗性攻击。如何进一步提高真实网络中社区检测的性能和鲁棒性成为人们关注的问题。摘要提出了一种用于社区检测的对抗增强算法,并给出了两种对抗增强算法:一种是基于遗传算法(AE-GA)的对抗增强算法。另一种是基于顶点相似度的对抗增强算法(AE-VS),该算法综合了不同顶点相似度所捕获的群落结构的多种信息,在大规模网络中具有良好的可扩展性。这两种算法与六种现有的社区检测算法一起在四个真实的网络上进行了测试。综合实验结果表明,与两种传统的增强策略相比,我们的方法帮助六种社区检测算法实现了更显著的性能改进。对相应的对抗网络的实验表明,我们的方法可以在一定程度上重建被对抗攻击破坏的网络结构,实现对社区检测欺骗的更强防御。Learning to flock through reinforcementhttp://arxiv.org/abs/1911.01697Mihir Durve, Fernando Peruani, Antonio Celani摘要:成群的鸟,成群的鱼,成群的昆虫,都是一个群体的协调运动的例子,它是由许多个体的行为自发地产生的。在此,我们从多智能体强化学习的角度研究群体行为。在这种情况下,一个学习主体试图用它的邻居的速度作为感觉输入来保持与群体的联系。每个学习的个体通过对自己的运动方向施加有限的控制来追求这个目标。通过标准的强化学习算法我们表明:i)学习代理接触到一群老师,即天生的植绒代理,跟着他们学习,和2),在没有老师的情况下,一群独立学习代理的发展对一个国家每个代理知道如何聚集的地方。在两个场景i)和ii)中,紧急策略(或导航策略)都对应于众所周知的Vicsek模型的极坐标速度对准机制。这些结果表明,a)这样的速度自然对齐可能进化适应性行为,旨在最小化邻居的速度损失,和b)证明该联合不仅支持(本地)极地秩序,但最好对应政策/战略保持集团凝聚力感官输入时仅限于邻近代理的速度。简而言之,要想呆在一起,就得一起掌舵。Distance-Based Network Partitioninghttp://arxiv.org/abs/1911.01775Paulo J. P. de Souza, Cesar H. Comin, Luciano da F. Costa摘要:我们提出了一种新的网络社区识别方法。我们首先从网络选取参考节点以便圈定群落。选取方法可以根据网络的先验信息,或者根据相关节点的测量结果。然后,我们使用每个网络节点与参考节点之间的距离向量来定义一个坐标系统。该坐标系统表示网络在许多不同尺度上的社区结构。对于模块化网络,节点在这个空间的分布常常导致一个分离良好的集群结构,每个集群对应一个社区。关于社区发现的报告方法的一个有趣的特性是,由种子定义的坐标系统允许对每个节点相对于考虑的社区的情况进行直观和直接的解释。该方法在社区检测基准、空间网络模型和城市街道网络方面的潜力得到了很好的说明。Statistical Properties of Links of Network: A Survey on the Shipping Lines of Worldwide Marine Transport Networkhttp://arxiv.org/abs/1911.01834Wenjun Zhang, Weibing Deng, Wei Li摘要:近几十年来,网络的节点属性和节点重要性识别得到了广泛的研究。在本文中,我们以世界海洋运输网络(WMTN)为例,分析了网络的链路特性。首先,通过定义航线的饱和度来研究航线的循环特性:结果表明,随着线路长度的增加,线路的饱和性呈指数衰减。其次,为了检测航运线路的地理群落结构,采用了流压缩的标签传播算法(LPAF)和多维尺度变换(MDS)方法,得到了较为一致的群落结构。最后,为了分析不同船舶公司航线的冗余特性,将不同船舶公司的航线进行合并,构建多层网络。可以看到:当随机合并公司时,图上的拓扑结构(平均度、平均聚类系数等等)是平缓地增大的。而根据J-S距离合并公司时(两个节点之间J-S距离最小),熵是相对地减小的。这说明不同海运公司之间的航线冗余度较低。Chinese cities’ air quality pattern and correlationhttp://arxiv.org/abs/1911.01845Wenjun Zhang, Zhanpeng Guan, Jianyao Li, Zhu Su, Weibing Deng, Wei Li摘要:空气质量不仅影响着人们的健康和日常生活,而且影响着敏感的生态系统,甚至制约着一个国家的发展。我们利用复杂网络和时间序列分析的方法,致力于刻画不同城市空气质量的普遍模式、聚类和相关性。为此,我们收集和处理了中国363个城市的气质量指数(AQI)的时间序列数据(2015年1月至2019年3月)。主要研究结果如下:1)利用平面最大过滤图(PMFG)方法构建了中国空气质量网络(AQNC)。通过对不同城市的地理距离对空气质量相关性的研究,发现100公里是强相关性的临界距离。2)发现了AQNC的七社区现象。结合赫斯特指数和气候环境,我们分析了它们的变化规律,发现:七个社区结构合理,受季风、降水、地理区域等气候因素影响显著。3)利用能见度图对7个群落的空气质量时间序列特征进行了研究,发现某些群落的特征演化模式较为稳定,具有长期的记忆效应。而对另一些社区来说,没有稳定的模式。 Implementing Microservices through Microtasks http://arxiv.org/abs/1903.01977Emad Aghayi, Thomas D. LaToza, Paurav Surendra, Seyedmeysam Abolghasemi摘要:微任务编程是编程的一种众包形式,其中实现工作分解为简短、自包含的微任务。每个微任务都提供一个特定目标(例如,编写一个单元测试),以及完成此目标所需所有上下文和环境支持。微任务关键是工作流选择,它描述了微任务开发人员可能完成的任务,以及如何聚合每个微任务的贡献来生成最终的软件产品。但是目前方法要么依赖于单个开发人员手工生成所有微任务,从而限制了潜在可伸缩性,要么要求进行协调,从而限制了效率。受行为驱动开发的启发,我们描述了一种将编程分解为微任务的新工作流,其中每个微任务都涉及到在单个函数中识别、测试、实现和调试单个行为。首先,我们将此方法应用于微服务实现,演示了通过微任务实现微服务第一种方法。然后,为了评估这种方法,我们进行了一项用户研究,其中一小部分人致力于实现简单微服务和测试套件。我们使用行为驱动微任务工作流,发现人群能成功完成350 个微任务并实现13种功能 ,并实现快速机载在不到24分钟内提交第一个微任务,在不到5分钟,贡献新的行为,而共同实现一个功能中微服务只有四个缺陷。最后,我们将讨论这些发现及及将微任务工作合并到开源项目中的影响。 Likelihood-based Inference for Partially Observed Epidemics on Dynamic Networks http://arxiv.org/abs/1910.04221 Fan Bu, Allison E. Aiello, Jason Xu, Alexander Volfovsky摘要: 提出了一种基于动态自适应接触网络的传染病过程生成模型和推理方案。为了描述网络中流行病动态与网络链路变化之间相互作用,将网络演化描述为一个链路-马氏过程,然后将其耦合到一个个体水平随机SIR模型中。首先,我们提出了一种基于马尔可夫链的蒙特卡罗框架,用于基于局部流行观测的概率推理。然后,通过一系列仿真实验,验证了模型有效性和灵活性,以及数据扩充推理方案有效性和高效性。该模型还应用于最近真实世界流感样疾病传播数据集,具有高分辨率的社会接触跟踪记录。 Experiments in Inferring Social Networks of Diffusion http://arxiv.org/abs/1910.04277Daniel Campos, Zoe Konrad摘要: 信息扩散是一个发生在网络上基本过程。虽然观察信息扩散过程中个体间传递很少是现实的,但通常可以观察个体何时首次发布信息。我们特别关注以前发表的NETINF算法,它能在概率上确定最佳网络,从而最好地解释观察到的感染时间。然后,我们探索了该算法如何在一系列本质上不同的社交和信息网络拓扑中执行,包括从新闻博客和网站到Twitter以及Reddit。 The effect of social groups on the dynamics of bi-directional pedestrian flow: a numerical studyhttp://arxiv.org/abs/1910.04337Francesco Zanlungo, Luca Crociani, Zeynep Yücel, Takayuki Kanda摘要: 利用新的计算方法,研究了群对双向流的影响。我们的重点是自组织现象,更具体地说,是人行车道出现所需时间、稳定性以及其对速度-密度关系的影响。此外,我们感兴趣的是了解人群中身体接触的数量。为此,我们使用一种考虑人体不对称形状并描述其在避免碰撞过程中旋转的新模型,并将其与群体行为的数学模型相结合。首先,我们配置几个场景通过改变全球密度ρ的行人和描述百分比比率rg分组来模拟行人。结果表明,群体存在对车速和车道组织有显著影响,对碰撞有显著影响。我们很清楚此方法的局限性,特别是关于(i)在实际数据上避免碰撞时缺少身体旋转的校准(ii)低密度群模型在高密度环境下的直接应用。然而,我们想强调的是,我们并不想说结果重现了组对双向流的实际影响。特别是群体之间冲突更加频繁是非常不容易现实的。尽管如此,我们相信此结果表明了在行人模型中考虑现实群体行为的巨大理论和实践意义,并表明了现实结果可能很难通过简单地添加模块模型来实现。
当地联盟和竞争塑造基地组织、
ISIS和叛乱分子的近重复恐怖活动
Local alliances and rivalries shape near-repeat terror activity of al-Qaeda, ISIS and insurgentshttp://arxiv.org/abs/1910.04349Yao-Li Chuang, Noam Ben-Asher, Maria R. D’Orsogna摘要: 在6个地区中通过对基地组织、ISIS和当地叛乱分子研究,我们研究了恐怖袭击的时空关联性K,-意味着集群应用到全球恐怖主义数据库。所有被调查组织都表现出近乎重复的活动,即之前袭击增加了同一组织在20公里内、平均4到10周内再次发动袭击的可能性。准反应活动,即一个组织的攻击引起另一个组织的进一步攻击,被发现依赖于两者之间的敌对、中立或协作关系。其中在冲突中,当地叛乱分子对全球恐怖组织的袭击反应迅速,而全球恐怖组织则推迟对当地叛乱分子的反应,导致了不对称的动态。当两者为中立或结盟时,一个组织的攻击增强了另一个组织的响应可能性,而与等级无关。这些趋势在所有可获得数据的集群中持续出现。此外,还讨论了政府干预和溢出效应;我们没有发现出价高于对手的证据。了解恐怖主义的区域动态可能对决策和干预设计大有裨益。 Passive network evolution promotes group welfare in complex networkshttp://arxiv.org/abs/1910.04446Ye Ye, Xiao Rong Hang, Jin Ming Koh, Jarosław Adam Miszczak, Kang Hao Cheong, Neng-gang Xie摘要:Parrondo帕隆多悖论是一种反直觉的现象,在这种现象中,各自失败策略(通常被称为博弈a和博弈B)被结合在一起,产生了成功结果。本文采用博弈动力学和网络结构的协同演化方法研究多智能体动力学中的适应性和生存性。该模型包括动作A(表示网络上的重布线过程)和两个分支的游戏B(表示代理之间的重新分配交互)。模拟结果表明,尽管游戏B单独失败,随机混合动作A和游戏B可以产生增强甚至获胜的结果。换句话说,一个parrondo式悖论是可以实现的,但与规范变量不同,激愤来源是被动的网络演化,而不是主动的第二局。最后,我们分析了潜在的矛盾机制,揭示了重新布线的过程推动了拓扑结构从最初规则格向无标度特征的转变,并使利用行为能增强对游戏B有利分支的访问。Local phase transitions in a model of multiplex networks with heterogeneous degrees and inter-layer couplinghttp://arxiv.org/abs/1910.04466 Nedim Bayrakdar, Valerio Gemmetto, Diego Garlaschelli摘要:多层网络表示同一组节点之间的多种连接类型。显然,对一个系统的多层描述只有在多重不只独立层组成情况下才有价值,也就是说,层间重叠是有效的。在真实多路复用系统中,所观察到的重叠,部分可能是由于节点异构而产生的假相关,部分是由真正相互依赖。然而,还没严格方法来分开这两种关系。本文介绍了一种具有可控节点度和可控重叠复用器的无偏最大熵模型。该模型可以映射到一个广义归一化模型,其中节点非均匀性和层间耦合结合导致局部相变的可能性。特别是,我们发现网络中节点异质性增加导致对节点临界点不同,进而导致局部相变,最终可能增加重叠。并且,该模型可以量化如何通过增加网络异质性(假相关)或层间耦合强度(真相关)来增加重叠,从而区分这两种影响。最后,作为一个应用,我们证明了在国际贸易多元结构中的经验重叠不仅是不同层之间节点度相关一个虚假结果,而且在其建模中需要一个非零层间耦合。Maxwells Demon: Controlling Entropy via Discrete Ricci Flow Over Networkshttp://arxiv.org/abs/1910.04560摘要:在这项工作中,我们建议利用离散图Ricci流通过反馈控制来改变网络熵。考虑到这种反馈输入可以逆转熵的变化,我们采用Maxwells Demon绰号来激励我们的方法。特别是最近研究表明,几何中Ricci曲率与Boltzmann熵以及网络功能稳健性,或在随机波动时保持功能能力具有内在联系。由此,离散Ricci流提供了一个自然途径来重新连接一个特定网络,以改善整个几何结构和弹性。因为实际设置哪个有兴趣实施非线性约束,在特定主体理解网络动态演化,从而控制离散瑞奇流可能是必要的(例如,我们可能寻求理解两个网络之间熵的动力学和曲率流,而不是仅仅曲率收缩)。反之,这可以被表述为一个自然控制问题,我们对基于里奇的离散流采用反馈控制,并证明在一定的离散化,即奥利维尔-里奇曲率下,通过李亚普诺夫分析可以显示稳定性。最后,我们总结了初步结果,并对可能的应用作了说明,这些应用将是今后工作的主题。 Optimal percolation in correlated multilayer networks with overlaphttp://arxiv.org/abs/1910.04783Andrea Santoro, Vincenzo Nicosia摘要: 我们证明了多层网络最优渗透集的大小受层间关联度和边缘重叠的影响。我们提供了大量的数值证据来证实,在合成和真实世界相关的多层网络中,最优渗透策略通常不能识别最小渗透集,从而低估了它们的脆弱性。因此,我们提出了一组最优多层渗透的帕累托效率策略,这些策略同时考虑了层内和层间的启发,并且可以很容易地扩展到任意层数的多重网络。最后我们证明,这些策略始终优于现有的攻击算法,提供了有关相互作用
来源:网络科学研究速递
审校:李沁洋、郭治青
编辑:张爽
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧