查看原文
其他

探索数据集选择对衡量国际研究合作的影响 | 网络科学论文速递12篇

The following article is from 网络科学研究速递 Author ComplexLY


心速递


  • 探索数据集选择对衡量国际研究合作的影响 - 以 ACM 数字图书馆和微软学术图谱为例;

  • 基于有限时间知识的信息源检测;

  • 稀疏超图随机块模型中的社区检测;

  • 机器人小组在推特上的政治宣传中扮演的角色;

  • 用于意见形成的 Wright-Fisher 型方程,大时间行为和加权对数- Sobolev 不等式;

  • 社会网络中拒绝疫苗情绪集群的算法检测与分析;

  • 量化深度学习中图和特征的对齐;

  • 二分网络中灭绝引起的社区重组;

  • 超市中的客户流动性和拥挤;

  • STAR-GCN :用于推荐系统的堆叠和重建图卷积网络;

  • 深度对抗社交推荐;

  • 加尔各答 Paise 餐厅问题的相变;




探索数据集选择对衡量国际

研究合作的影响 - 以ACM数

字图书馆和微软学术图谱为例


原文标题:

Exploring the Effects of Data Set Choice on Measuring International Research Collaboration: an Example Using the ACM Digital Library and Microsoft Academic Graph

地址:

http://arxiv.org/abs/1905.12834

作者:

Ba Xuan Nguyen, Markus Luczak-Roesch, Jesse David Dinneen

 

摘要: 国际研究合作(IRC)衡量很重要,因为各国可以并且希望从国际合作中受益,但是对不同的数据集执行相同的测量程序可能会导致不同的结果。本研究旨在探讨数据集选择对 IRC 测量的影响。




基于有限时间

知识的信息源检测


原文标题:

Information Source Detection with Limited Time Knowledge

地址:

http://arxiv.org/abs/1905.12913

作者:

Xuecheng Liu, Luoyi Fu, Bo Jiang, Xiaojun Lin, Xinbing Wang

 

摘要: 本文研究利用网络拓扑和部分时间戳来检测网络中的信息源的问题。由于可能的感染路径的指数数量,该问题在源的规范最大似然估计(MLE)下导致令人望而却步的成本。然而,我们对信息源检测的主要想法是通过基于替代感染路径的估计来近似 MLE,其实质是识别与观察到的时间戳一致的最可能的感染路径。与该感染路径关联的信息源节点被视为估计的源  hatv 。


我们首先研究树形拓扑的情况,通过将基于感染路径的估计器转换为线性整数规划,我们发现缩小的搜索区域显著提高了时间效率。在这个缩小的搜索区域内,估计量v^可以证明总是位于我们称为候选路径的路径上。这个概念使我们能够分析的分布,v^与真实来源之间的误差距离在任意树上,这使我们能够在有限的时间戳内首次获得估算器的文献可证明的性能保证。


具体来说,在具有统一采样时间戳的无限g-调节树上,我们从常量有界的意义上获得了精确的性能保证。凭借时间标记的 BFS 树,估计器在扩展到更一般的图时仍然表现得相当好。合成数据集和真实数据集的实验进一步证明了我们提出的算法的优越性能。





稀疏超图随机块

模型中的社区检测


原文标题:

Community Detection in the Sparse Hypergraph Stochastic Block Model

地址:

http://arxiv.org/abs/1904.05981

作者:

Soumik Pal, Yizhe Zhu

 

摘要: 稀疏随机超图中的社区检测一直是个问题。 Angelini 等人。 (2015)推测由超图随机块模型(HSBM)生成的稀疏超图中的社区检测模型参数存在尖锐阈值。我们在两个块的情况下解决了猜想的正面部分:在阈值之上,存在一种谱渐近地确定构造与真实分区相关的超图的分区的谱算法。我们的方法是对 Massouli ‘e(2014)为稀疏随机图开发的方法的随机超图的推广。

 



社交机器人小组在推特

上的政治宣传中扮演的角色


原文标题:

The role of bot squads in the political propaganda on Twitter

地址:

http://arxiv.org/abs/1905.12687

作者:

Guido Caldarelli, Rocco De Nicola, Fabio Del Vigna, Marinella Petrocchi, Fabio Saracco

 

摘要: 社交媒体如今是信息传播和新闻检查的特权渠道。出乎意料的是,对于大多数用户而言,自动帐户(也称为社交机器人)对这一新闻传播过程的贡献越来越大。使用 Twitter 作为基准,我们考虑通过一个月的观察,就特定主题交换的流量,即从北非到意大利的迁移流量。


我们通过实施基于熵的空模型来衡量推文的重要流量,该模型对用户的活动和推文的病毒性进行折扣。结果表明,社交机器人在重要内容的交换中发挥着核心作用。事实上,不仅最强大的中心在他们的追随者中有许多机器人高于预期,而且其中一组可以分配给相同的政治倾向的机器人共享一组共同的机器人作为追随者。这种自动帐户的重新启动活动放大了集线器消息在平台上的存在。


 


用于意见形成,大时间行为

和加权对数-Sobolev不等

式的Wright-Fisher型方程


原文标题:

Wright-Fisher-type equations for opinion formation, large time behavior and weighted logarithmic-Sobolev inequalities

地址:

http://arxiv.org/abs/1905.12901

作者:

Giulia Furioli, Ada Pulvirenti, Elide Terraneo, Giuseppe Toscani


摘要: 我们研究了2006年作者之一介绍的 Fokker-Planck 型方程解的收敛速度,以描述多智能体系统中的意见形成。这个 Fokker-Planck 方程的主要特征是存在可变扩散系数和边界,这在其长期行为的研究中引入了新的具有挑战性的数学问题。

 



社会网络中拒绝疫苗情

绪集群的算法检测与分析


原文标题:

Algorithmic Detection and Analysis of Vaccine-Denialist Sentiment Clusters in Social Networks

地址:

http://arxiv.org/abs/1905.12908

作者:

Bjarke Mønsted, Sune Lehmann

 

摘要: 世界上许多地区的疫苗接种率正在下降,可预防疾病的爆发往往发生在特别低的地区。许多研究致力于提高我们对疫苗接种决策背后动机的理解以及为怀疑论者提供的各种信息的影响,没有对在线疫苗接种话语结构进行大规模研究。在这里,我们提供了一种在线系统中定量研究疫苗话语的方法,以 Twitter 为例。


我们训练深度神经网络来预测推特疫苗情绪,超越最先进的性能,达到 90.4 %的两级精度,以及 0.762  的三级 F1。我们确定能够持续产生强烈抗疫苗和疫苗接种含量的特征。我们发现,强烈的抗疫苗配置文件会在 Youtube 上发布链接,以及通过销售替代性健康产品赚钱的商业网站,这代表了利益冲突。我们还可以看到疫苗话语中参与者反复相互作用的网络,并发现它是高度分层的,其共同系数为 r = .813 。

 


 

量化深度学习中图和特征的对齐


原文标题:

Quantifying the alignment of graph and features in deep learning

地址:

http://arxiv.org/abs/1905.12921

作者:

Yifan Qian, Paul Expert, Tom Rieu, Pietro Panzarasa, Mauricio Barahona

 

摘要: 我们证明了图卷积网络的分类性能与特征,图和地面实况之间的对齐有关,我们使用对应于与特征相关的三个子空间之间的成对弦距离矩阵的 Frobenius 范数的子空间对齐度量来量化,图和基本事实。所提出的测量基于子空间之间的主角,并且具有谱和几何解释。我们通过研究图卷积网络的限制案例以及应用于建设性实例和不同来源的引文网络的几个特征和图结构的系统随机化,展示了子空间对齐度量与分类性能之间的关系。该分析还揭示了图表和特征对于分类目的的相对重要性。

 


二分网络中灭绝引起的社区重组


原文标题:

Extinction-induced community reorganization in bipartite networks

地址:

http://arxiv.org/abs/1905.13007

作者:

Somaye Sheykhali, Juan Fernández-Gracia, Anna Traveset, Víctor M. Eguíluz

 

摘要: 我们研究了二分互惠网络的社区结构如何在动态环境中发生变化。首先,我们考虑一个真正的共生网络,并根据几种情况介绍灭绝事件。我们将灭绝建模为节点或交互移除。对于节点移除,我们考虑随机,有向和连续消亡;为了消除交互,我们考虑随机灭绝。


二分网络重组表明,随着灭绝事件数量的增加,有效模块化的增加和原始物种社群持久性的迅速下降。其次,我们将真实共生网络中的灭绝与二分网络模型的增长进行比较。模块化达到固定值,节点在加入网络后仍保留在同一社区中。我们的结果表明扰动和破坏性事件影响中尺度水平的互惠网络的连通模式。在某些情景中观察到的有效模块化的增加可以为剩余的生态系统提供一些保护。

 



超市中的客户流动性和拥挤


原文标题:

Customer mobility and congestion in supermarkets

地址:

http://arxiv.org/abs/1905.13098

作者:

Fabian Ying, Alisdair O. G. Wallis, Mariano Beguerisse-Díaz, Mason A. Porter, Sam D. Howison

 

摘要: 使用人口级移动模型对人员移动性进行分析和表征对于众多应用非常重要,从通勤流量估算到模拟贸易流量。然而,几乎所有这些应用都集中在大空间尺度上,通常从城市内到国家间。在本文中,我们通过使用它们来估计超市区域之间的客户移动流量,在更小的空间尺度上调查人口级人类移动模型。


我们使用超市中客户的匿名移动数据来校准我们的模型,并应用重力和干预机会模型的变体以适应此移动流量并估计未见数据的流量。我们发现,双约束引力模型和扩展辐射模型(干预机会模型的变体)可以成功地估计超市内65-70%的流量。使用引力模型作为案例研究,我们然后研究如何使用移动模型减少超市中的拥塞。我们将每个超市区域模型化为队列;我们使用引力模型来识别低拥塞的商店布局,我们通过对区域的最大访问次数或总平均队列大小来衡量。


然后,我们使用模拟退火算法来查找具有比原始布局更低拥塞的商店布局。在这些优化的商店布局中,流行区域通常位于商店的周边。我们的研究可以深入了解客户如何在超市中移动,以及零售商如何安排商店以减少拥堵。它还提供了一个小空间尺度上人类流动性的案例研究。




STAR-GCN:用于推荐系

统的堆叠和重建图卷积网络


原文标题:

STAR-GCN: Stacked and Reconstructed Graph Convolutional Networks for Recommender Systems

地址:

http://arxiv.org/abs/1905.13129

作者:

Jiani Zhang, Xingjian Shi, Shenglin Zhao, Irwin King

 

摘要: 我们提出了一种新的 STAcked 和 Reconstructed Graph Convolutional Networks(STAR-GCN)架构来学习节点表示,以提高推荐系统的性能,特别是在冷启动场景中。 STAR-GCN 采用一堆 GCN 编码器 - 解码器与中间监控相结合,以提高最终预测性能。与具有单热编码节点输入的图卷积矩阵完成模型不同,我们的 STAR-GCN 学习低维用户和项目潜在因素作为约束模型空间复杂度的输入。


此外,我们的 STAR-GCN 可以通过重建屏蔽输入节点嵌入来为新节点生成节点嵌入,从根本上解决了冷启动问题。此外,我们在培训基于 GCN 的链路预测任务模型时发现了标签泄漏问题,并提出了一个避免该问题的培训策略。多个评级预测基准的实证结果表明,我们的模型在五个真实世界数据集中的四个中实现了最先进的性能,并且在冷启动场景中预测评级方面有显著改进。

 


深度对抗社交推荐技术


原文标题:

Deep Adversarial Social Recommendation

地址:

http://arxiv.org/abs/1905.13160

作者:

Wenqi Fan, Tyler Derr, Yao Ma, Jianping Wang, Jiliang Tang, Qing Li

 

摘要: 近年来,由于社会网络对我们日常生活的影响越来越大,社会推荐技术在改善推荐系统性能方面取得了快速发展。大多数现有的社交推荐方法统一了用户-项目交互(项目领域)和用户-用户连接(社交领域)的用户表示。然而,它可能限制每个相应域中的用户表示学习,因为用户在两个域中表现和交互不同,这使得它们的表示是异构的。


此外,大多数传统推荐系统无法有效地优化这些目标,因为它们利用负采样技术,该技术无法在优化过程中为培训提供足够的信息指导。在本文中,为了解决上述挑战,我们提出了一种新颖的深层对抗性社会推荐框架 DASO。它采用双向映射方法,通过对抗性学习在社交域和项目域之间传递用户信息。对两个真实世界数据集的综合实验表明了拟议框架的有效性。



Kolkata Paise Restaurant

问题的相变


原文标题:

Phase Transition in the Kolkata Paise Restaurant problem

地址:

http://arxiv.org/abs/1905.13206

作者:

Antika Sinha, Bikas K. Chakrabarti

 

摘要: 在Kolkata Paise Restaurant问题中观察到一种新颖的相变行为,其中大量( N )的单体或客户或客户共同(并且反复地)学会在 N 个未经约束的餐馆中进行选择,在那里她将在那个晚上和那天晚上会有那里唯一可用的菜(如果当晚有多个顾客到达那里,可能会被随机选择)。玩家演变他们的策略,以便可以利用关于不同餐馆中过去人群的公开可用信息,并且每个人都能够做出最好的少数选择。按照上面指出的避免人群策略,每个 个数的单体在(t-1)个晚上到达第i个餐厅晚上回到相同的第i个餐厅,权重为,其他餐厅的权重为 1 /(N-1)。


我们研究稳态(t-independent的)利用率函数我们发现, ,和和收敛时间独立于随    而变化,并且  。t的波动也增长为 ,同时



来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


复杂网络中的嵌套性:观察、涌现和启示 等23篇

什么是社会组织的熵?等8篇

全球不同地区Facebook用户统计特征差异 等18篇

人们会信任什么样的线上社交团体? 等20篇

限制在线社会网络应用程序的隐私泄漏 等11篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存