查看原文
其他

数据驱动的计算社会科学研究综述 | 网络科学论文速递11篇

集智斑图 集智俱乐部 2022-04-08
集智斑图最新论文栏目,关注复杂系统、网络科学、计算社会科学、统计物理等领域的前沿进展,每天即时更新相关顶刊论文,和最新arXiv预印本论文。



本文是对近期arXiv论文的汇总编译(by 彩云小译)。更多最新论文,请扫二维码获取。

核心速递

  • 数据驱动的计算社会科学研究综述;

  • 因果毯: 理论与算法框架;

  • 演化亚稳系统的记录动力学: 理论与应用;

  • 交互式可视化技术在大屏幕动态图时间导航中的有效性;

  • 现实世界超级图的演变: 没有预言的模式和模型;

  • 自组织映射协助的深度自编码高斯混合模型入侵检测;

  • 基于块环链的社会媒体平台上发帖机器人的机器学习检测;

  • 符号有向网络的解耦变分嵌入;

  • 利用防火墙控制新冠肺炎暴发;

  • 经济犯罪的复杂性科学研究;

  • 从优化啮合到测量价值;



数据驱动的

计算社会科学研究综述


原文标题:

Data-driven Computational Social Science: A Survey

地址:

https://arxiv.org/abs/2008.12372

作者:

Jun Zhang,Wei Wang,Feng Xia,Yu-Ru Lin,Hanghang Tong


摘要:社会科学关注个人、关系和整个社会的问题。社会科学研究课题的复杂性使其成为经济学、政治学、社会学等多学科的融合。几个世纪以来,科学家进行了许多研究,以了解社会的机制。然而,由于传统研究方法的局限性,还存在着许多亟待探索的社会问题。随着计算技术的飞速发展和社会科学研究的深入,计算社会科学应运而生。借助于先进的研究技术,现在可以获得来自不同领域的各种数据,它们可以帮助我们用新的眼光看待社会问题。因此,利用各种数据揭示计算社会科学领域的问题越来越受到人们的重视。在本文中,尽我们所知,我们提出了一个调查数据驱动的计算社会科学的第一次,主要侧重于审查涉及人类动力学的应用领域。从个体、关系和集体三个方面综述了人类动力学的研究现状。具体来说,研究方法用于解决上述应用领域的研究挑战进行了总结。此外,一些重要的开放挑战方面的新兴研究课题和研究方法进行了讨论。



因果毯: 理论与算法框架


原文标题:

Causal blankets: Theory and algorithmic framework

地址:

https://arxiv.org/abs/2008.12568

作者:

Fernando E. Rosas,Pedro A. M. Mediano,Martin Biehl,Shamil Chandaria,Daniel Polani


摘要:我们引入了一个新的框架来识别知觉-行动循环(palo) ,直接从数据基于计算力学的原则。我们的方法是基于因果关系的概念,它捕获作为动态充分统计的感官和活动变量,即作为“差异,使差异”。此外,我们的理论提供了一个广泛适用的程序,以构造不需要稳态或马尔可夫动力学。利用我们的理论,我们证明了每一个二部随机过程都有一个因果关系的毯子,但是这在多大程度上导致了一个有效的 PALO 公式,这取决于二部分的综合信息。



演化亚稳系统的记录动力学: 

理论与应用


原文标题:

Record dynamics of evolving metastable systems: theory and applications

https://arxiv.org/abs/2008.12684

作者:

Paolo Sibani,Stefan Boettcher,Henrik Jeldtoft Jensen


摘要:录动力学(RD)处理通过一系列亚稳态阶段进化的复杂系统。这些都是宏观上可以区分的,并且看起来是静止的,除了突然而迅速的变化,称为地震,它们引起从一个阶段到下一个阶段的转变。这种现象学在物理学中被称为“物理老化” ,但是从 RD 的优势观点来看,一类物理、生物和文化起源的系统的进化植根于一个等级结构的位形空间,因此可以用类似的统计工具进行分析。本次座谈会文件力求以一种连贯的方式介绍随着时间的推移逐渐演变的方法和想法。为此,本文首先描述了 RD 和复动力学、自组织临界性和连续时间随机游动这两种广泛使用的范式之间的异同。然后概述了白噪声时间序列中记录事件的泊松性质,并将其与亚稳态等级系统中地震的统计联系起来,认为地震的松弛效应一般可以用与临界无关的幂定律来描述。几种不同的研发应用已经开发了多年。其中,反映地震动力学的对数时间均匀性的基本 RD 假说,可以在给定的上下文中得到经验验证。讨论部分对论文进行了总结,并简要介绍了未详细讨论的应用。最后,展望指出了可能的改进和 RG 可能有用的新的研究领域。



交互式可视化技术在大屏幕

动态图时间导航中的有效性


原文标题:

The Effectiveness of Interactive Visualization Techniques for Time Navigation of Dynamic Graphs on Large Displays

地址:

https://arxiv.org/abs/2008.12747

作者:

Alexandra Lee,Daniel Archambault,Miguel A. Nacenta


摘要:动态网络在视觉上很难分析,特别是在新的节点和边缘出现和消失的时间跨度很大的情况下。虽然为可视化提供表示网络多个状态(即多个时间片)的接口(例如,通过小倍数)或交互式(例如,通过交互式动画)很简单,但这些接口可能不支持需要比较不相交时间片的任务。因为这些任务是理解网络动态方面的关键,所以理解哪种交互式可视化最好地支持这些任务非常重要。我们提出了一系列实验室实验的结果,比较两种传统的方法(小倍数和交互式动画) ,与更新的方法基于交互式分时。这些任务通过一个触摸界面在一个大屏幕上完成。参与者用所有的技巧完成了三项任务的24次试验。结果表明,交互式时间分割在时间上比较距离较远的点时效果较好,但在分析连续时间间隔时效果较差。



现实世界超级图的演变: 

没有预言的模式和模型


原文标题:

Evolution of Real-world Hypergraphs: Patterns and Models without Oracles

地址:

https://arxiv.org/abs/2008.12729

作者:

Yunbum Kook,Jihoon Ko,Kijung Shin


摘要:在现实世界的超图中,我们可以观察到什么样的宏观结构和动力学模式?除了表面上的随机进化,还有什么潜在的个体局部动力学最终导致了所观察到的模式?图表提供了表示实体之间成对交互的有效方法,但它无法表示群体交互(例如,三个或更多研究人员的协作等)。作为图的推广,允许不同大小的边的超图在解决这一限制方面取得了很好的效果。然而,随着复杂性的增加,要想像图一样彻底地理解超图是很有挑战性的。在这项工作中,我们仔细研究了来自六个域的实超图的七个结构和动力学性质。为此,我们定义了新的度量标准,将通用图性质的概念扩展到超图,并通过与零模型和统计检验的比较来评估观察到的模式的重要性。我们还提出了 textsc { HyperFF } ,一个生成真实超图的随机模型。它的优点有三个方面: (a)强调{ Realistic: }它成功地复制了所有七种模式,除了以前研究中建立的五种模式之外,(b)强调{ Self-contained: }与以前提出的模型不同,它根本不依赖于神谕(即无法解释的外部信息) ,它只用两个标量进行参数化,(c)强调{ Emergent: }它依赖于单个实体的简单的解释机制,这些机制不是很普遍地执行,但令人惊讶地导致了宏观属性。



自组织映射协助的

深度自编码高斯混合模型入侵检测


原文标题:

Self-Organizing Map assisted Deep Autoencoding Gaussian Mixture Model for Intrusion Detection

地址:

https://arxiv.org/abs/2008.12686

作者:

Yang Chen,Nami Ashizawa,Seanglidet Yean,Chai Kiat Yeo,Naoto Yanai


摘要:在信息时代,一个安全稳定的网络环境是必不可少的,因此入侵检测对于任何网络都是至关重要的。在本文中,我们提出了一种自组织映射辅助的深度自动编码高斯混合模型(SOMDAGMM) ,并辅以保存完好的输入空间拓扑,以提高网络入侵检测的准确性。深度自编码高斯混合模型包括一个压缩网络和一个能够进行无监督联合训练的估计网络。然而,自动编码器生成的码在保持输入空间拓扑结构方面存在不足,这是由于所采用的深层结构的瓶颈所致。为了解决这个问题,已经引入了一个自组织映射数据库来构建 SOMDAGMM。通过在两个数据集上进行的大量实验证明了所提出的 SOM-DAGMM 算法的优越性。实验结果表明,SOM-DAGMM 在所有测试中都优于现有的 DAGMM,F1分数提高了15.58% ,稳定性也更好。



基于块环链的社会媒体平台上

发帖机器人的机器学习检测


原文标题:

Posting Bot Detection on Blockchain-based Social Media Platform using Machine Learning Techniques

地址:

https://arxiv.org/abs/2008.12471

作者:

Taehyun Kim,Hyomin Shin,Hyung Ju Hwang,Seungwon Jeong


摘要:Steemit 是一个基于块环链的社交媒体平台,如果作者的帖子被追加,他们在这里可以得到作者奖励的加密货币的形式称为 STEEM 和 SBD (STEEM 块环链美元) 。有趣的是,策展人(或投票人)也可以通过投票别人的帖子来获得奖励,这被称为策展奖励。奖励与馆长的 STEEM 筹码成正比。在整个过程中,Steemit 希望“好的”内容能够被用户以一种分散的方式自动发现,这种方式被称为大脑证明(Proof-of-Brain,PoB)。然而,有许多机器人账户被设定为自动发帖并获得奖励,这阻碍了真正的人类用户创造好的内容。我们将这种类型的 bot 称为 posting bot。虽然有许多论文研究了传统的集中式社交媒体平台上的机器人,如 Facebook 和 Twitter,但我们是第一个研究在基于区块链的社交媒体平台上发布机器人的人。与通常的社交媒体平台上的僵尸检测相比,我们创建的这些特性有一个优势,即僵尸的发布可以被检测到,而无需限制发布的数量或长度。我们可以通过对博客数据或回复之间的距离进行聚类来提取文章的特征。这些特征是从最小平均聚类算法(MAC-CDFA)中获得的,该算法在以往的社会媒体研究中都没有使用。在丰富特征的基础上,提高了分类任务的质量。通过比较 f1得分,我们创建的特性比 Facebook 和 Twitter 上用于检测僵尸的特性性能更好。



符号有向网络的解耦变分嵌入


原文标题:

Decoupled Variational Embedding for Signed Directed Networks

地址:

https://arxiv.org/abs/2008.12450

作者:

Xu Chen,Jiangchao Yao,Maosen Li,Ya zhang,Yanfeng Wang


摘要:在链路符号预测、节点分类和节点推荐等实际应用中,有向签名网络的节点表示学习受到了广泛的关注。挑战在于如何对网络中复杂的拓扑信息进行充分的编码。目前的研究主要集中在保持节点间的一阶网络拓扑上,它表示节点间的亲密关系。然而,这些方法通常不能捕捉到高阶拓扑结构,而高阶拓扑结构表明了节点的局部结构,并且是网络拓扑的一个基本特征。此外,对于一阶拓扑,不存在的链接的附加值在很大程度上被忽略。在本文中,我们提出通过同时捕获符号有向网络中的一阶和高阶拓扑来学习更具代表性的节点嵌入。特别地,我们从变分自动编码的角度重新描述了符号有向网络的表示学习问题,并进一步发展了解耦变分嵌入(DVE)方法。DVE 利用一种特殊设计的自动编码器结构来捕获符号有向网络的一阶和高阶拓扑,从而学习更具代表性的节点嵌入。在三个广泛使用的真实世界数据集上进行了大量的实验。链路标识预测和节点推荐任务的综合结果验证了 DVE 的有效性。定性的结果和分析也提供了更好的理解分布式虚拟环境。



利用防火墙控制新冠肺炎暴发


原文标题:

Containing COVID-19 outbreaks using a Firewall

地址:

https://arxiv.org/abs/2008.12636

作者:

Ezequiel Alvarez,Leandro Da Rold,Federico Lamagna,Manuel Szewc


摘要:新型冠状病毒肺炎疫情在蔓延之前很难被隔离和扑灭。这背后的一个重要原因可能是,由于发病前的传染时间、轻微病例和/或无症状携带者,阻止有症状人群的流行病学障碍很可能失败。基于这些特殊的新型冠状病毒肺炎特征,我们研究了一个方案来控制疫情在城市中的暴发,这个方案包括在疫情和城市其他地方之间增加一个额外的防火墙。我们实现了一个随机噪声耦合房室模型来模拟局部隔离的疾病暴发,并分析了不同合理模型参数下有无防火墙时的演化。我们探讨了如果流行病演变引发不同区域的通量和/或锁定政策变化,如何能够实现进一步的改进。我们的研究结果表明,仅仅是在疫情暴发和城市大部分地区之间增加一个额外的街区,就可以获得实质性的改善。



经济犯罪的复杂性科学研究


原文标题:

Complexity science approach to economic crime

地址:

https://arxiv.org/abs/2008.12364

作者:

János Kertész,Johannes Wachs


摘要:在这篇评论中,我们讨论了复杂性科学和网络科学在识别和描述诸如欺诈和腐败等经济不当行为的隐藏痕迹方面是多么的有用。



从优化啮合到测量价值


原文标题:

From Optimizing Engagement to Measuring Value

地址:

https://arxiv.org/abs/2008.12623

作者:

Smitha Milli,Luca Belli,Moritz Hardt


摘要:现在大多数的推荐引擎都是基于预测用户的参与度,例如预测用户是否会点击一个项目。然而,在参与信号和值得优化的期望“价值”概念之间可能存在巨大差距。我们使用测量理论的框架来(a)面对设计者关于设计者价值的规范性问题,(b)提供一个通用的潜在变量模型方法,可用于操作化目标结构并直接为其进行优化,(c)指导设计者评估和修改他们的操作主义。我们在数百万用户的 Twitter 平台上实施我们的方法。根据已建立的评估测量有效性的方法,我们对我们的模型捕获期望的“价值”概念的能力进行定性评估。


来源:集智斑图
编辑:王建萍



复杂系统前沿文献交流群


如果你经常关注复杂系统和跨学科研究进展,是网络论文速递栏目的长期读者,欢迎扫描集智小助手,向我们反馈你的需求。欢迎提出宝贵意见,我们一起来探索追踪前沿进展的更好方式。


参与论文速递用户调研后,我们将邀请你加入集智的科研文献交流群。



近期网络科学论文速递


以貌取人: 面部知觉对社交网络中心性的影响 | 网络科学论文速递18篇

基于自注意机制的有向网络时间链路预测 | 网络科学论文速递25篇

社交网络越复杂故事越好讲:对中国历史和小说文本的实证研究 | 网络科学论文速递12篇

隐私情报: 在线社交网络图片共享研究综述 | 网络科学论文速递13篇

在线活动与物理环境联合建模提高游客行为预测能力 | 网络科学论文速递13篇

加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆


搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!


👇点击“阅读原文”,了解更多最新arxiv论文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存