查看原文
其他

全球不同地区Facebook用户的统计特征差异 | 网络科学论文速递18篇


心速递


  • 全球不同地区Facebook用户的统计特征差异;

  • 从流中学习保守网络;

  • 人类接触网络的性质不断变化及其对流行病过程的影响;

  • 依赖边的顶点权重的超图上的随机游走;

  • 从社交媒体来源获取高速流图;

  • 复杂网络中恢复的持久阈值动态;

  • 最大异配网络上的渗流;

  • 树状时态网络中的并发性和可达性;

    • 内容与结构融合的通用多层网络数据分析;

    • 量化新颖性和影响力,以及范式转换的模式;

    • 社交媒体流简单有效早期抑郁检测的文本分类框架;

      • 数据合作社:迈向分布式的个人数据管理基础;

      • IdeoTrace :意识形态追踪框架与2016年美国总统选举案例研究;

      • 环中的分布式模式形成;

      • 平面双曲流形上链接渗流的重整化群;

      • 模拟与增强用于构建深度学习模型的社会网络;

      • 从动态观测中盲辨识随机块模型;

      • 多层网络信息传播的最佳层间结构;



        全球不同地区 Facebook

        用户的统计特征差异


        原文标题: 

        Demographic Differentials in Facebook Usage Around the World

        地址: 

        http://arxiv.org/abs/1905.09105

        作者: 

        Sofia Gil-Clavel, Emilio Zagheni


        摘要: 我们使用来自 Facebook 广告平台的数据来研究各国使用 Facebook 时的人口差异模式。我们提出了三个主要问题:(1)Facebook 的使用情况如何因世界各地的年龄和性别而异? (2)友谊网络的规模如何因年龄和性别而异? (3)  Facebook 用户的特定子群的人口统计特征是什么?我们发现,在北美和北欧的国家,Facebook 使用模式在老年人和年轻人之间差异很小。


        在性别不平等程度较高的亚洲国家,按性别划分的 Facebook 采用率的差异在年龄较大时消失,这可能是由于选择性的原因。我们还观察到,在不同的国家,女性往往拥有比男性更多的亲密朋友网络,而且远离家乡的女性用户比男性用户更有可能从事 Facebook 使用,无论其地区和年龄组如何。我们的研究结果将近期关于在线使用中性别差异的研究进行了背景化,并对采用和使用数字技术时人口差异的一些细微差别提供了新的见解。




        从流中学习保守网络


        原文标题: 

        Learning Conserved Networks from Flows

        地址: 

        http://arxiv.org/abs/1905.08716

        作者: 

        Satya Jayadev P., Shankar Narasimhan, Nirav Bhatt



        摘要: 网络重建问题是网络科学中的一个挑战性问题。这项工作涉及重建网络,其中流在节点周围得到保存。这些网络称为保守网络。我们提出了一种用于描述守恒网络的保守图的新概念。研究了守恒图的性质。我们开发了一种方法,通过将这些图特性与学习技术相结合,利用多项式时间复杂度,从流中重建保守网络。我们表明,径向网络可以进行精确的网络重建。此外,我们扩展了从噪声数据重建网络的方法。我们在不同类型的径向网络上演示了所提出的方法。




        人类接触网络的性质不断变

        化及其对流行病过程的影响


        原文标题: 

        Evolving nature of human contact networks with its impact on epidemic processes

        地址: 

        http://arxiv.org/abs/1905.08525

        作者: 

        Cong Li, Jing Li, Xiang Li


        摘要: 人际接触网络由众多个体和它们之间的成对联系构成。然而,尚不知道产生接触模式的人类接触网络演变的动态性质。在这里,我们分析了三个经验数据集,并确定了时间人类接触网络演变的两个关键机制,即个人社会活跃的活动状态转换法,以及活跃个体采用的联系建立机制。我们考虑两种机制来提出人类接触网络的时间网络模型,称为记忆驱动(MD)模型。


        然后,我们研究了经验人类接触网络和四个相应的时间网络模型上的易感染(SI)传播过程,并将SI过程的完全流行时间与网络上的各种感染率进行比较。 MD 模型中 SI 过程的完全流行时间与现实世界人类接触网络中的相同。此外,我们发现个体活动状态转变促进了传播过程,而活跃个体的接触建立抑制了普遍性。


        除此之外,我们观察到,即使只有一小部分人探索新的社会关系,也能够在网络上引发爆炸性的传播。建议的时间网络框架可以帮助进一步研究时间人类接触网络中的动态过程,并提供新的见解来预测和控制网络上的扩散过程。



        依赖边的顶点权重

        的超图上的随机游走


        原文标题: 

        Random Walks on Hypergraphs with Edge-Dependent Vertex Weights

        地址: 

        http://arxiv.org/abs/1905.08287

        作者: 

        Uthsav Chitra, Benjamin J Raphael


        摘要: 超图在机器学习中用于模拟数据中的高阶关系。虽然图的谱方法已经很成熟,但超图的谱理论仍然是一个活跃的研究领域。在本文中,我们使用随机游走来开发具有依赖于边的顶点权重的超图的谱理论:超图,其中每个顶点 v 具有权重  ,用于描述对每个超边贡献的 v 到超边 e 。


        我们推导出一个随机的基于步行的超图拉普拉斯算子,并限制了这种超图上随机游走的混合时间。此外,我们给出了这样的条件,在这些条件下,这些超图上的随机行走等同于图上的随机行走。作为推论,我们表明当前的机器学习方法依赖于拉普拉斯算子,该拉普拉斯算子来自在具有边无关顶点权重的超图上的随机游走,而不利用数据中的高阶关系。最后,我们使用真实世界的数据集来展示具有依赖于边的顶点权重的超图的优势。



        从社交媒体来源获取高速流图


        原文标题: 

        Ingesting High-Velocity Streaming Graphs from Social Media Sources

        地址: 

        http://arxiv.org/abs/1905.08337

        作者: 

        Subhasis Dasgupta, Aditya Bagchi, Amarnath Gupta


        摘要: 许多数据科学应用程序(如社会网络分析)使用图作为其主要数据形式。但是,从社交媒体获取图结构数据会带来一些有趣的挑战。第一个挑战是社交媒体数据的高数据速度和突发性质。第二个挑战是数据的复杂性使得摄取过程变得昂贵。如果我们想将流图数据存储在图数据库中,我们将面临第三个挑战 - 数据库通常无法维持高速,高突发数据的摄取。


        我们开发了一种自适应缓冲机制和一种图压缩技术,可以有效地缓解这一问题。我们方法的一个新方面是自适应缓冲算法使用数据速率,数据内容以及数据库机器的   CPU 资源来确定最佳数据摄取机制。我们进一步表明,摄取含时图压缩策略可以提高数据摄取数据的效率。我们通过大量实验验证了摄取优化策略的有效性。



        复杂网络中恢复的持久阈值动态


        原文标题: 

        Persistent Threshold Dynamics with Recovery in Complex Networks

        地址: 

        http://arxiv.org/abs/1905.08358

        作者: 

        Nanxin Wei, Bo Fan


        摘要: 二进制状态网络中的扩展阈值规则导致级联。我们研究了准鲁棒网络上的持续级联恢复动态,即对小触发器具有鲁棒性但对于较大触发器可能会崩溃的网络。据观察,根据触发和恢复的相对速率,网络属于两个动态阶段之一:崩溃或活动阶段。我们设计了一个分析框架,不仅表征了关键行为,而且表征了两个阶段中网络活动的时间演变。基于单体的仿真结果与分析计算结果吻合良好,表明我们的方法对复杂网络中的持续级联动态具有很强的预测能力。



        最大异配网络上的渗流


        原文标题: 

        Percolation on a maximally disassortative network

        地址: 

        http://arxiv.org/abs/1905.08466

        作者: 

        Shogo Mizutaka, Takehisa Hasegawa


        摘要: 我们提出了一种最大不协调(MD)网络模型,它实现了最大负度相关性,并研究其渗透过渡,以讨论强度相关性对渗透临界行为的影响。使用二分网络的生成函数方法,我们分析地推导出逾渗阈值和临界指数。对于 MD 分度网络,其度分布为  ,我们表明 MD 网络和相应的不相关网络的关键性对于γ>3 是相同的但是  2<γ<3不同。强度-度相关性显著影响重尾无标度网络中的渗流临界行为。我们对关键指数的分析结果通过有限大小的尺度参数在数值上得到证实。



        树状时态网络中的并发性和可达性


        原文标题: 

        Concurrency and reachability in tree-like temporal networks

        地址: 

        http://arxiv.org/abs/1905.08580

        作者: 

        Eun Lee, Scott Emmons, Ryan Gibson, James Moody, Peter J. Mucha


        摘要: 网络属性控制着各种传播过程的速度和程度,从简单的传染到复杂的级联。最近,对扩展过程的分析已从静态网络扩展到时间网络,其中节点和链接出现和消失。我们关注“可访问性”的影响,无论是从一个节点到另一个节点存在时间上一致的路径,还是“可达性”,即时间网络的相应“可访问性图”表示的密度。因此,可达性水平固有地限制了时间网络上任何扩散过程的可能程度。我们研究了边之间时间并发的总体水平以及网络在所有边聚集的结构内聚力的可达性。我们使用模拟结果并为随机网络开发异质平均场模型预测,以更好地量化基础时间网络的属性如何调节可达性。



        内容与结构融合的

        通用多层网络数据分析


        原文标题: 

        Generic Multilayer Network Data Analysis with the Fusion of Content and Structure

        地址: 

        http://arxiv.org/abs/1905.08635

        作者: 

        Xuan-Son Vu, Abhishek Santra, Sharma Chakravarthy, Lili Jiang


        摘要: 多特征数据分析(例如,在 Facebook,LinkedIn 上)是具有挑战性的,特别是如果想要通过选择感兴趣的特征进行分析而有效地进行并保持灵活性。可以从数据集中明确地给出特征(例如,年龄,性别,关系,政治观点等),但也可以从内容(例如,基于 Facebook 帖子的政治观点)导出特征。需要从多个角度进行分析,以了解数据集(或其子集)并推断有意义的知识。例如,年龄,地点和婚姻状况对政治观点的影响可能需要单独推断(或组合)。


        在本文中,我们采用多层网络(MLN)分析(非传统方法)来模拟 Facebook 数据集,集成内容分析和进行分析,这是由所需的基于应用程序的查询列表驱动的。我们的实验分析显示了在建模和分析具有多个特征的数据集时所提出的方法的灵活性和效率。



        量化新颖性和影响力

        ,以及范式转换的模式


        原文标题: 

        Quantifying Novelty and Influence, and the Patterns of Paradigm Shifts

        地址: 

        http://arxiv.org/abs/1905.08665

        作者: 

        Doheum Park, Juhan Nam, Juyong Park


        摘要: 用于异构大规模数据建模和分析的定量计算方法的最新进展为理解人类行为和能力提供了新的机会,包括驱动诸如科学等创造性企业的创造力的表现。虽然创新对于新颖和有影响力的成就至关重要,但在创意作品中量化这些品质仍然是一项挑战。在这里,我们提出了一个信息论框架,用于根据创作作品的生成概率计算创作作品的新颖性和影响力,反映其元素与其他作品相比的独特程度。


        将形式主义运用到高质量,大型古典钢琴作品的数据集中,这些作品代表了弦乐的象征性进步 - 具有重要科学和知识价值的作品 - 跨越几个世纪的音乐历史,我们发现企业的发展历史可以是这是一种动态过程,表现出主导的,典型的创作风格,定义了不同的历史时期。这些发现可以使人们更深入地了解创新,人类创造力和创意企业的进步。




        社交媒体流简单有效早

        期抑郁检测的文本分类框架


        原文标题: 

        A Text Classification Framework for Simple and Effective Early Depression Detection Over Social Media Streams

        地址: 

        http://arxiv.org/abs/1905.08772

        作者: 

        Sergio G. Burdisso, Marcelo Errecalde, Manuel Montes-y-Gómez


        摘要: 随着互联网的兴起,越来越需要建立能够有效处理社交媒体上的早期风险检测(ERD)问题的智能系统,例如早期抑郁症检测,早期谣言检测或性掠食者识别。这些系统现在主要基于机器学习技术,必须能够处理数据流,因为用户随时间提供数据。此外,这些系统必须能够确定何时处理的数据足以实际对用户进行分类。此外,由于 ERD 任务涉及人们生活可能受到影响的风险决策,因此这些系统也必须能够为其决策辩护。


        然而,大多数标准和最先进的监督机器学习模型(例如 SVM,MNB,神经网络等)不适合处理这种情况。这是因为它们既可以作为黑盒子,也可以不支持增量分类/学习。在本文中,我们介绍 SS3,一种新颖的文本分类监督学习模型,自然支持这些方面。 SS3 旨在用作处理 ERD 问题的一般框架。


        我们在 CLEF 的早期抑郁症检测 eRisk2017试验任务中评估了我们的模型。提交给本次比赛的30个贡献中的大多数使用了最先进的方法。实验结果表明,我们的分类器能够胜过这些模型和标准分类器,尽管计算成本较低且能够解释其基本原理。



        数据合作社:迈向分

        布式的个人数据管理基础


        原文标题: 

        Data Cooperatives: Towards a Foundation for Decentralized Personal Data Management

        地址: 

        http://arxiv.org/abs/1905.08819

        作者:

        Thomas Hardjono, Alex Pentland


        摘要: 对成员承担信托义务的数据合作社为通过个人数据赋予个人权力提供了有希望的方向。数据合作社可以管理,策划和保护对公民成员个人数据的访问。此外,数据合作可以运行内部分析,以获得有关其成员的福祉的见解。有了这些见解,数据合作伙伴可以很好地为其成员提供更好的服务和折扣。信用合作社和类似机构可以提供合适的数据合作实现。



        IdeoTrace :意识形态追踪框架

        与2016年美国总统选举案例研究


        原文标题: 

        IdeoTrace: A Framework for Ideology Tracing with a Case Study on the 2016 U.S. Presidential Election

        地址: 

        http://arxiv.org/abs/1905.08831

        作者: 

        Indu Manickam, Andrew S. Lan, Gautam Dasarathy, Richard G. Baraniuk


        摘要: 2016年美国总统大选被定性为一个极度分裂的时期,由于假新闻,信息轮播和社交机器人的影响,这种时期在社交媒体上更加严重。然而,公众在选举过程中对这些影响的反应更加两极化的程度尚不清楚。在本文中,我们提出了   IdeoTrace,这是一个框架,用于


        (i)联合评估社交媒体用户和新闻网站的意识形态,以及

        (ii)跟踪用户意识形态随时间的变化。


        我们将这个框架应用于47508名 Twitter 用户的选举期的最后两个月,并证明自由派和保守派用户随着时间的推移变得更加两极分化。



        环中的分布式模式形成


        原文标题: 

        Distributed Pattern Formation in a Ring

        地址: 

        http://arxiv.org/abs/1905.08856

        作者: 

        Anne-Laure Ehresmann, Manuel Lafond, Lata Narayanan, Jaroslav Opatrny


        摘要: 由于对社会网络多样性的担忧,我们考虑环中的以下模式形成问题。假设 n 移动单体位于 n-node环网的节点上。每个单体都会分配一组来自集合的颜色。该环分为 k 连续组块或长度 p 的邻域。节点需要以分布式方式重新排列自己以满足给定的多样性要求:在每个块  j 和每种颜色 ci中,必须有正好有颜色 ci的节点阻止  j 。


        假设单体能够在相邻块中查看单体,并且在一个时间步中移动到相邻块中的任何位置。当颜色数量 q = 2 时,我们给出一个终止时间 的算法,其中 N1 是颜色 c1的节点总数,是任何块中所需的颜色 C1 的最小单体数。当每个块中的多样性要求相同时,我们的算法需要 3k + 4 步,并且渐近最优。我们的算法推广了任意数量的颜色,并以 O(nk)步骤结束。我们还展示了如何扩展它以实现任意特定的最终模式,前提是每个模式中至少有一种颜色的单体。



        平面双曲流形上

        链接渗流的重整化群


        原文标题: 

        Renormalization group for link percolation on planar hyperbolic manifolds

        地址: 

        http://arxiv.org/abs/1905.08875

        作者: 

        Ivan Kryven, Robert M. Ziff, Ginestra Bianconi


        摘要: 网络几何学目前是一个日益增长的科学兴趣的话题,因为它开启了使用几何参数探索和解释复杂网络的结构和动态之间的相互作用的可能性。然而,该领域仍处于起步阶段。在这项工作中,我们研究网络几何在确定平面双曲流形中渗流转换的性质中的作用。参考文献 S。Boettcher,V。Singh,R。M. Ziff 表明,一种特殊类型的二维双曲流形,即 Farey 图,显示了普通链接渗流的不连续过渡。


        这里使用重整化群我们研究了构成二维细胞复合体骨架的更广泛的二维双曲线确定性和随机流形的链接渗流的关键性质。通过随后将 m-多边形粘合到单个边来迭代地构建这些双曲线流形。我们展示当多边形的大小 m 从分布 q_m 中抽取,渐近幂律尺度,不同的普遍性类可以是观察幂律指数γ的不同值。有趣的是,渗透过渡是  γ∈(3,4)的混合,并且变为连续 γ∈(2,3]



        模拟与增强用于构建

        深度学习模型的社会网络


        原文标题: 

        Simulation and Augmentation of Social Networks for Building Deep Learning Models

        地址: 

        http://arxiv.org/abs/1905.09087

        作者: 

        Akanda Wahid -Ul- Ashraf, Marcin Budka, Katarzyna Musial


        摘要: 图卷积网络(GCN)的局限性在于它假定在神经网络模型的特定   层中,只有社会网络的  规定邻域节点是有影响的。此外,GCN 已经在引文和知识图上进行了评估,但并未广泛用于基于友谊的社交图。与基于友谊的图相比,与层之间的依赖关系和 GCN 的节点邻域的顺序相关联的缺点可能更普遍。评估GCN 在基于友谊的社会网络上的全部潜力需要大量公开可用的数据集。但是,大多数可用的社会网络数据集都不完整。


        此外,大多数可用的社会网络数据集不包含要素和地面实况标签。在这项工作中,首先,我们提供了一个模拟动态社会网络的指南,其中包含地面实况标签和功能,以及拓扑结构。其次,我们介绍了一个基于 Python 的开源仿真库。我们认为网络的拓扑结构是由一组潜在变量驱动的,称为社会 DNA(sDNA)。我们将 sDNA视为节点的标签。


        最后,通过对我们的模拟数据集进行评估,我们提出了四种新的 GCN 变体,主要是为了克服节点邻域顺序与模型特定层之间依赖性的限制。然后,我们评估所有模型的性能,我们的结果显示,在30个模拟数据集中的27个中,我们提出的 GCN 变体优于原始模型。



        从动态观测中盲辨识随机块模型


        原文标题: 

        Blind identification of stochastic block models from dynamical observations

        地址: 

        http://arxiv.org/abs/1905.09107

        作者: 

        Michael T. Schaub, Santiago Segarra, John N. Tsitsiklis


        摘要: 我们考虑盲辨识问题,其中我们的目标是在不知道网络边的情况下恢复网络的统计模型,而仅仅基于某个过程的节点观察。更具体地说,我们关注的是由在未知网络上演化的扩散过程的快照组成的观察。我们将网络建模为从潜在随机块模型(SBM)的独立抽取生成,我们的目标是将节点的划分推断为块,以及该 SBM  的参数。我们提出了简单的谱算法,可以高精度地解决分区恢复和参数估计问题。我们的分析依赖于随机矩阵理论和协方差估计以及相关的浓度不等式的最新结果。我们用几个数值实验来说明我们的结果。



        多层网络信息传播的最佳层间结构


        原文标题: 

        Optimal interlayer structure for information spreading on multilayer networks

        地址: 

        http://arxiv.org/abs/1905.09176

        作者: 

        Liming Pan, Wei Wang, Shimin Cai, Tao Zhou


        摘要: 从社会,生物到基础设施的许多现实世界系统都可以通过多层网络建模。促进多层网络上的信息传播在开展电子商务产品广告和预测流行的科学出版物方面做出了重大贡献。在本文中,我们提出了一种通过在两个隔离网络之间添加一个互连边来促进传播的最佳策略。基于离散马尔可夫链方法的扰动理论,我们偏离了一个评估互联网络中扩散流行率的指标。


        索引可以被解释为 Katz 中心性的变体,边由扩散过程的动态信息加权。这些重量会增强一端及其附近低度感染的边,而另一端的高度感染。我们通过详尽检查所有潜在边并发现它提供最佳或接近最佳性能来验证策略在小型网络上的有效性。对于大型合成和现实世界的网络,它总是优于其他一些启发式策略,如连接具有最高度数或特征向量中心的节点。


        来源:网络科学研究速递

        编辑:孟婕

        声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



        近期网络科学论文速递


        人们会信任什么样的线上社交团体? 等20篇

        限制在线社会网络应用程序的隐私泄漏 等11篇

        剖析用于图分类的图神经网络 等21篇

        生物学与物理学之间的跨学科关系 等12篇

        当人们经历了负面的生活影响和缺乏控制 等25篇

        加入集智,一起复杂!








        集智俱乐部QQ群|877391004

        商务合作及投稿转载|swarma@swarma.org

        ◆ ◆ ◆

        搜索公众号:集智俱乐部


        加入“没有围墙的研究所”

        让苹果砸得更猛烈些吧!

          您可能也对以下帖子感兴趣

          文章有问题?点此查看未经处理的缓存