核心速递
- 背景或情绪哪个更重要?采用自然语言处理分析新闻对美国选举的影响;
- 非马尔可夫含时网络中链路动态的自相关和互相关如何影响扩散;
- 多层网络用于数据驱动分析的案例:建模、效率和多功能性;
- 基于Facebook上公司写了什么和写的方式预测消费者参与;
- 从信息披露到隐私助推:考虑隐私的和以用户为中心的个人数据管理框架;
- 石墨烯科技的辉煌年代:基于期刊和专利文献的引文证据;
- 用于复杂网络社区发现的约简网络极值集成学习(RenEEL)方案;
Don’t cross that stop line: Characterizing Traffic Violations in Metropolitan Citieshttp://arxiv.org/abs/1909.08106Shashank Srikanth, Aanshul Sadaria, Himanshu Bhatia, Kanay Gupta, Pratik Jain, Ponnurangam Kumaraguru摘要: 在现代大都市中,确保道路安全的任务至关重要。E-challan(电子交通违章收据)的自动化系统目前正在各城市部署,以记录交通违章并罚款。本文研究了在艾哈迈德巴德(印度古吉拉特邦)建立的一个自动化E-challan系统,用于表征用户行为、违反类型以及数据中的空间和时间模式。我们描述了一种从艾哈迈达巴德交通警察的E-challan门户网站收集数据的方法,并创建了超过300万个E-challan数据集。首先对数据集进行分析,以描述用户在重复支出和罚款支付方面的行为。我们证明了很多用户的重复他们的交通违章行为,而且不太可能支付更高的价值的罚款。其次,我们从空间和时间的角度分析数据,并识别数据集中存在的某些时空模式。研究发现,节日期间发放的E-challan数量急剧增加/减少,并确定了一些该市交通违法行为严重的地区。最后,我们提出一组5个功能,来模拟交通违规中的重复犯罪,并在我们的资料集上训练多个类别的数据,以评估我们所提出功能的有效性。该方法在数据集上的准确率达到95%。 On the Metropolis Algorithm for Urban Street Networkshttp://arxiv.org/abs/1909.08082Jerome Benoit, Saif Eddin Jabari摘要: 信息空间中的城市街道网络的复杂性受到学者们的广泛关注,其中道路映射为节点和节点之间的连接。假设信息网络保持在平均自信息状态,本文采用单翻转Metropolis算法来计算带有最少量的自信息的信息网络,旨在为改善我国城市提供必要的指导。
背景或情绪哪个更
重要?采用自然语言处理
分析新闻对美国选举的影响
What matters, context or sentiment?: Analysing the influence of news in U.S. elections using Natural Language Processinghttp://arxiv.org/abs/1909.08095
Federico Albanese, Sebastián Pinto, Viktoriya Semeshenko, Pablo Balenzuela摘要: 在集体社会行为的分析中,一个关键的问题是要研究大众传媒是否以及如何影响舆论。本文利用大众传媒中与候选人有关的信息数据,定量地探讨了特定的民意表现形式与特定候选人的投票意向之间的关系。本文运用自然语言处理技术,分析了2016年美国总统竞选相关的政治新闻文章。我们采用基于递归深度模型的情感及主题检测方法,通过语义合成技术来研究媒体是如何进行选举报道的。我们将分析结果与政治民意调查结果进行比较,并研究如果两者之间存在因果关系,从哪方面得到的信息更为可靠。研究结果表明,新闻的情感内容本身不足以了解两位候选人在政治民意调查中的差异,但主题覆盖率分布,特别是按话题区分的情感内容,与政治民意调查的结果是一致。特别是,我们发现有一个主题(与克林顿电子邮件丑闻有关的新闻)很好地支持了我们的研究发现,因为它与民调中克林顿和特朗普的分歧呈负相关,并显示出显著的因果关系,也解释了福克斯新闻报道中情绪分析的负面价值。
非马尔可夫含时网络中链路动态
的自相关和互相关如何影响扩散
How auto- and cross-correlations in link dynamics influence diffusion in non-Markovian temporal networks http://arxiv.org/abs/1909.08134 Oliver E. Williams, Fabrizio Lillo, Vito Latora摘要: 许多现实世界中的生物、社会和人造网络本质上都是动态网络。随着时间的推移,它们的连接会建立或消失。特别是,这些网络的演化通常被观察到是非马尔可夫过程的,并且它们链接的动态常常是相关的。因此,为了精确地建模这些网络,节点记忆性和链接之间的动态相关性是建模的关键。这就是说,记忆和链接的动态相关性,及其对发生在网络上的过程的影响,还没有被很好地研究清楚。有鉴于此,我们在此介绍一个简单的时间网络生成模型,该模型具有指定的底层结构框架,并精确控制链接之间的动态依赖性及其记忆性的强度和长度。在我们的模型中,每个链接的存在不仅受到其过去活动的影响,而且还受到其他链接过去活动的影响,这是由耦合矩阵指定的,它直接控制链接之间的交互作用,从而控制链接之间的相关性。该模型允许我们研究记忆参数和链接之间的相关性对网络上定义的传播速度的影响,并通过测量达到平衡所需的时间来衡量。此外,我们可以有效地分离自相关和邻域相关在链路动力学中的作用,这使得我们可以通过数值模拟来分析结果。研究结果表明,扩散速度不仅与存储长度非单调相关,同时,相邻链路之间的相关性有助于加快传播过程,而自相关则会减慢传播速度。研究结果对意见形成、社会网络建模和通过流动人口传播的流行病研究具有启示意义。Two Computational Models for Analyzing Political Attention in Social Media http://arxiv.org/abs/1909.08189 Libby Hemphill, Angela M. Schöpke-Gonzalez摘要:了解政治注意力是如何划分的,以及对于议程设置、框架和政治修辞等领域的研究而言,哪些主题至关重要。现有的测量注意力的方法,如根据已建立的码本的手动标记,是昂贵的并且可以是限制性的。我们描述了两个自动区分政治家社交媒体内容主题的计算模型。我们建立了一个有监督的分类器和一个无监督的主题模型,其中,监督分类器减少了根据预先确定的主题列表对内容进行分类的工作量。然而,研究中我们还发现,推特不仅仅是传达政策立场,我们的无监督模型揭示了政治话题和Twitter的其他用途。这些模型是政治传播和社会媒体研究的有效、廉价的计算工具。我们通过运用这两个模型对第115届美国国会议员发布的推文数据进行建模,展示了它们的实用性和研究意义。 Modeling Conversation Structure and Temporal Dynamics for Jointly Predicting Rumor Stance and Veracity http://arxiv.org/abs/1909.08211 Penghui Wei, Nan Xu, Wenji Mao摘要:在自然语言处理和社交媒体分析中,自动验证谣言信息已成为一项重要而富有挑战性的任务。已有研究表明,人们对谣言信息的态度可以为识别谣言的真实性提供线索,因此,确定公众的反应态度是预测谣言真实性的重要前提。本文提出了一种基于层次结构的多任务学习框架,用于联合预测Twitter上的谣言立场和准确性。我们研究的基本思路通过建立一个新的图卷积神经网络的结构属性来对讨论谣言的对话中的推文的真实性进行分类,并利用谣言状态演化的时间动态来预测谣言的真实性。在两个基准数据集上的实验结果表明,该方法在谣言姿态分类和准确性预测方面均优于以往的方法。在两个标准数据集上的实验结果表明,该方法相比其他的谣言预测方法具有显著的优越性。Performance of Recommender Systems: Based on Content Navigator and Collaborative Filtering http://arxiv.org/abs/1909.08219 Keum Gang Cha, Soo-Ryeon Lee, Jung-Woo Lee, Seung Bin Baik摘要:在大数据的世界里,许多人发现很难快速、准确地获取所需的信息。为了克服这一问题,我们不断地研究向用户准确推荐信息的系统,其中协同过滤是工业界应用最广泛的算法之一。然而,协同过滤在在线系统中很难使用,因为用户推荐任务在推荐质量上非常不稳定,并且需要使用大矩阵进行计算。为了解决这个问题,本文提出了一种类似于数据库查询的方法和一种源于复杂网络的聚类方法。Beyond polarization: the asymmetry of vaccine controversies in France http://arxiv.org/abs/1909.08311 Floriana Gargiulo, Florian Cafiero, Paul Guille-Escuret, Valerie Seror, Jeremy Ward摘要:十多年来,在许多国家,特别是在法国,越来越多的开始怀疑疫苗的安全性,这引起了人们对公共卫生的关注。在这件事上,特别是通过社交媒体,意见两极分化的现象屡见不鲜,但争论的细节仍不清楚。本文研究了107.923个法语Twitter账户,发现了两个不对称现象。研究发现,支持和反对疫苗的人们并不是在每个具体疫苗的问题上都展开激烈的讨论,而是更关注不同的疫苗和与疫苗相关的话题。不管是支持者还是反对者,关注的是疫苗技术的新突破,以及疫苗可预防的疾病。疫苗反对者的关注点集中在数量有限的“有争议”的疫苗上。此外,存在影响力很大的推特账户对有关法国疫苗的争论具有导向作用,他们受到广泛的关注,和众多的标签集。这种双重不对称现象会产生严重后果。尽管存在大量支持疫苗的账户,但高效组织和非常积极的疫苗关键活动家提出的担忧仍未得到解答。Data-driven model of the power-grid frequency dynamics http://arxiv.org/abs/1909.08346Leonardo Rydin Gorjão, Mehrnaz Anvari, Holger Kantz, Christian Beck, Dirk Witthaut, Marc Timme, Benjamin Schäfer摘要:能源系统正在迅速变化,以适应越来越多的可再生发电机,并走向更加可持续发展的未来。同时,商业模式和市场设计也在不断发展,影响着电网运行和电网频率。从纯数学建模到应用案例研究,这种正在进行的转变所引起的问题越来越多地通过跨学科的研究方法来解决。这些方法需要随机描述消费者行为、可再生能源的功能、市场规则,以及它们如何影响电网频率的稳定性。在这里,我们介绍了一个易于使用的、数据驱动的、随机的电网频率模型,并演示了它如何再现欧洲大陆和英国电网观测统计的关键特征。我们提供了可执行代码和如何在任何电网上使用模型的各种数学或工程应用指南。 Non-Bayesian Social Learning with Uncertain Models http://arxiv.org/abs/1909.09228James Z. Hare, Cesar A. Uribe, Lance Kaplan, Ali Jadbabaie摘要:非贝叶斯社会学习理论提供了一个框架,为一组在社会网络上交互的主体建立分布式推理模型。在这个框架中,每个主体使用一个学习规则迭代地形成关于未知世界状态的信念,并与它们的邻居进行通信。现有的方法假设主体可以以似然的形式访问精确的统计模型。然而,在许多情况下,这些模型必须从有限的数据中学习。我们提出了一个社会学习规则,它考虑了统计模型中使用二阶概率的不确定性。因此,基于我们提出的假设,来自不确定模型的信念对先前证据的数量是敏感的,我们研究了这些假设在社会网络上的合理性,如是否与世界状态一致。我们明确地显示了所产生的信念对先前证据数量的依赖性。此外,随着先验证据的数量趋于无穷大,学习就发生了,这与传统的社会学习理论是一致的。Quantifying the Impact of Cognitive Biases in Question-Answering Systems http://arxiv.org/abs/1909.09633Keith Burghardt, Tad Hogg, Kristina Lerman摘要:众包可以找出问题的高质量解决方案;然而,个人决策受到认知偏差的制约。我们在一个问答系统的实验模型中研究了其中的一些偏差。在自然实验和对照实验中,我们观察到一种强烈的位置偏差,人们总倾向于在选择列表中出现较早的答案。这一现象的产生受到三个认知因素影响:答案所受到的注意、感知及受欢迎程度、认知负荷,用户通过权衡这三个因素来进行选择。这些效应虽然单独很弱,但会协同放大位置偏差,并使用户对最佳答案的选择与其内在真实想法不一致。最后,我们提出了新的方法,以有效提高在问答系统中得到的答案的质量。Sequential Dynamic Resource Allocation for Epidemic Control http://arxiv.org/abs/1909.09678Mathilde Fekom, Nicolas Vayatis, Argyris Kalogeratos摘要:在动态资源分配(DRA)模型下,管理者的任务是将有限的资源预算动态分配给网络节点,以减少扩散过程(如流行病)。标准DRA假设管理员对整个网络具有持续的完整信息和即时访问权。为了使这种策略更接近现实生活中的约束,我们首先提出了限制DRA模型的扩展,在每一轮干预中,访问仅限于网络节点的一小部分,称为样本。然后,受序列选择问题(如众所周知的秘书问题)的启发,我们提出了序列DRA(SDRA)模型。我们的模型在每一轮的决策过程中引入了一个连续的考量指标,为动态预测控制提供了一个全新的视角。最后,我们将几种序贯选择算法应用到SDRA控制策略中,并比较了它们在SIS流行病模型仿真中的性能。 Epidemic spreading on modular networks: the fear to declare a pandemic http://arxiv.org/abs/1909.09695L. D. Valdez, L. A. Braunstein, S. Havlin摘要:在过去几十年中,由于城市化和国家间流动性的增长,流行病的发生频率有所增加。由于在一个国家蔓延的疾病可能成为一种具有潜在全球人道主义和经济影响的流行病,因此必须建立模型来估计全球流行病的可能性。本文提出了一个基于具有社区结构的模块化复杂网络的疾病传播模型,研究了连接社区的桥梁节点对疾病传播的影响。研究发现,我们的模型可以在全球范围内很好地描述一个传染病传播过程,传染病的恢复时间分布取决于每个群落的内部结构。在稳定状态下,我们发现在临界点附近,随着桥节点数量的增加,疾病可以达到所有社区,但每个社区中只有一小部分已经恢复的节点。此外,我们还得到,在这个极限下,在临界点附近,流行病的严重性会突然增加。这种情况可能使启动或不启动严重流行病的警报的决定更加困难。最后,我们证明了链接渗流理论可以在全球范围内用于估计严重流行病出现的可能性。 A Multi-Strategy Approach to Overcoming Bias in Community Detection Evaluation http://arxiv.org/abs/1909.09903 Jeancarlo Campos Leão (1), Alberto H. F. Laender (2), Pedro O. S. Vaz de Melo (2) ((1) Instituto Federal do Norte de Minas, (2) Universidade Federal de Minas Gerais)摘要:社区检测是理解复杂网络结构的关键。然而,缺乏针对这一具体任务的适当评估策略可能会产生有失偏颇和不正确的结果,从而使基于这种网络的进一步分析或应用失效。在这种背景下,本文的主要贡献是提出了一种在现实网络中检测社区时支持鲁棒性评估的方法。在我们的方法中,我们使用多种策略来捕获社区的不同方面。这些社区评估的结论是基于在结构评估所采用的策略之间的一致性,以及与通过比较不同方法检测到的社区和现有的真实社团。这样,我们的方法可以克服网络数据、检测算法和评估指标的偏差,从而提供关于被检测社区的更一致的结论。用几个真实网络和合成网络进行的实验,结果表明了我们的方法的有效性。
多层网络用于数据驱动分析
的案例:建模、效率和多功能性
Making a Case for MLNs for Data-Driven Analysis: Modeling, Efficiency, and Versatilityhttp://arxiv.org/abs/1909.09908Abhishek Santra, Kanthi Sannappa Komar, Sanjukta Bhowmick, Sharma Chakravarthy摘要:现实世界应用程序的数据集以不同类型的实体为特征,这些实体由多个特征定义,并通过不同类型的关系进行连接。这些数据集的一个关键挑战是开发模型和计算以支持灵活的分析,即以高效的方式计算不同类型的分析目标的能力。为了解决这一问题,本文以多层网络(MLNS)为例,论证了MLNS比目前流行的简单图和属性图提供的信息量更大。通过对均匀性和异质性MLNS的社区和重要节点进行分析,我们证明了所选择模型的可行性。与现有的分析方法相比,基于网络解耦的MLNS分析方法具有更高的效率,并且保留了结构和结果语义。我们使用三个不同的数据集来展示将它们建模为MLNS的有效性,并使用基于解耦的方法对它们进行分析。我们使用同质和异质MLNS进行建模,并使用社区和中心性指标进行分析。这些数据集来自美国商业航空公司和大型国际电影数据集IMDB。实验分析验证了该方法的建模、计算效率和通用性。基于真实数据我们验证了结果的正确性。对于所使用的数据集,效率提高在64%到98%之间。
基于Facebook上公司写了
什么和写的方式预测消费者参与
Predicting consumers engagement on Facebook based on what and how companies writehttp://arxiv.org/abs/1909.09914 Érika S. Rosas-Quezada, Gabriela Ramírez-de-la-Rosa, Esaú Villatoro-Tello摘要:顾客是当前社会化媒体营销的重要组成部分。公众人物和品牌必须非常小心地在网上发布信息。这就是为什么对于任何一个公共品牌来说,需要准确的策略来预测为在线读者撰写的帖子的影响。因此,在本文中,我们提出了一种方法,通过考虑内容、风格、行为属性以及元数据信息来预测给定文章的影响。为了验证我们的方法,我们收集了来自facebook的10个公共页面的帖子,我们对将近14000个帖子进行了实验,发现帖子中的内容和行为属性为我们的预测模型提供了相关信息。
从信息披露到隐私助推:
考虑隐私的和以用户为
中心的个人数据管理框架
From Data Disclosure to Privacy Nudges: A Privacy-aware and User-centric Personal Data Management Frameworkhttp://arxiv.org/abs/1909.09942Yang Lu, Shujun Li, Athina Ioannou, Iis Tussyadiah摘要: 尽管有一些旨在保护用户隐私的隐私增强工具,但令人惊讶的是,由于向多个平台披露数据,缺乏以用户为中心的解决方案,允许基于隐私风险和效益的联合评估进行隐私控制。本文提出了一个概念框架来填补这个空白:针对以用户为中心的隐私保护,研究表明该框架不仅可以评估使用在线服务时的隐私风险,而且还可以评估数据泄露所带来的附加价值。通过人机回圈的方法,我们期望该框架通过偏好学习、持续隐私评估、行为监控和推送提供个性化的解决方案。最后,我们研究了一个针对休闲旅行者的案例,并展示了正在进行的项目中要研究的几个未来领域。 Incremental Fairness in Two-Sided Market Platforms: On Updating Recommendations Fairly http://arxiv.org/abs/1909.10005Gourab K Patro, Abhijnan Chakraborty, Niloy Ganguly, Krishna P. Gummadi摘要:今天,主要的在线平台可以被认为是商品和服务的生产者和消费者的双边市场。有迹象表明,平台过分强调客户满意度可能会影响生产商的利益。为了解决这些问题,最近很少有研究试图将对生产者的公平性纳入考量范围。这些研究忽略了这类平台中的一个重要问题——为了提高客户效用,底层算法经常更新,导致生产者的曝光率不断发生变化。在这项工作中,我们将重点放在频繁更新所产生的公平性问题上,并主张对平台算法进行增量更新,以便生产者有足够的时间(在逻辑上和心理上)来适应变化。但是,增量更新可能会对客户不公平。因此,针对部署在双边平台上的建议,我们制定了一个基于ILP的在线优化,以逐步增量地部署更改,这样我们可以确保项目曝光的平稳过渡,同时保证每个客户的效用变化最小。对多个真实数据集的评估表明,我们提出的平台更新机制对双边平台的生产者和消费者都是有效和公平的。 A Probabilistic Graph Model for Trust Opinion Estimation in Online Social Networks http://arxiv.org/abs/1909.10055摘要:信任评估在许多在线应用程序中起着关键作用,如在线借贷、产品评估和主动交友。信任模型通常使用一组参数来表示信任者与受信者对之间的信任关系。这些参数来源于委托人对受托人的偏见和看法。当然,这些参数可以看作一个向量。为了解决这个问题,我们提出了一个框架来精确地将单个值转换为3VSL所需的参数。该框架采用概率图模型(PGM)来分析委托人对其对受托人的评价和偏好。Trust Assessment in Online Social Networks http://arxiv.org/abs/1909.10066Guangchi Liu, Qing Yang, Honggang Wang, Alex X. Liu摘要:评估在线社交网络(OSNs)中的信任对于在线营销和网络安全等许多应用来说都是至关重要的。然而,由于复杂的社会网络拓扑结构,并且难以对这些拓扑结构进行准确的评估,因此这是一个具有挑战性的问题。为了应对这些挑战,我们提出了三值主观逻辑(3VSL)模型来建立信任模型。3VSL适当地建模信任中存在的不确定性,从而能够表征任意图中的信任。从理论上证明了基于狄利克雷的分类(DC)分布的3VSL在任意OSN拓扑中的能力及其正确性。在3VSL模型的基础上,我们进一步设计了AssessTrust(AT)算法来精确计算OSN中任意两个用户之间的信任度。我们根据两个真实的OSN数据集验证3VSL:Advogato和PGP。实验结果表明,3VSL能够准确地模拟Advogato和PGP中任意一对间接连接用户之间的信任关系。 Sensitivity of collective outcomes identifies pivotal components http://arxiv.org/abs/1909.10117Edward D. Lee, Daniel M. Katz, Michael J. Bommarito II, Paul Ginsparg摘要: 当一个社会系统的集体属性敏感地依赖于几个关键的组成部分时,它就容易受到干扰。利用统计物理中最小模型的信息几何,我们提出了一种识别粗粒度或聚集特性敏感的关键组件的方法。作为一个例子,我们介绍了我们的方法在一个简化的玩具模型与一个选民选票模型。通过这个例子,我们构造了关于大多数少数民族划分分布的Fisher信息矩阵,并研究了该矩阵的特征,指出了中位数的独特作用。更一般地,这些特征确定了关键的群体,这些群体精确地决定了复杂的互动网络所产生的集体结果。将我们的方法应用于政治投票、金融和推特的数据集,我们发现了显著的多样性,从以类中值成分为主的系统(如加利福尼亚州议会)到没有任何特殊成分的系统(如阿拉斯加最高法院),再到其他系统(如标准普尔行业指数)显示,在这些极端情况之间,异质性水平各不相同。通过深入了解这种敏感性,我们的信息几何方法提出了一个量化框架,用于考虑被提名人如何改变司法审判,如何衡量金融指数的显著时间变化,或帮助分析机构对目标扰动的稳健性。Embedding-based Qualitative Analysis of Polarization in Turkey
http://arxiv.org/abs/1909.10213 Mucahid Kutlu, Kareem Darwish, Cansin Bayrak, Ammar Rashed, Tamer Elsayed摘要:2018年6月24日,土耳其举行了一次非常重要的选举,土耳其人民在新总统制度下的第一次选举中选出了总统和议会。在选举期间,土耳其人民在推特上广泛分享他们的政治观点。选民中两极分化的一个途径是支持或反对雷杰普·塔伊普·埃尔多菲·甘连任。本文探讨了这两个群体在政治观点和生活方式上的两极分化,并考察了两极分化在选举前是否加剧。我们对两个收集到的数据集进行了分析,这些数据集涵盖了支持和反对埃尔多菲-甘团体的选举前和选举期间的时间段。对于两个数据集的赞成和反对,我们生成单独的嵌入模型,然后使用四个生成的模型对比政治领导人的邻里关系(嵌入空间)、政治问题和生活方式选择(如饮料、食物和度假)。我们的分析显示,这两个组织在一些议题上达成一致,例如恐怖主义和威胁国家的组织,但在其他议题上,例如难民和生活方式的选择上存在分歧。党内领导人的两极分化更加明显,选举期间两极分化进一步加剧。 Heterogeneous Graph Convolutional Networks for Temporal Community Detection http://arxiv.org/abs/1909.10248Yaping Zheng, Shiyi Chen, Xiaofeng Zhang, Di Wang摘要:图卷积网络(GCN)在表示图数据,特别是齐次图方面表现出了优越的性能。然而,现实世界中的图形数据往往是异构的,并且随着时间的推移而不断演化,例如Facebook和DBLP,这方面的研究很少。针对这一问题,我们提出了一种新的时间异构图卷积网络(THGCN)方法。THGCN首先将空间信息和节点属性信息嵌入在一起。然后,通过压缩网络从嵌入式图形信号的聚合中捕获短期演化模式,同时利用TCN时间卷积网络对异构图形数据的长期演化模式进行建模。据我们所知,这是第一次尝试以社区发现任务为重点对时间异构图形数据进行建模。
石墨烯科技的黄金时代:
基于期刊和专利文献的引文证据
The Golden Eras of Graphene Science and Technology: Bibliographic Evidences From Journal and Patent Publications http://arxiv.org/abs/1909.10256 Ai Linh Nguyen, Wenyuan Liu, Khiam Aik Khor, Andrea Nanetti, Siew Ann Cheong摘要:今天的科研是一个由纳税人和企业集团出资的昂贵企业。它是国家间竞争的关键部分,所有国家都希望发现有希望创造未来产业的研究领域,并通过早期积累科学技术专长来主导这些领域。然而,我们对从科学到技术的价值链的理解还处于相对幼稚的阶段,将科学领导地位转变为市场支配地位在很大程度上仍然是一种炼金术,而不是一门科学。本文从时间和空间两个维度,对石墨烯相关的科技期刊和专利文献的计量记录进行了综合分析。研究发现,在最初的科学领导者失去了立足点之后,石墨烯科学和技术的领导者在竞争中出现得相当晚。更重要的是,尽管已经投入了大量资金,但我们发现有证据表明,尽管该领域的期刊和专利出版物持续增长,石墨烯科学和技术的“黄金时代”分别出现在2010年和2012年。 Differences in structure and dynamics of networks retrieved from dark and public web forumshttp://arxiv.org/abs/1909.10259Maryam Zamani, Fereshteh Rabbani, Attila Horicsányi, Anna Zafeiris, Tamas Vicsek摘要:人类根据从几个主要来源获得的信息做出决策,其中,其他人在互联网论坛上的评论发挥着越来越大的作用。这样的论坛涵盖了广泛的主题,是我们日常生活中的的重要工具。然而,许多论坛都有极具争议的话题和内容,包括激化读者或传播有关危险产品和思想(如毒品、武器或侵略性意识形态)的信息、话题和内容。这些刚刚提到的活动主要发生在所谓的“暗网”上,允许使用黑暗论坛隐藏成员的身份。我们使用网络理论的方法来分析暗论坛和半暗论坛中的数据,并建立几个特征性的行为模式。我们的发现揭示了这两种行为的共同特征和不同特征。特别是,我们显示了不同的数量分布,如评论者的活动、线程的动态(使用它们的生存期定义)以及我们所研究的三种主要类型论坛的度分布。例如,当黑暗论坛出现在公共网络中时(因为可以更容易地访问和使用公共网络),这些知识可以用于识别黑暗网络的典型活动。 Community Detection and Improved Detectability in Multiplex Networks http://arxiv.org/abs/1909.10477Yuming Huang, Ashkan Panahi, Hamid Krim, Liyi Dai摘要:本文研究了在具有未知的任意异构结构的多重网络上(如社交网络)的社区发现问题。为了提高可检测性,我们提出了一个生成模型,该模型在多个层次上利用单个社区的多样性,而不预先假设不同层次之间的社区关系。我们的模型依赖于一种新的想法,即在每一层中结合著名的随机块模型(SBM),在各层中结合一组通用的局部社区标签约束。同时,将约束条件看作贝叶斯先验,建立了整个网络的概率图模型。我们数学证明,这些约束/先验促进了相同的社区跨层的存在,而不引入个体社区之间的相关性。进一步,对约束进行裁剪以呈现稀疏图形模型,随后采用数值有效的置信传播算法。通过数值实验证明了在不同层之间存在一致性社团的情况下,一致性社团是匹配的,并且在单层上提高了可检测性。我们将我们的模型与“相关模型”进行比较,后者利用了层间社区相关性的先验知识。尽管我们的模型依赖于比相关模型更温和的假设,但在这样的相关性下也可以获得类似的可检测性改进。在一定的相关和信噪比范围内,该模型具有较好的检测性能。在缺乏社区相关性的情况下,相关模型自然失效,而我们的模型仍保持其性能。
用于复杂网络社区发现的
极值集成学习(RenEEL)方案
Reduced network extremal ensemble learning (RenEEL) scheme for community detection in complex networks http://arxiv.org/abs/1909.10491 Jiahao Guo, Pramesh Singh, Kevin E. Bassler摘要:本文提出了一种用于复杂网络社区检测的集成学习方案。该方案采用机器学习算法,我们称之为极值集成学习。它使用迭代的极值更新的网络分区的集合,这可以通过传统的基础算法找到,找到最大的基于模块化函数的节点划分。在每次迭代中,识别每个集成分区中处于同一社区中的核心节点组,并使用这些节点组形成简化网络。然后找到缩减后的网络的分区,并用于更新集成。缩小后的网络规模越小,方案越有效。我们利用该方案分析了一组常用的基准网络中的社区结构,发现它比所有已知的其他方法都能找到具有最大模块化的分区。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!