单篇论文与期刊影响因子波动:
11639种期刊综合分析
Impact Factor volatility to a single paper: A comprehensive analysis of 11639 journalshttp://arxiv.org/abs/1911.02533摘要:我们研究了一篇论文如何影响影响因子(IF)。通过分析来自Clarivate Analytics 2017年期刊引用报告11639份期刊上发表的3,088,511篇论文的数据,我们发现IF是高度易变的。例如,381种期刊中被引频次最高的论文使其IF值增加了0.5分以上,而818种期刊的相对增幅超过了25%。每10份期刊中就有一份期刊的前三名论文被引用的几率增加了50%以上。由于单篇论文对中频的影响与期刊的大小成反比,因此,对于高被引论文,小型期刊比大型期刊获得更大的奖励,而对于低被引论文,尤其是中频高的论文,小型期刊受到的惩罚更大。这种倾斜的奖励机制激励着高质量的期刊——如果它们保持规模,保持在排名上的竞争力。我们讨论发表在著名期刊上的突破性论文的意义。我们质疑中频排名的可靠性,因为它对数千种期刊的几篇论文具有很高的中频敏感性。
Learning Invariant Representations of Social Media Usershttp://arxiv.org/abs/1910.04979Nicholas Andrews, Marcus Bishop摘要: 随着时间推移,社交媒体用户行为演变使得验证、分类、聚类和排名等用户级比较任务变得复杂。因此,单纯方法可能无法推广到新用户,甚至无法推广到对已知用户的未来观察。在这篇论文中,我们提出了一种新方法来学习从社交媒体上用户活动短片段到向量空间映射,在这个向量空间中,点之间距离捕获了相应用户不变特征的相似性。首先,我们通过优化大量未标记社交媒体内容的代理度量学习目标来拟合该模型。而一旦学会了映射,就可以将其应用于在训练时没有看到的用户,并在结果向量空间中对用户进行有效的比较。最后,我们使用来自Reddit、Twitter和Wikipedia的数据进行了全面的评估,以验证所提议方法的好处。
The Physics of Fun: Quantifying Human Engagement into Playful Activitieshttp://arxiv.org/abs/1911.01864David Reguera, Pol Colomer-de-Simón, Iván Encinas, Manel Sort, Jan Wedekind, Marián Boguñá摘要:从事好玩的活动,如演奏乐器、学习语言或从事体育活动,是人类生活的一个基本方面。我们提出了一个定量的经验分析的参与动态好玩的活动。通过分析数百万休闲电子游戏玩家的行为,我们发现了一个控制用户参与动态的比例法则。这种幂律行为是乘法性的(以一组关键指数为特征的参与机制。我们还发现,根据临界指数,在所有个体最终放弃活动的标准情况和有限部分个体从不放弃活动的另一个阶段之间存在一个相变。我们在这项研究中发现的行为可能不仅仅局限于人类与电子游戏的互动。相反,我们认为它反映了人类如何参与具有内在回报的挑战性活动的更普遍和更深刻的行为。Local Statistics, Semidefinite Programming, and Community Detectionhttp://arxiv.org/abs/1911.01960Jess Banks, Sidhanth Mohanty, Prasad Raghavendra摘要:我们提出了一个新的半定规划松弛的层次结构来解决推理问题,其灵感来自于最近的平方和文献中的“伪别名”概念。我们将其应用于随机规则图分布中的社区检测问题上。随机规则图,又叫做“度正则块模型”。它的顶点被划分成k个社区,并且是在给定数量的社区内和社区间的边的条件下采样的。以往,社区发现的难点在于:我们需要判断一个图是从来自模型本身,还是在正则图上的均匀分布。如今,我们可以通过计算Kesten-Stigum(KS)阈值处的相变来解决这个问题。我们还发现:(i)层次结构中足够高的常数级可以执行任意接近这一点的检测;(ii)我们的算法对o(n)对抗性边缘扰动具有鲁棒性;在研究较多的(不规则)随机块模型中,我们知道有效的算法一直存在到这个阈值,尽管当平均次数较小时,没有一种算法对图的对抗扰动具有鲁棒性。更重要的是,几乎没有复杂理论的证据表明,在Kesten-Stigum之下很难进行检测。在包含两个以上组的DRBM中,据我们所知,还没有证据证明任何算法成功达到KS阈值,更不用说有人可以稳健地做到这一点,而且在这一点以下也同样缺乏硬度的证据。我们的SDP层次是非常普遍的,适用于广泛的假设检验问题。Minimal percolating sets for mutating infectious diseaseshttp://arxiv.org/abs/1911.01988Yuyuan Luo, Laura P. Schaposnik摘要:本文致力于研究动态系统与渗透模型之间的相互作用,以期对病毒感染的研究有所帮助。回想一下,r-bootstrap渗透描述了一个确定性过程:在这个过程中,一个图的顶点的r个邻居被感染,它就会被感染。我们通过引入F(t)引导渗透对其进行推广。其中,F(t)是一个依赖于时间的过程:传播疾病所需感染的相邻顶点的数量由每次t时的渗透函数F(t)决定。在研究了该模型的一些基本性能后,我们考虑最小渗透集和构造一个polynomial-timed算法来找到一个最小最小渗透在有限的树木对某些F (t)引导渗流模型。Toward a Unified Understanding of Casualty Distributions in Human Conflicthttp://arxiv.org/abs/1911.01994Michael Spagat, Stijn van Weezel, Minzhang Zheng, Neil F. Johnson摘要:文献中统一各种不同的主张和结果,阻碍了我们对人类冲突的统一描述和理解。为了解决这个问题,我们需要对其进行统一。首先,我们发现了一个调和的指数型的病死率分布。它会随着整场战争或单个战役发生变化。其次,我们解释了忽略冲突数据集如何编译的细节,如何从幂律分布拟合产生错误的负面评价。最后,我们解释了人类冲突的生成理论是如何能够提供一个定量的解释,说明大多数观察到的伤亡分布是如何遵循近似的幂律,以及它们是如何以及为什么偏离了幂律。它提供了一个统一的机械论解释的起源,这些幂律偏差在动态过程的冲突。综上,我们的提供了一个统一的框架可以用来理解和定量描述人类冲突。Click Maximization in Online Social Networks Using Optimal Choice of Targeted Interestshttp://arxiv.org/abs/1911.02061Nathaniel Hudson, Hana Khamfroush, Brent Harrison, Adam Craig摘要:在线社交网络平台广告点击率预测是优化广告的重要手段。常用预测方法是:建立了机器学习模型,以用户为中心的方法对用户数据进行分类,从而预测用户是否会点击广告。虽然这种方法已被证明是有效的,但它对大多数实体都是不可访问的,并且严重依赖于用户数据。为了解决这个问题,我们首先考虑Facebook上的一组大型广告数据,并使用自然语言处理(NLP)来提取我们称为概念节点的关键概念。为了预测概念节点组合的CTR值,我们使用广告数据来训练四种机器学习(ML)模型。然后,我们将寻找概念节点的最优组合的问题转化为一个优化问题。给定一定的预算k,我们感兴趣的是找到概念节点的最佳组合,使CTR最大化。讨论了优化问题的硬度和可能的np硬度。然后,我们提出一个贪心算法和一个遗传算法来寻找多项式时间内概念节点的近似最优组合,遗传算法几乎匹配最优解。我们观察到决策树回归器和随机森林回归器表现出最高的Pearson相关系数w.r.t.点击预测和实际点击值。此外,我们发现“政治”、“名人”和“组织”的概念节点比其他被认为是概念节点的节点更有影响力。weg2vec: Event embedding for temporal networkshttp://arxiv.org/abs/1911.02425Maddalena Torricelli, Márton Karsai, Laetitia Gauvin摘要:网络嵌入技术可以很好地捕捉网络中的结构规律,并识别其局部结构之间的相似性。然而,传统的网络嵌入模型是针对静态结构建立的,通常只考虑节点,当网络随时间变化时,模型受到了严重的挑战。时态网络在描述真实系统时可能具有优势,但它编码的信息更复杂,迄今为止只能用少数几种方法有效地表示。在此,我们提出了一种新的时间网络事件嵌入方法,称为weg2vec,它建立在事件的时间和结构相似性的基础上,以学习时间网络的低维表示。该投影成功地捕捉了不同时间内涉及不同节点的事件之间的潜在结构和相似性,并为预测在时间结构上展开的传播过程的最终结果提供了方法。Scaling in Income Inequalities and its Dynamical Originhttp://arxiv.org/abs/1911.02449Zoltan Neda, Istvan Gere, Tamas S. Biro, Geza Toth, Noemi Derzsy摘要:我们对罗马尼亚(克卢日县)连续几年的个人收入和详尽的收入数据进行了分析。当考虑适当正常化的收入时,收入分配在主曲线上崩溃。贝塔素分布适合于崩溃的数据。基于增长和重置项的主方程的动态模型成功地以自洽的方式解释了所观察到的分布,即增长和重置率是由相同的个体水平数据评估的。其他国家的收入分配也出现了类似的趋势。然而,主曲线的崩溃并不是完美的,这表明为了建立更现实的模型,还必须考虑特定的社会经济特征。New centrality and causality metrics assessing air traffic network interactionshttp://arxiv.org/abs/1911.02487Piero Mazzarisi, Silvia Zaoli, Fabrizio Lillo, Luis Delgado, Gérald Gurtner摘要:在ATM系统中,大量的交互实体使得很难预测创新可能产生的系统范围的影响。在这里,我们将基于基于代理的建模和复杂的网络科学,介绍Domino项目提出的方法,以评估和确定创新可能为不同的利益相关者带来的影响。通过调查美国航班的数据集,我们首先发现,现有的中心性和因果性指标不适合描述系统中延误的影响。然后,我们提出适用于ATM应用程序的此类度量的概括。然后,我们介绍了Domino中使用的基于代理的模型,以模拟反映不同系统创新的场景,这些创新改变了代理的操作和行为。我们将重点放在与航班到达协调相关的特定创新上,并通过应用所提出的新指标,展示其在网络级别上的效果。Recovering the past states of growing treeshttp://arxiv.org/abs/1910.04788George T. Cantwell, Guillaume St-Onge, Jean-Gabriel Young摘要: 原则上,人们可从一个正在成长的网络当前状态,重建它过去状态。然而,在实践中,由于现有方法要么不精确、效率低下,要么两者兼而有之,这种方法实现程度受到严重限制。这里,我们提出了时间重建方法,既准确又有效的树。首先,我们推导出每个节点每次到达可能历史数量解析表达式,并且我们提出了一个蒙特卡罗方法来对具有n个节点的网络的O(n log log n)操作全部历史进行抽样。然后,我们通过一系列应用程序演示了这些方法的使用:种子查找、网络插值、全历史重建和模型拟合。有了这些新工具,可以直接适应增长模型,比如对静态网络数据的优先附加——只使用单个网络快照在机制级别直接测试模型。 Central Server Free Federated Learning over Single-sided Trust Social Networkshttp://arxiv.org/abs/1910.04956Chaoyang He, Conghui Tan, Hanlin Tang, Shuang Qiu, Ji Liu摘要: 联合学习对于现代机器学习越来越重要,特别是对于数据隐私敏感的场景。现有联合学习大多采用基于中央服务器的体系结构或集中式体系结构。然而,在许多社交网络场景中,集中式联合学习是不适用的(例如,连接所有用户的中央代理或服务器可能不存在,或者与中央服务器通信成本是无法承受的)。在本文中,我们考虑了一个通用设置:1)中心服务器可能不存在,2)社交网络是单向或单侧信任的(即用户A信任用户B,但用户B可能不信任用户A)。首先,我们提出了一个中央服务器免费联邦学习算法,命名为在线推和(OPS)方法,来处理这个具有挑战性的通用场景。本文还提供了一个严格的遗憾分析,其中显示了关于在联合学习场景中用户如何从与可信用户通信中获益的非常有趣的结果。这项工作建立在基本的算法框架和理论保证的基础上,服务于在一般的社会网络场景联合学习。 Impact of independence on polarization of opinionshttp://arxiv.org/abs/1910.05036 Janusz Szwabiński, Tomasz Weron摘要:社会两极分化越来越受到许多领域交叉研究人员的关注,因为它似乎是许多公共领域的一个决定性特征。在这篇论文中,我们将研究不愿意屈服于群体压力,也被称为独立,是如何影响这一现象的。特别是我们想回答这样一个问题:人们的独立选择是否能够改变一个系统的动态,否则系统就会变得两极化。为此目的我们将使用q-voter模型的修改版,从研究结果可以得出,独立影响至少是双重的。在较低的独立性水平上,两个对立群体之间的共识极化过渡比不独立时更快。更高的能级在系统中引起额外跃迁,从极化状态到无序状态。
使用无参数人口动力学方法
预测欧盟国家的卫生人力资源供给
A parameter-free population-dynamical approach to health workforce supply forecasting of EU countrieshttp://arxiv.org/abs/1910.05077Peter Klimek, Michael Gyimesi, Herwig Ostermann, Stefan Thurner摘要:许多国家面临挑战包括即将到来退休潮、人口负增长,或在向其卫生保健系统提供足够人员时在医疗部门和领域的资源分配不够理想。因此越来越多国家在卫生人力供应预测中采用定量方法。然而,这些模型可用性往往有限,因为它们要么需要大量个人层面数据,要么过于简单,无法捕捉关键人口统计或流行病学因素。因此,我们提出了一种新的人口动态和库存流动一致方法来预测卫生人力供应,该方法足够复杂,可以处理动态变化行为,同时只需要公开可用timeseries数据即可完成校准。因此,我们将该模型应用于21个欧洲国家,预测到2040年全科医生和专科医生的供应。与2016年保持医师密度恒定所需人员配备水平相比,在许多国家中,我们发现一个显著趋势,即以增加专科医师密度为代价,降低全科医师密度。人口负增长预期使许多南欧和东欧国家这些趋势更加恶化。以奥地利为例,我们将此方法推广到一个多专业、多区域和多部门的模型,并发现在签约医生和非签约医生供应中存在一个次优分布。而最重要的是为决策者设计工具,以影响跨领域和部门医师分配和供应,以应对失衡。
Vector-borne epidemics driven by human mobilityhttp://arxiv.org/abs/1910.05256David Soriano-Paños, Judy Heliana Arias-Castro, Hector J. Martínez, Sandro Meloni, Jesús Gómez-Gardeñes摘要: 传病媒介传染病是人类与传病媒介交叉感染、人口分布和人员流动等多种因素共同作用结果。目前关于前一种成分信息的可获得性要求将它们纳入目前病媒传播疾病的数学模型。在此,我们提出一个基于集合种群动态框架,其结果与机械模拟的结果相当一致。并且,这个框架允许我们推导出一个流行阈值表达式,该表达式能够高精度地捕获导致流行开始的条件。在这些见解驱动下,我们获得了一个流行指标,根据受病媒传播疾病影响风险对补丁进行排序。最后,我们通过重现2015年至2016年在哥伦比亚圣地亚哥德卡利市报告的登革热病例空间分布来说明这一流行风险指标的效用。 Automating dynamic consent decisions for the processing of social media data in health researchhttp://arxiv.org/abs/1910.05265Chris Norval, Tristan Henderson摘要: 社交媒体已经成为一个丰富的数据来源,尤其是在健康研究方面。然而这些数据使用引发了重大伦理问题,即是否需要研究对象知情同意。即使获得了同意机制,也通常是广泛和不灵活的,或者给参与者带来较大负担。机器学习算法在促进“中间地带”方法方面显示了很大潜力:使用经过训练模型来预测和自动化粒度的同意决策。然而,这些技术引发了大量后续伦理和技术考虑。在这篇论文中,我们提出一个探索性用户研究(n = 67),我们发现可以预测与健康相关社交媒体数据的合理准确性,同时最小化私密数据的泄露。最后,我们试图解构这项研究发现,如果这样技术付诸实践,确定和讨论了对现实世界的影响。The Natural Selection of Conservative Sciencehttp://arxiv.org/abs/1910.05273摘要:社会认识论家认为,高风险、高回报科学在科学界扮演着重要角色。然而,最近也有人认为,各种科学领域似乎趋于保守主义——库恩(1970)所称“正常科学”产量不断增加。本论文将探索这种趋势一种可能的解释:科学研究小组的形成、成长和解散过程可能对高风险科学有内在的敌意。特别是,我们采用了Smaldino和McElreath(2016)开发一个范式,该范式将科学社区视为正在进行选择的种群。很明显,也许与直觉相反,这种过程在某种程度上促进了高风险,高回报的科学。但是,正如我将要指出的,高风险高回报的科学一般来说,是那种很难重复的东西。尽管更为保守科学家将能够培养出有能力继续他们成功项目的学生,从而创造出繁荣的世系,但成功高风险科学可能不是那种可以轻易传承下去的东西。在这种情况下,科学界的结构选择了反对高风险、高回报的项目。更一般地说,这篇论文明确指出,在考虑激励如何塑造科学界时,至少要考虑两个过程:一个是科学家个人对自己职业和研究做出选择的过程,另一个是控制新研究团体形成的选择性过程。A Geometric Model of Opinion Polarizationhttp://arxiv.org/abs/1910.05274Jan Hązła, Yan Jin, Elchanan Mossel, Govind Ramnarayan摘要:我们介绍了一个简单的,几何的意见极化模型。这是一种政治说服的模式,也是一种利用社会价值进行营销和广告的模式。它侧重于在媒体不同主题之间的相互作用和广泛的说服能力。而后,我们讨论一些探索性的例子,分析极化是如何发生和演变的。最后,我们还研究了在模型中选择最有效影响因子方法一些计算方面,以及这些计算上的考虑与极化之间的联系。 Patterns of Multiplex Layer Entanglement across Real and Synthetic Networkshttp://arxiv.org/abs/1910.05300Blaž Škrlj, Benjamin Renoust摘要: 现实世界中复杂网络往往呈现出复杂结构,将来自社会、交通和生物网络等物理系统不同方面的实体连接起来。人们对这种跨学科网络的一般性质知之甚少。在此工作中,我们首先调查了35个真实世界多重网络连接模式一致性。我们证明了纠缠的同质性和强度这两个层一致性的度量,表明了社会网络和生物网络之间明显差异。此外,我们还调查贸易、合作和交通网络。我们证明了真实网络可以在同质性和强度联合空间中被分离,也证明了这两种方法在真实多重网络分类中的有效性。最后,我们设计了一个多路复用网络生成器,通过分析具有不同拓扑特性的11905个合成多路复用网络,发现包含相似的模式(如在真实网络中观察到的)。
来源:网络科学研究速递
审校:郭治青、李沁洋
编辑:张爽
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧