使用新闻文章和财务数据来预测破产的可能性;
依赖距离连通性的空间网络上的流行病传播;
- 流行病传播的可求解延迟模型:以意大利Covid-19为例;
- 全球集体注意力如何关注大流行:Twitter上COVID-19相关的24种语言1-gram时间序列;
- 化身工作:使用化身机器人“ OriHime-D”及其验证让无法出门的残疾人远程工作;
- 使用稀疏控制输入的Erdos-Renyi图中网络意见的可控性;
- 时间序列中的时间相关性,反问题和球形模型之间的对应关系;
- 基于Roy适应模型的文献计量研究分析:对护理的贡献;
- 海事网络科学中的模块化网关连接性和结构性核心组织;
- 基于空间句法和神经网络的旅游景点道路拥挤评价模型研究——以厦门鼓浪屿为例;
- 基于新的中心性指标和新的模块性函数的复杂网络社区检测;
- 从现有公开资源中提取的大规模Twitter数据集,用于药物安全应用;
- 网络度分布分析中的分类、假设检验和估计量收敛问题;
- Infostop:多用户移动数据中的可扩展停止位置检测;
原文标题:
Using News Articles and Financial Data to predict the likelihood of bankruptcy
http://arxiv.org/abs/2003.13414Michael Filletti, Aaron Grech摘要:在过去的十年中,数百万公司已申请破产。这是由多种原因引起的,即高利率,沉重的债务和政府法规。公司破产的后果可能是毁灭性的,不仅伤害工人和股东,而且伤害客户,供应商和任何相关的外部公司。本文的目的之一是通过利用我们的外部数据集提供的财务数据,结合有关某些行业的新闻报道,为公司破产提供一个框架。新闻文章用于尝试从外部角度量化公司及其部门的情绪,而不是简单地使用内部数字。这项工作建立在多位研究人员先前进行的研究的基础上,使我们更接近减轻此类事件的影响。
Epidemic spreading on spatial networks with distance-dependent connectivityhttp://arxiv.org/abs/2003.13160摘要:我们研究了空间网络上的流行病传播,其中两个节点连接的概率以距离为幂律而衰减。随着距离依赖性指数的增长,所得网络会从随机网络限制平稳过渡到规则晶格限制。我们表明,尽管保持平均接触数不变,但指数的增长却阻碍了流行病的传播,因为它使长途连接的频率降低了。感染数量的增长也受到指数值的影响,并且从指数增长变为幂律增长。由此产生的增长与最近对大多数国家中传播的COVID-19的分析相吻合。
流行病传播的可求解延迟模型:
以意大利Covid-19为例
Solvable delay model for epidemic spreading: the case of Covid-19 in Italyhttp://arxiv.org/abs/2003.13571摘要:我们提出了一个简单的模型来描述传染病在个体人群中的扩散。动力学由单个函数延迟微分方程控制,在人口众多的情况下,可以精确求解。可以将这种延迟模型与流行病学中常用的所谓SIR模型联系起来,根据一组三个常微分方程来表示。考虑到政府为减轻病毒传播和居民的社会成本而采取的遏制措施,我们运用我们的模型描述了新病毒COVID-19在意大利的爆发。
全球集体注意力如何关注
大流行Twitter上COVID-19
相关的24种语言1-gram时间序列
How the world’s collective attention is being paid to a pandemic: COVID-19 related 1-gram time series for 24 languages on Twitterhttp://arxiv.org/abs/2003.12614T. Alshaabi, J. R. Minot, M. V. Arnold, J. L. Adams, D. R. Dewhurst, A. J. Reagan, R. Muhamad, C. M. Danforth, P. S. Dodds摘要:面对冠状病毒疾病COVID-19大流行的全球蔓延,我们必须协调医疗,运营和政治应对措施。在所有努力中,数据至关重要。从根本上讲,如果可能在没有疫苗的情况下维持12到18个月,我们需要对该疾病的存在以及通过抗体的血清学检测确认的康复进行通用且有据可查的测试,并且我们需要跟踪主要的社会经济指标。但是,我们还需要各种辅助数据,包括与人们如何通过新闻和故事谈论正在蔓延的大流行有关的数据。为了部分地在社交媒体方面提供帮助,我们在Twitter上整理了一套1000个1-gram为单位的24种语言日级时间序列,时间跨度为2020年3月(相对于2019年3月)最为重要。在我们的Twitter上,我们利用等速指标,等级湍流发散确定重要性。我们对某些时间序列进行了一些基本观察,包括与一段时间内因COVID-19确诊的死亡人数进行比较。我们广泛地观察到,所有语言在1月份针对特定语言的“病毒”单词均达到峰值,然后到2月份有所下降,而到3月份则有所上升。当病毒从中国传播出去时,世界的集体注意力逐渐消失。我们将时间序列托管在Gitlab上,并在相关时每天进行更新。我们的主要目的是让其他研究人员使用这些时间序列来增强在大流行期间以及回顾性研究中可能使用的任何分析。
On the Evolution of Covid-19 in Italy: a Follow up Notehttp://arxiv.org/abs/2003.12667Giuseppe Dattoli, Emanuele Di Palma, Silvia Licciardi, Elio Sabia摘要:在先前的说明中,我们分析了COVID疾病在意大利的传播情况。我们使用了基于logistic和Hubbert函数的模型,我们利用的分析在预测方面显示出有限的用途,并且未能固定基本指标(如疾病增长的拐点)。在本说明中,我们将使用多逻辑模型详细说明先前的模型,并尝试进行更现实的分析。
Agent-based simulator of dynamic flood-people interactionshttp://arxiv.org/abs/1908.05232Mohammad Shirvani, Georges Kesserwani, Paul Richmond摘要:本文提出了一种新的模拟器,用于对拥挤地区的洪水与人之间的相互作用进行动态建模。该模拟器是在FLAMEGPU(用于GPU的灵活的基于大规模主体的建模环境)中开发的,该模型可以对多个主体交互进行建模,同时受益于GPU的加速。包含地形数据的洪水变量由基于水动力基于主体的模型(ABM)表示,该模型基于浅水方程式(SWE)的鲁棒有限体积(FV)求解器的非顺序实现。人民运动由采用基于力的步行规则的行人ABM代表。根据英国环境署(EA)报告的生命危险阈值,将流体动力ABM耦合到行人ABM。提出了一个拥挤的购物中心的假设案例研究,并将其用于评估模拟器的动态耦合能力。根据实际的流入条件,引发涌入购物中心的洪水,并在考虑以下两种情况的情况下应用模拟器:无高级预警的疏散和具有12小时高级预警的干预。结果表明,该模拟器可以生成疏散过程中时空人员状态的详细统计信息,对于规划安全有效的人员干预以部署基于沙袋的临时障碍物很有用。
化身工作:使用化身
机器人“ OriHime-D”及其
验证让无法出门的残疾人远程工作
Avatar Work: Telework for Disabled People Unable to Go Outside by Using Avatar Robots “OriHime-D” and Its Verificationhttp://arxiv.org/abs/2003.12569Kazuaki Takeuchi, Yoichi Yamazaki, Kentaro Yoshifuji摘要:在这项研究中,我们提出了一种远程工作“化身工作”,使残疾人能够从事诸如客户服务之类的有形工作,以实现一个包容性社会,即使我们卧床不起,只要有自由思想,我们也可以做任何事情。在化身工作中,残疾人可以根据自己的残疾情况,使用鼠标或注视输入来操作拟议的机器人“ OriHime-D”来远程从事体力劳动。作为化身工作的一项社会实施举措,我们开设了为期两周的有限化身机器人咖啡馆,并评估了使用OriHime-D进行的残疾人的远程就业。根据10位残疾人的调查结果,我们已经确认,拟议的化身工作可为残障人士带来精神满足,并且可以在工作量适应性强的情况下进行设计。此外,我们已经确认,实验性咖啡馆的工作内容适合寻求社会参与的各种残疾人。这项研究有助于终身毕生的成就感,并同时解决了就业不足的问题。
The impossibility of low rank representations for triangle-rich complex networkshttp://arxiv.org/abs/2003.12635C. Seshadhri, Aneesh Sharma, Andrew Stolman, Ashish Goel摘要:复杂网络的研究是现代科学的重大发展,它丰富了社会科学,生物学,物理学和计算机科学。此类网络的模型和算法在我们的社会中很普遍,并通过社会网络,搜索引擎和推荐系统等影响人类行为。用于建模此类复杂网络的广泛使用的算法技术是构造网络顶点的低维欧几里德嵌入,其中顶点的接近度被解释为边的可能性。与普遍观点相反,我们认为这种图嵌入不能捕获复杂网络的显著特性。我们关注的两个属性是低度聚类系数和大聚类系数,这些属性已被广泛建立,以根据经验在现实世界中是正确的。我们从数学上证明,可以成功创建这两个属性的任何嵌入(使用点积测量相似度)必须在顶点数量上的排列几乎是线性的。除其他含义外,这还确定了流行的嵌入技术(例如奇异值分解和node2vec)无法捕获现实世界中复杂网络的重要结构方面。此外,我们对基于点积的多种嵌入技术进行了经验研究,结果表明它们都无法捕获三角形结构。
Topology and Content Co-Alignment Graph Convolutional Learninghttp://arxiv.org/abs/2003.12806Min Shi, Yufei Tang, Xingquan Zhu摘要:在传统的图神经网络(GNN)中,图卷积学习是通过拓扑驱动的递归节点内容聚合来进行的,用于网络表示学习。实际上,由于节点之间不相关或缺少链接,网络拓扑和节点内容并不总是一致的。在不对齐邻域之间使用纯拓扑驱动的特征聚合方法会使结构-内容一致性较差的节点的学习变差,结果,不正确的消息可能会在整个网络上传播。在本文中,我们主张通过对齐拓扑和内容网络以最大程度地提高一致性,从而实现共对齐图卷积学习(CoGL)。我们的主题是强制拓扑网络尊重底层的内容网络,同时优化内容网络以尊重拓扑以优化表示学习。在给定网络的情况下,CoGL首先通过统一的优化目标以节点特征为基础,重新构建内容网络,然后将内容网络与原始网络对齐,以(1)减少内容损失,(2)减少分类损失,以及(3)减少对抗失利。在六个基准测试上的实验表明,CoGL的性能明显优于现有的最新GNN模型。
使用稀疏控制输入的Erdos-
Renyi图中网络意见的可控性
原文标题:
Controllability of Network Opinion in Erdos-Renyi Graphs using Sparse Control Inputs
http://arxiv.org/abs/2003.12817Geethu Joseph, Buddhika Nettasinghe, Vikram Krishnamurthy, Pramod Varshney摘要:本文考虑了以Erdos Renyi随机图建模的社会网络。网络中的每个人都使用邻居的意见的加权平均值来更新其意见。我们探讨了外部操纵剂如何将这些人的意见驱动到所需状态,而对其先天意见的附加影响有限。我们证明了操纵者几乎可以肯定地在不受其影响的情况下将网络意见在有限时间内引导到任意值(即系统是可控制的)。但是,当控制输入受到稀疏约束时,网络意见就可以以一定的可能性进行控制。我们使用基于Levy集中函数和小球概率的随机向量的集中属性来降低此概率的下界。此外,通过数值模拟,我们比较了鄂尔多斯Renyi图和幂律图的可控性概率,以说明两种模型在可控性方面的关键差异。我们的理论和数值结果揭示了网络意见的可控性如何取决于参数,例如网络的大小和连通性以及操纵主体面临的稀疏性约束。
时间序列中的时间相关性,
反问题和球形模型之间的对应关系
A correspondence between temporal correlations in time series, inverse problems, and the Spherical Modelhttp://arxiv.org/abs/2003.12818Riccardo Marcaccioli, Giacomo Livan摘要:在本文中,我们采用统计力学方法对时间序列中的时间相关性进行建模。我们提出了一种基于最大熵原理的方法来生成时间序列集合,这些集合被约束为保留感兴趣的经验时间序列的部分时间结构。我们表明,滞后一个自相关的约束可以完全解析地处理,并且对应于众所周知的铁磁体的球形模型。然后,我们通过扰动理论扩展这种模型,使其包含对更复杂的时间相关性的约束,这表明在捕获方差中的自相关的滞后方面,这将带来实质性的改进。我们展示了我们在综合数据上的方法,并说明了如何将其用于对数据生成过程的未来价值制定期望。
原文标题:
Strategy equilibrium in dilemma games with off-diagonal payoff perturbations
http://arxiv.org/abs/2003.12823Marco A. Amaral, Marco A. Javarone摘要:考虑到非对角线上的随机小扰动的回报矩阵,我们分析了两难博弈的策略平衡。值得注意的是,最近的一项工作报道[1],尽管通过对主对角线上的扰动来维持合作,但是当扰动作用于非对角线上时,出现的情况就不太清楚了。因此,第二种情况代表了本研究的核心,目的是完成对收益微扰对演化博弈动力学的影响的描述。通过分析作为不同更新规则的各种配置下的拟议模型而获得的结果表明,对角线的扰动实际上构成了噪声的非平凡形式。尤其是,在相变附近会检测到最有趣的效果,因为扰动会使策略分布趋向于无序的平衡状态,在叛乱蔓延到整个人口时支持合作,而在相反情况下则支持叛逃。总而言之,我们确定了一种在受控条件下可以用来增强合作并大大延迟其灭绝的噪音形式。
原文标题:
Clickbait Detection using Multiple Categorization Techniques
http://arxiv.org/abs/2003.12961Abinash Pujahari, Dilip Singh Sisodia摘要:Clickbaits是具有故意设计的误导性标题的在线文章,旨在吸引越来越多的读者打开预期的网页。Clickbaits用于诱使访问者单击特定链接以通过目标网页获利或传播虚假新闻以引起轰动。任何新闻汇总门户上都存在clickbaits,这可能会给读者带来不愉快的体验。从新闻头条中自动检测clickbait头条一直是机器学习社区面临的难题。最近,已经提出了许多防止点击诱饵文章的方法。但是,可用于检测点击诱饵的最新技术不是很可靠。本文提出了一种混合分类技术,通过集成不同的特征,句子结构和聚类来分离点击诱饵和非点击诱饵。在初步分类过程中,使用十一个功能来分隔标题。之后,使用句子形式,句法相似性度量对标题进行重新分类。在最后阶段,通过使用基于t-随机邻域嵌入(t-SNE)方法的词向量相似度进行聚类,对标题进行重新分类。在对这些标题进行分类之后,将机器学习模型应用于数据集以评估机器学习算法。获得的实验结果表明,对于我们使用的真实数据集,所提出的混合模型比任何单独的分类技术都更加健壮,可靠和高效。
基于Roy适应模型的文献
计量研究分析:对护理的贡献
原文标题:
A bibliometric analysis of research based on the Roy Adaptation Model: a contribution to Nursing
http://arxiv.org/abs/2003.13030Paulina Hurtado-Arenas, Miguel R. Guevara摘要:目的。为了基于Roy适应模型对研究进行现代文献计量分析,该模型是Sor Callista Roy在1970年代提出的创始护理模型。方法。描述性和纵向研究。我们使用了来自两个主要科学数据库Web Of Science和SCOPUS的信息。我们从WoS核心收藏中获得了137种出版物,从SCOPUS获得了338种出版物。我们使用软件Bibliometrix进行了分析,该软件是R-package,专门用于从描述性统计和网络分析的角度创建书目分析,包括共引文,共关键字出现和协作网络。结果。我们的定量结果显示了基于模型的研究主要参与者,以及该研究所基于的基础文献或参考文献。我们分析主要关键字及其链接方式。此外,无论是在出版物数量上还是在共同作者网络中的核心地位,我们都代表了最多产的作者。我们介绍了全球协作网络中最核心的机构。结论我们强调了这一理论模型在护理中的相关性,并详细介绍了它的发展。美国是制作该主题文件的主导国家,马萨诸塞州大学波士顿分校和波士顿学院是最具影响力的机构。合作网络还描述了墨西哥,土耳其和西班牙的集群。我们的发现对于获得该领域的总体看法很有帮助。
原文标题:
Symmetry breaking in the prisoner’s dilemma on two-layer dynamic multiplex networks
http://arxiv.org/abs/2003.13049摘要:理解网络结构在合作发展中的作用是物理学和生物学之间交集的主要研究目标。鉴于多个社会领域是相互关联的,并且不能由单层网络表示,因此最近的研究特别关注于多重网络。但是,当与另一个重要的网络特征:网络动态性结合使用时,网络多路的作用还没有被完全理解。在本研究中,我们调查了在动态两层多路网络上玩的演化囚犯困境博弈,其中,跨越两层的收益组合决定了策略的演变。此外,我们介绍了网络动态,主体可以在其中切断与有缺陷的邻居的链接并构造新的链接。我们的仿真表明,链接更新可以增强合作,但最终的状态与完全合作的状态相去甚远。协作的这种适度增强与对称性破坏有关,对称性破坏了一层中的协作频率成比例增加,而另一层中的协作频率则保持不变甚至降低。但是,这种中断的对称性随着足够快的链接更新而消失了。我们的结果表明,网络动力学的引入增强了囚徒困境中的合作,如先前报道的那样,但是一旦考虑到网络的多重性,这种增强就会伴随着明显的不对称性。
原文标题:
Modular gateway-ness connectivity and structural core organization in maritime network science
http://arxiv.org/abs/2003.13099Mengqiao Xu, Qian Pan, Alessandro Muscoloni, Haoxiang Xia, Carlo Vittorio Cannistraci摘要:海上运输占全球贸易量的约80%,因此海上运输系统对世界经济至关重要。为了更好地利用新的国际运输路线,我们需要了解当前的路线及其与国际贸易的复杂系统关联。我们研究了全球班轮运输网络(GLSN)的结构,发现它是一个经济的小世界网络,需要在高运输效率和低布线成本之间进行权衡。为了增进对这种权衡的理解,我们研究了GLSN的模块隔离。我们研究了省级,连接器集线器端口,并使用三种各自的结构性措施提出了网关集线器端口的定义。网关枢纽结构核心组织似乎是GLSN的显著特征,它被证明与网络集成和实现国际贸易货物运输的功能密切相关。这一发现为GLSN的结构组织复杂性及其与国际贸易的相关性提供了新的见解。
原文标题:
Graphical Games and Decompositionhttp://arxiv.org/abs/2003.13123Laura Arditti, Giacomo Como, Fabio Fagnani摘要:我们考虑了Kearns等人介绍的图博弈。(2001)。首先,我们分析图化与博弈策略等效概念的交互作用,为博弈提供最小的复杂性图描述。然后,我们研究了Candogan等人提出的图化与经典博弈分解之间的相互作用。(2011年),表征分解的每个部分的图属性。
原文标题:
http://arxiv.org/abs/2003.13128Laura Arditti, Giacomo Como, Fabio Fagnani摘要:我们介绍了可分离博弈的概念,该概念完善和概括了图博弈的概念。我们证明存在一个最小的分裂,一个博弈是可以分离的。此外,我们证明,在每个战略对等类别中,就类别中的最小分裂而言,都有一个可分离的博弈。相对于类中的最小图,此博弈也是图的,代表了博弈的最小复杂度图描述。我们证明了潜在博弈最小分裂的对称性质,并描述了该性质如何反映潜在功能的分解。特别是,这些最后的结果加强了最近针对图化潜在博弈所证明的结果。最后,我们研究了[5]提出的可分离性与博弈经典分解之间的相互作用,表征了分解各部分的可分离性。
原文标题:
Empirical Comparison of Graph Embeddings for Trust-Based Collaborative Filtering
http://arxiv.org/abs/2003.13345Tomislav Duricic, Hussain Hussain, Emanuel Lacic, Dominik Kowald, Denis Helic, Elisabeth Lex摘要:在这项工作中,我们研究了图嵌入的实用程序,以生成基于信任的协作过滤的潜在用户表示。在冷启动环境中,我们在三个公开可用的数据集上,评估了来自四个方法系列的方法:(i)基于因子分解,(ii)基于随机游走,(iii)基于深度学习和(iv)大型规模的信息网络嵌入(LINE)方法。我们发现,在这四个系列中,基于随机游走的方法始终可以达到最佳准确性。此外,它们还产生了高度新颖和多样化的建议。此外,我们的结果表明,在基于信任的协作过滤中使用图嵌入可以显著提高用户覆盖率。
基于空间句法和神经网络
的旅游景点道路拥挤评价
模型研究——以厦门鼓浪屿为例
原文标题:
Research on Evaluation Model of Road Congestion of Tourist Attraction Based on Spatial Syntax and Neural Network Method — A Case of Gulangyu Island,Xiamen,China
http://arxiv.org/abs/2003.13406QingMu Su, JingJing Xiao, XuanHe Yu, iang Chen摘要:为了更准确地预测行人流量并了解游客空间与行人之间的交互关系,本文采用空间句法和神经网络方法构建了旅游路拥挤评价模型。该模型充分利用了神经网络方法和空间语法的优势。例如,神经网络方法可以客观,动态地分配景点的权重,并且可以通过训练来估计其他景点的权重。分析,我们可以清楚地了解道路之间的联系关系;然后我们使用数学公式将路网结构和景观景点有效地结合起来,从而可以对应于路网结构,景点分布和行人运动的能力。我们在厦门的鼓浪屿进行了实验。结果,我们发现1.鼓浪屿的景点主要位于该岛的边,几个卖票的景点的景点达到0.9以上;2,空间句法拓扑模型可以较好地预测鼓浪屿游客的步行结果;3,鼓浪屿岛的道路通达性与风景名胜区的分布没有很大的空间相关性,但是该模型可以预测道路的拥堵程度,使其更接近真实情况我们的研究结果可以作为未来旅游空间管理的基础,可以丰富旅游空间的研究。
原文标题:
Achilles’ heel of football passing networks
http://arxiv.org/abs/2003.13465Genki Ichinose, Tomohiro Tsuchiya, Shunsuke Watanabe摘要:当我们在足球比赛中将球员视为节点,将传球视为链接时,我们可以构建传球网络。因此,我们可以使用网络科学中开发的工具来分析网络。在表征网络的各种度量标准中,集中度度量标准通常用于标识经过网络的关键参与者。但是,迄今为止,人们对通行网络中的球员连续无能为力的容忍度(即网络的健壮性)了解得很少。因为传球网络的健壮性可以与控球率的提高联系在一起,所以它与比赛的结果密切相关。在这里,我们建立了由属于日本职业足球联赛的18支球队进行45场比赛的基于位置的传球网络。然后,通过两种删除方法从不断经过的网络中连续删除节点,以便我们可以评估这些网络针对级联故障的鲁棒性。结果表明,这些传递网络通常包含集线器(进行传递的关键参与者),并且网络的鲁棒性具有在无标度网络中观察到的相似属性。然后,我们详细分析了最健壮的网络,发现它们的后背经常通过加大对攻击的重视来提高健壮性。此外,我们证明了传球网络的健壮性与团队绩效之间存在正相关关系。
基于新的中心性指标和新的
模块性函数的复杂网络社区检测
原文标题:
Community detection on complex networks based on a new centrality indicator and a new modularity function
http://arxiv.org/abs/2003.13609Junfang Zhu, Xuezao Ren, Peijie Ma, Kun Gao摘要:社区检测是网络研究中一项重要且具有挑战性的任务。如今,大量关注已集中在本地社区检测方法上。其中,使用贪婪算法的社区检测通常从识别称为网络中心节点的本地基本节点开始;社区随后通过优化模块化功能从这些中心节点扩展。在本文中,我们提出了新的中央节点指示器和新的模块化功能。我们的中央节点指标,我们称为局部中心度指标(LCI),与众所周知的全局最大程度指标和局部最大程度指标一样有效。在某些特殊的网络结构上,LCI的性能甚至更好。另一方面,我们的模块化函数F2克服了先前文献中提出的模块化函数的某些缺点,例如分辨率限制问题。结合贪心算法,LCI和F2使我们能够为现实世界网络和模拟基准网络确定正确的社区结构。基于归一化互信息(NMI)的评估表明,我们的基于LCI和F2的贪心算法的社区检测方法的性能优于许多其他方法。因此,我们在本文中提出的方法可能值得关注。
原文标题:
By Force of Habit: Self-Trapping in a Dynamical Utility Landscapehttp://arxiv.org/abs/2003.13660José Moran, Antoine Fosset, Davide Luzzati, Jean-Philippe Bouchaud, Michael Benzaquen摘要:从历史上看,理性选择理论一直关注效用最大化原则来描述个人如何做出选择。实际上,与探索可用选择的范围有关,这需要一定的计算成本,而且通常不清楚我们是否真正在最大化底层效用函数。特别是,记忆效应和习惯养成可能会超过效用最大化。我们提出了一种具有历史依赖效用函数的风格化模型,其中,当过去做出某项选择时,与每个选择相关联的效用都会增加,并且具有一定的衰变内存内核。我们表明,自我增强效应会导致主体商因习惯的纯粹性而陷入选择的困境。我们讨论了自由探索选择空间和自我陷阱之间过渡的特殊性质。我们特别发现,捕获时间分布恰好是过渡时的Zipf定律,而自捕获阶段则表现出超时效行为。从现有公开资源中提取的大规模
Twitter数据集,用于药物安全应用
A large-scale Twitter dataset for drug safety applications mined from publicly existing resourceshttp://arxiv.org/abs/2003.13900Ramya Tekumalla, Juan M. Banda摘要:随着自然语言处理(NLP)任务的深度学习模型的普及,在药物警戒领域(更具体地,用于识别不良药物反应(ADR)),对大型社交媒体数据集的内在需求针对这样的任务。随着大多数研究人员分配大量时间来爬网Twitter或购买昂贵的预先整理的数据集,然后由人工手动注释,这些方法无法很好地扩展,因为越来越多的数据不断在Twitter中流动。在这项工作中,我们重新设计了超过94亿条Tweets的公开可用存档数据集,目的是创建一个非常大的与毒品使用相关的Tweet数据集。我们使用文献中现有的手动整理数据集,然后使用机器学习方法验证过滤后的推文的相关性,最终结果是可公开获得的1,181,993百万条推文的数据集可供公众使用。我们提供了有关如何提取此数据集和所选推特ID的所有代码和详细过程,供研究人员使用。A Robust Gradient Tracking Method for Distributed Optimization over Directed Networkshttp://arxiv.org/abs/2003.13980摘要:在本文中,我们考虑了具有有向网络拓扑的多主体网络上的分布式共识优化问题。假设每个业务代表的本地成本函数都是平滑且强烈凸的,则总体目标是使所有本地成本函数的平均值最小。为了解决这个问题,我们引入了一种鲁棒的梯度跟踪方法(R-Push-Pull),该方法是根据最近提出的Push-Pull / AB算法改编而成的。R-Push-Pull继承了Push-Pull的优点,并通过精确的通信线性收敛到最优解决方案。在嘈杂的信息交换下,R-Push-Pull比现有的基于梯度跟踪的算法更健壮。在恒定的分步调整策略下,每个主体所获得的解决方案以指数级的速度快速达到期望值的最优邻域。我们提供了一个数值示例,证明了R-Push-Pull的有效性。Aversion of face-to-face situation of pedestrians eases crowding conditionhttp://arxiv.org/abs/2003.13992Sho Yajima, Kiwamu Yoshii, Yutaka Sumino摘要:我们对一群行人进行了数值模拟。每个行人都具有长轴垂直于前后轴的形状,并设计用于移动固定目的地。行人在地面上有摩擦并有软排斥力。在这里,我们新引入了一种主动轮换功能,可以捕捉心理效应来逃避面对面的情况。仿真显示主动旋转引起系统的流化,从而导致行人通量更高。Problems with classification, hypothesis testing, and estimator convergence in the analysis of degree distributions in networkshttp://arxiv.org/abs/2003.14012Pim van der Hoorn, Ivan Voitalov, Remco van der Hofstad, Dmitri Krioukov摘要:Broido和Clauset在他们最近的著作“无标度网络很少见”中,解决了网络中度分布分析的问题,以将它们分类为无标度,具有不同的“无标度”强度。在过去的二十年中,网络科学领域的大量论文都报告说,许多实际网络中的度数分布遵循幂律。这样的网络被称为无标度。但是,由于缺乏精确的定义,该术语演变为表示一系列不同的事物,从而导致对给定网络的无标度的混淆和矛盾的主张。认识到此问题,“无标度网络很少见”的作者试图对其进行修复。他们试图开发一种通用的统计原理方法,以消除网络科学文献中积累的这种无标度的歧义。尽管他们的论文提出了解决这一基本问题的公平尝试,但我们必须引起注意其中的一些重要问题。The Boltzmann legacy revisited: kinetic models of social interactionshttp://arxiv.org/abs/2003.14225Martina Fraia, Andrea Tosin摘要:Ludwig Boltzmann最初在气体动力学中开发的经典统计力学方法在描述社会现象中的应用是我们试图在本文中概述的成功案例。一方面,它是当今蓬勃发展的研究领域,它越来越渗透到不同的领域,例如经济物理学,社会物理学,生物数学,运输工程等。另一方面,这是一个令人着迷的数学挑战,因为它需要各种互补专业知识的相互作用:建模,模型分析,数值。在本文中,我们尝试以舆论形成的社会现象作为激励实例来尝试所有这些。Hurricanes and hashtags: Characterizing online collective attention for natural disastershttp://arxiv.org/abs/2003.14291Michael V. Arnold, David Rushing Dewhurst, Thayer Alshaabi, Joshua R.Minot, Jane L. Adams, Christopher M. Danforth, Peter Sheridan Dodds摘要:我们通过Twitter(具有全球影响力的社交媒体平台)上的 n -克镜头,研究对飓风的集体关注。使用飓风名字提及作为意识的替代,我们发现在风暴中外源时间动态显著相似,但是即使在造成可比性死亡和破坏的风暴中,总体集体关注度也有很大差异。我们构建了“飓风注意图”,并观察到在美国大陆上造成死亡(或经济损失)的飓风在英语推文中引起的关注要比未在美国推文引起的更多。我们发现飓风的Saffir-Simpson风标类别分配与它受到的关注程度密切相关。与较低类别的风暴相比,较高类别的风暴与死亡人数或损失金额成比例的增加,则注意力得到的比例也较高。2010年代最具破坏力和致命性的飓风哈维和玛丽亚分别引起了最多的关注和最长的记忆。平均而言,引起相同数量的死亡和经济损失的5类风暴引起的关注是1类风暴的4.6倍。
Infostop:多用户移动
数据中的可扩展停止位置检测
Infostop: Scalable stop-location detection in multi-user mobility datahttp://arxiv.org/abs/2003.14370Ulf Aslak, Laura Alessandretti摘要:近年来,以数据为依据的移动性研究蓬勃发展,为应对现实世界的挑战提供了解决方案,包括预测流行病和规划交通运输。这些进步得益于计算工具,可以分析大规模数字迹线数据集。预处理空间轨迹时的挑战之一是所谓的停止位置检测,这需要将原始时间序列减少到一个人静止不动的目的地序列。Hariharan和Toyama(2004)提出了针对此问题的最广泛采用的解决方案,该方法涉及滤除非平稳测量值,然后在固定点上应用聚集聚类。但是,这种最新的解决方案有两个局限性:(i)由于固有的测量噪声,经常访问的位置非常近的地方(例如相邻建筑物)可能会合并到一个唯一的位置,(ii )无法同时分析多个用户的跟踪,因此,目标的定义不会在多个用户之间共享。在本文中,我们描述了利用基于流的网络社区检测算法Infomap克服了最新解决方案局限性的Infostop算法。我们测试了具有高度重叠移动性的 sim 1000 个人人口的Infostop。我们显示,Infostop检测到的位置大小会随着用户数量的增加而饱和,并且时间复杂度的增长速度会比以前的解决方案慢。我们证明了Infostop可用于轻松推断社交会议。最后,我们提供了以Python和C ++编写的Infostop的开源实现,该实现具有简单的API,可用于标记按时间顺序排列的坐标序列(GPS或其他方式)以及无序的空间点集。声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!