核心速递
生物物种的集群模型;
- 对近期中国内地爆发的COVID-19的有效控制解释了其确诊病例的亚指数增长;
- “更高”地位的语言并不总是赢:英语在印度的衰落和印地文的崛起;
- 通过实验的公平:不平等的A/B测试作为一种负责任设计的方法;
- 完全可再生的电力到甲烷系统的选址相关等级成本评估;
- 具有高时空分辨率的美国测试系统用于可再生整合研究;
- 基于社会网络结构和同质相似性给出一个链路预测模型;
- 有社会影响和地位偏差的试用-发售市场分割化的好处;
Model for clustering of living specieshttp://arxiv.org/abs/2002.07732D. Bazeia, M.V. de Moraes, B.F. de Oliveira摘要: 集群出现在大自然环境的多样性,包括距离,只要宇宙的,并下降到原子和分子和非常小核的大小。他们也出现在其他一些情况,特别是在生物系统如蚂蚁,蜜蜂,鸟,鱼,角马和老鼠,例如。在这里,我们描述了一组雌性和雄性个体组成的模型,服从简单的规则,迅速转化一个统一的初始状态为一个集群,在时间作为稳定的动力结构演变。我们发现,结构移动作为一个随机游走质量中心和集群孕育着功法的行为在系统个体数量方面的大小。此外,我们还检查其他的可能性,特别是两个不同的物种可以演化以形成一个或两个不同的簇的情况。
对近期中国内地爆发的
COVID-19的有效控制解释
了其确诊病例的亚指数增长
Effective containment explains sub-exponential growth in confirmed cases of recent COVID-19 outbreak in Mainland Chinahttp://arxiv.org/abs/2002.07572Benjamin F. Maier, Dirk Brockmann摘要: 近期COVID-19在中国大陆爆发,其特征是疫情早期阶段确诊病例存在明显的代数亚指数级增长,这与预计的再生数足够大时无约束爆发初始阶段指数增长明显不同。虽然中国大陆受到影响的不同省份案例数显著不同,t^μ这一尺度律却有令人惊讶的普遍性,μ指数范围处于2.1±0.3。这种普遍性表明,尽管中国受影响省份的社会、区域、人口、地理和社会经济有很强的异质性,本次疫情爆发是标准流行病学模式未能刻画的一些基本机制主导的。我们发现,观察到的尺度律是有效地减少易感人群政策的直接结果。为此我们引入一个简化模型,既考虑有症状感染个体的隔离,又考虑了相应政策和行为变化导致的群体层面隔离。模型再现了大范围各种参数下观察到的确诊病例尺度律,并解释了所观察到的指数。定量拟合经验数据,可以识别无症状或轻微症状数、未检出感染者数的达峰时间,并估计基本再生数的区域差异。模型表明,观察到的确诊病例数尺度律是有效的控制策略和/或影响大量易感人群的系统行为改变的直接结果。这些见解可能有助于实施控制策略,遏制潜在外出导致的COVID-19二次爆发,或者未来其他的新兴传染病爆发。
“更高”地位的语言并不总是赢:
英语在印度的衰落和印地文的崛起
The “higher” status language does not always win: The fall of English in India and the rise of Hindihttp://arxiv.org/abs/2002.05787Kushani De Silva, Rana D. Parshad, Aladeen Basheer, Kwadwo Antwi-Fordjour, Matthew A. Beauregard, Vineeta Chand摘要: 古典语言动力学解释语言转变,因为在音箱采用了较高的地位语言代替地位较低语言的过程。这也与具有外竞争的语言,如苏格兰盖尔语,威尔士语和国语英文记录。在1961-1991的印度人口普查报告在印地文/英双语急剧增加,这表明英语在印度的崛起 - 是从竞争的印地文。然而,1991年至2011年的数据显示,双语人数已经饱和,而单语印地文扬声器继续成倍上升。为了捕捉这种反直觉的动态,我们提出了单语印地文扬声器和印地文/英双语,捕捉过去的50年,近乎完美的精确度的印度人口普查数据之间的交互的小说语言动力学模型,跑赢上最著名的语言动力学模型从文献。因此,我们提供的具有出竞争较高的地位语言地位较低语言的第一示例。Transition of University to Prosumer Consortium Energy Modelhttp://arxiv.org/abs/2002.05788Kaung Si Thu, Min Set Aung, Weerakorn Ongsakul, Nimal Madhu Manjiparambil摘要: 传统的电网系统中有许多重要的问题,这可能导致功率不稳定,停电等诸多问题。一个主要观点是消耗在自适应系统中的分布式可再生能源的相对量。产消者联盟模型的一个小社区可以是解决方案之一,以减少用电,提高工作效率的价格和大学提供更好的电子化,而且,要解决电力大学一级频繁停电在发展中国家。它可以为研究人员的学习机会,以及为消费者所大学的网格内的互补优势。Disentangling Overlapping Beliefs by Structured Matrix Factorizationhttp://arxiv.org/abs/2002.05797Chaoqi Yang, Jinyang Li, Ruijie Wang, Shuochao Yao, Huajie Shao, Dongxin Liu, Shengzhong Liu, Tianshi Wang, Tarek F. Abdelzaher摘要: 在社交媒体上的意见两极分化大部分工作集中在如何识别从媒体的痕迹独立或正交的信念,从而错过协议要点不同社区之间。本文开发一类新的,允许两者一致和不一致鉴定点时不同的社区的信念部分重叠非负矩阵分解(NMF)的算法。具体来说,我们建议结构化矩阵分解算法(BSMF)一种新颖的信仰,以确定在偏振公共社会媒体部分重叠的信念。 BSMF是完全无监督并考虑三种类型的信息:(ⅰ)谁发布其看来,(ⅱ)关键字级消息的相似性,和(iii)经验观察社会依赖图(例如,转推的曲线图),提高信念的分离。在无监督信念分离算法的空间中,强调了主要给予识别不相交的信念的问题(例如,冲突)。当与不同信仰的个体上的点的某个子集一致的情况下少了探讨。我们注意到,社会信仰在极化情况下甚至重叠。我们所提出的无监督的算法同时捕捉潜在的信念交叉点和不同点。我们讨论了算法的性能,在人工数据和真实数据集进行大量的实验。结果表明,我们的模型由一个伟大的利润率优于所有比较基准。
通过实验的公平:不平等的A/B
测试作为一种负责任设计的方法
Fairness through Experimentation: Inequality in A/B testing as an approach to responsible designhttp://arxiv.org/abs/2002.05819Guillaume Saint-Jacques, Amir Sepehri, Nicole Li, Igor Perisic摘要: 随着技术的不断进步,越来越多的被遗漏的个人背后的关注。许多企业都在努力采取负责任的设计经验,避免他们的产品和服务的任何意想不到的后果,从隐私漏洞,算法偏差。我们提出了一个新的方法来基于实验的公平性和包容性。我们使用的实验,因为我们希望不仅评估产品和算法的内在特性,而且其对人们的影响。我们通过引入一个不等式方法A / B测试,利用从经济学文献阿特金森指数做到这一点。我们展示如何在这种不平等的措施进行因果推断。我们还介绍了站点范围内的不平等的观念冲击,捕捉了实验针对特定亚群的包容性的影响,并说明如何对这种影响进行统计推断。我们提供从LinkedIn真实事例,以及一个开放源码的,高度可扩展的实施阿特金森指数的计算及其在星火/方差斯卡拉的。我们还提供了一年的学习收获的 - 通过大规模部署我们的方法和分析的实验,数千人聚集 - 在哪些领域和种类的产品创新似乎天生培育公平,通过包容其中。A network perspective on intermedia agenda-settinghttp://arxiv.org/abs/2002.05971Samuel Stern, Giacomo Livan, Robert E. Smith摘要: 在通信理论中,中间议程设置是指影响,不同的新闻来源可能会对对方,而这随后如何影响呈现给公众的信息的广度。一些研究试图量化中间议程设置对特定国家或环境的影响,但大规模,数据驱动的调查仍然缺乏。在这里,我们提出一个特定主题的方法,以不同的消息源之间的相互影响的推断网络中间投入运作议程设置,并将其应用在由全球和本地著名新闻机构在2016年我们发现,发表了大量的数据集新闻报道影响是显著话题相关,具有相同的新闻来源作为议程的制定者(即中心节点),相对于某些主题和追随者(即外围节点)相对于其他。与此同时,我们发现关联最多的话题影响网络表现出小世界性质,我们发现朝表示有关网络中的新闻来源的主题情感的整体多样性发挥显著作用。特别是,我们发现集群和影响网络的密度,以作为在这方面的竞争力,前者增加后者减少的多样性。Site-dependent levelized cost assessment for fully renewable Power-to-Methane systemshttp://arxiv.org/abs/2002.06007Simon Morgenthaler, Christopher Ball, Jan Koj, Wilhelm Kuckshinrichs, Dirk Witthaut摘要: 从可再生电力合成天然气的产生使得能够长期能量储存和提供清洁燃料运输。在这篇文章中,我们采用在欧洲范围内应用于两个区域的一个高清晰度的能量系统优化模型分析完全可再生的电力对甲烷系统。最优化的系统的布局和操作依赖于天然资源,这位置和年之间变化的可用性。我们发现,比太阳能更风使用,而使用中间的电池蓄电系统几乎没有影响。甲烷的生成的平准化成本和0.24 0.30欧元/ kWh和63%和78%之间的经济最佳利用率之间变化。我们进一步讨论如何电网对甲烷系统的经济竞争力可以通过技术开发和利用的副产品,如氧气和截尾用电得到改善。敏感性分析表明,加息对平准化成本影响最大,其次是风能和电解槽堆栈中的投资成本。The hidden universality of movement in citieshttp://arxiv.org/abs/2002.06070Markus Schläpfer, Michael Szell, Hadrien Salat, Carlo Ratti, Geoffrey B. West摘要: 与他们的环境取决于他们的运动模式的所有移动物种的相互作用:去过的地方,以及如何频繁,他们去那里。在人类社会中,在同居的普遍的形式是在城市中,人们的高度动态的和多样化的运动是根本社会经济生活的各个方面,包括社会交往或疾病蔓延,最终的关键是城市演化基础设施,生产力,创新和技术。然而,尽管在城市运动的时空结构中的重要作用,支配人口的变化规律流向特定位置仍然难以实现。在这里,我们表明,后面的活动的明显的复杂性令人惊讶的简单通用的标度关系驱动的个人基于探视和距离的两个频率的任何特定的位置流走。我们得出一个基本原理的说法,指出个人参观的人数应该减少探视的频率和行驶距离的乘积的平方成反比;或者等价地,与指数 约功法! - 2利用大规模数据的分析,我们证明了人口流动服从这个理论预测在几乎所有的测试领域在全球范围内,从欧美到亚洲,非洲,无论详细的地域,文化和发展水平。该发现规律提供了前所未有的可能性流动性的造型通量高时空分辨率,而且它放在运动,空间组织和社会互动的城市中的任何理论的重要制约因素。Diffusion and Consensus in a Weakly Coupled Network of Networkshttp://arxiv.org/abs/2002.06109Yuhao Yi, Anirban Das, Stacy Patterson, Bassam Bamieh, Zhongzhi Zhang摘要: 我们在网络网络模型研究扩散和共识动态。在这个模型中,子网络的集合,使用少量的链路连接到彼此。我们考虑了一个平台,网络之间的联系有小的权重,或比每个子网内的链路较少使用。使用谱微扰理论,我们分析研究了系统的扩散速度和收敛速度。我们的分析表明,扩散和收敛速度的一阶近似是独立的个体图的拓扑结构;率只在每个曲线图中的节点的数目和连接边的拓扑依赖。二阶分析示出了扩散和收敛速度和每个子网络内的连接节点的信息中心性之间的关系。我们进一步强调,通过数值例子,这些理论成果。U.S. Test System with High Spatial and Temporal Resolution for Renewable Integration Studieshttp://arxiv.org/abs/2002.06155Yixing Xu, Nathan Myhrvold, Dhileep Sivam, Kaspar Mueller, Daniel J. Olsen, Bainan Xia, Daniel Livengood, Victoria Hunt, Benjamin Rouillé d’Orfeuil, Daniel Muldrew, Merrielle Ondreicka, Megan Bettilyon摘要: 规划具有可变的可再生能源的高穿透功率系统需要较高的空间和时间粒度。然而,大多数公开可用的测试系统的保真度不足以开发方法和工具用于高分辨率的规划。本文呈现的方法来构建高空间分辨率的开放存取测试系统以更准确地代表的基础设施和高时间分辨率代表随需而变资源的动态。为了说明,仅使用公开数据创建代表美国高分辨率测试系统。该测试系统是通过在生产成本模型运行它,用对历史的一代产品相比,以确保它们代表的结果验证。得到的开源测试系统可以支持电源系统的过渡计划和援助工具发展到答题围绕如何最好地实现脱碳的目标,使用传输扩展,可再生能源发电和储能的最有效的组合。Providing a Link Prediction Model based on Structural and Homophily Similarity in Social Networkshttp://arxiv.org/abs/2002.06171Alireza Eshaghpour, Mostafa Salehi, Vahid Ranjbar摘要: 近年来,随着越来越多的在线社会网络,这些网络已经成为广告和商业的最好的市场之一,因此研究这些网络是非常重要的。在在线社会网络预测新的边可以给我们更好的理解这些网络的增长。目前已在工程和人文领域的链路预测的许多研究。科学家属性的两个个体之间的新的关系的存在有两个原因:1)临近的曲线图(结构)2)的两个个体的相似特性(Homophile定律)。然而,研究共同创造新的优势这两种方法的影响仍然是一个悬而未决的问题。相似性度量也可分为两大类;邻居为基础和路径为主。到目前为止,上述两种理论方法(接近和homophile)尚未发现一起在基于邻域指标。在本文中,我们首先尝试提供一个解决方案来确定距离该图的连接图和类似功能的重要性。然后将得到的权重被分配给两个接近和homophile。然后,获得在每一种方法最好相似性度量。最后,所选择的度量同质相似性和结构相似性的组合与所获得的权重。这项研究的结果对两个数据集进行了评价;社会科学与Pokec在线社会网络的赞詹大学研究生院。第一个数据集收集了这项研究,然后将问卷调查和数据收集方法进行填写。由于该数据集是已编译其用户的规格伊朗几集的一个,也可以是很有价值的。在本文中,我们已经能够通过使用图中,两个接近增加基于邻域的相似性度量的精确性和趋同性方法。The Benefits of Segmentation in Trial-Offer Markets with Social Influence and Position Biashttp://arxiv.org/abs/1511.00750Franco Berbeglia, Gerardo Berbeglia, Pascal Van Hentenryck摘要: 本文研究的程式化试报价市场模式,其中单个企业提供的产品,具有消费者与异构喜好排名策略。消费者试验是由过去的购买影响,各产品的排名。该平台拥有者需要制定一个等级策略,以显示产品,最大限度地从长远来看,购买的数量。该模型提出的试图理解市场细分的一个试的报价与市场社会影响力的影响。在我们的模型中,消费者的选择是基于被称为混合MNL一个非常普遍的选择模型。我们分析这些高度复杂的随机模型的长期动态,我们量化细分市场的预期收益。当显示过去的购买,消费者的异质性,使购房者尝试次优的产品,降低了整体的销售率。我们发现,消费者的异质性使得排名问题NP难问题。然后,我们分析市场细分的好处。我们发现较小的范围,以提供不同的排名,以每个消费者段的预期收益。最后,我们证明了市场细分策略总是从社会影响力的好处就是使用平均质量时的排名。其中的管理意义的是,该公司已关闭使用时,各种消费偏好是有限的总排名的政策更好,但是当消费者高度异质性,应该进行市场细分策略。我们还表明,这一结果是稳健的相对较小的消费分类错误;当这些大时,聚集体的排名是优选的。Clustering in graphs and hypergraphs with categorical edge labelshttp://arxiv.org/abs/1910.09943 Ilya Amburg, Nate Veldt, Austin R. Benson摘要: 现代图或网络数据集通常含有丰富的结构,它超越了节点之间的简单配对连接。这需要复杂的表述,可以捕获,例如,不同类型的边,以及所谓的“高阶相互作用”涉及在同一时间超过两个节点。然而,我们也减少了严格的方法,可以从这样的表示提供洞察力。在这里,我们开发了一个计算框架与分类边的标签—-或不同的交互类型—-超图聚类的问题,其中簇对应于经常参加同类型的交互节点组。我们的方法是基于有关相关集群上图,但允许的更有效的算法,也无缝推广到超图设计一个组合的目标函数。当只有两个标签类型,我们的目标可以在多项式时间进行优化,使用基于最小割的算法。最大限度地减少我们的目标变得NP难有两个以上的标签类型,但我们开发基于具有理论集群质量保证线性规划松弛的快速近似算法。我们证明我们的算法的有效性和模型,通过在边标签社区发现问题的严重程度,与时间数据,并探索性数据分析聚类。Modeling Citation Trajectories of Scientific Papershttp://arxiv.org/abs/2002.06628Dattatreya Mohapatra, Siddharth Pal, Soham De, Ponnurangam Kumaraguru, Tanmoy Chakraborty摘要: 一些网络增长模式已经在试图整合引文网络的性能文献中提出。一般情况下,这些模型的目的是保留在现实世界网络中观察到的程度分布。在这项工作中,我们探讨了现有网络的增长模式是否能够实现由单篇论文引用呈现增长的多样性 - 跨越研究多个领域中引述的网络最近观察到一个新的节点为中心的财产。我们从理论和经验表明,这是完全基于度和/或内在适应度网络的增长模式无法实现了在现实世界中引网络观察一定时间的生长行为。为此,我们建议通过适当的连接机构定位的论文影响的两个新的增长模式。在计算机科学和物理学领域的现实世界引网络实验结果表明,该模型能够更好地解释引网络比现有车型的时间行为。Extracting hierarchical backbones from bipartite networkshttp://arxiv.org/abs/2002.07239Woo Seong Jo, Jaehyuk Park, Arthur Luhur, Beom Jun Kim, Yong-Yeol Ahn摘要: 我们提出了从二分网分层提取主干的方法。我们的方法利用了观察结果的二分网络的两个节点之间的分层关系往往表现为从其它节点组观察到它们的连接的条件概率的不对称性。我们的方法估计重要性以及一对节点之间的分层关系的方向,由此提供灵活的方式来识别该网络的主要部分。使用半合成基准测试,我们证明了我们的方法优于现有的方法是确定种植层次,同时提供更大的灵活性。我们的方法的实证数据集的应用—-技能和个人以及基因产物和基因本体论(GO)术语之间的网络二分网—-演示的自动提取或数据增强本体的可能性。P2C2: Peer-to-Peer Car Charginghttp://arxiv.org/abs/2002.07268Prabuddha Chakraborty, Robert C. Parker, Tamzidul Hoque, Jonathan Cruz, Swarup Bhunia摘要: 随着化石燃料枯竭的关注不断上升和内燃机(ICE)的车辆对气候的影响,交通运输行业是观察电动汽车(EV)的快速增殖。然而,长途旅行withEV是不可能的只是他没有在电动汽车充电站进行多次停顿。很多偏远地区没有充电站,即使它们存在,它可能需要几个小时给电池充电。相反,ICE车辆加气站是更为普遍,并重新加油花费几分钟的时间。这些事实已阻止移动到电动车很多。现有的解决这些问题,比如建造更多的充电站,增加电池容量,和道路收费,也没有证明有效为止。在本文中,我们提出了对等网络汽车充电(P2C2),对以最小的成本开销去充电电动车一个高度可扩展的新技术。我们允许电动汽车共享基于从基于云的控制系统的说明彼此之间的费用。该控制系统分配和引导电动汽车充电共享。我们还介绍了移动充电站(MOCS),其是用于补充在车辆网络中的总电荷高电池容量车辆。我们已经实施了P2C2,并与交通仿真,SUMO整合它。我们观察到有前途的,最多减少65%的EV暂停的数量与所需的电池容量降低到24.4%,没有任何额外的暂停效果。Adversarial Deep Network Embedding for Cross-network Node Classificationhttp://arxiv.org/abs/2002.07366Xiao Shen, Quanyu Dai, Fu-lai Chung, Wei Lu, Kup-Sze Choi摘要: 在本文中,跨网络的节点分类,它利用从源网络丰富标记的节点,以帮助在分类目标网络节点的未标记的任务,进行了研究。现有的域自适应算法通常不能在网络结构信息进行建模,和当前的网络中嵌入模型主要集中在单网络应用。因此,它们两者不能被直接应用到解决跨网络节点分类问题。这促使我们提出的对抗跨网络的深嵌入网络(ACDNE)模型来整合对抗领域适应性深嵌入网络,以学习网络不变节点表示也能很好地保持网络结构信息。在ACDNE,深网络嵌入模块采用了两个特征提取,以共同维护归因亲和力和节点之间的拓扑上的近似。另外,节点分类结合,使节点陈述标签辨别。此外,当采用对抗性域自适应技术,使节点表示网络不变。广泛的实验结果表明,所提出的模型ACDNE实现了在跨网络节点分类的状态的最先进的性能。Generating random bigraphs with preferential attachmenthttp://arxiv.org/abs/2002.07448Dominik Grzelak (1 and 2), Barbara Priwitzer (3), Uwe Aßmann (1 and 2) ((1) Software Technology Group at Technische Universität Dresden, (2) Centre for Tactile Internet with Human-in-the-Loop (CeTI) at Technische Universität Dresden, (3) Fakultät Technik at Hochschule Reutlingen)摘要: 该bigraph理论是一个相对年轻,还没有正式严谨,数学框架涵盖一方面是罗宾·米尔纳先前关于处理结石的工作,并提供了一个通用的元模型的复杂系统,如多主体系统,对其他。甲bigraph F = langle˚F^ P,F ^大号 rangle 是两个独立的图结构的,其包括一个地方图表 F ^ P (即,森林)和链接图 F ^大号(叠加即,超图),共享相同的节点集,以彼此独立地表达的过程局部性和通信。在本文中,我们迈出的算法一些准备用于生成与择优功能w.r.t.随机bigraphs F ^ P 和选型(异配)联动模式w.r.t. F ^ 大号。我们采用的参数,允许一个微调产生的bigraph结构的特点。为了研究我们的算法模型的模式形成特性,我们分析基于在不同的配置人工创造bigraphs图论的几个指标。 Bigraphs提供了一个非常有用和表达语义的过程结石移动和全球无处不在的计算。到目前为止,这个问题还没有在bigraph相关科学文献受到关注。然而,人工模型可以用于在无处不在的系统迫使随机结构现实世界的应用模拟和评估特别有用。A Model to Measure the Spread Power of Rumorshttp://arxiv.org/abs/2002.07563Zoleikha Jahanbakhsh-Nagadeh, Mohammad-Reza Feizi-Derakhshi, Majid Ramezani, Taymaz Rahkar-Farshi, Meysam Asgari-Chenaghlu, Narjes Nikzad-Khasmakhi, Ali-Reza Feizi-Derakhshi, Mehrdad Ranjbar-Khadivi, Elnaz Zafarani-Moattar, Mohammad-Ali Balafar摘要: 如今,每天的互动职位的社交媒体显著部分被传言感染。这项研究调查了来自其他研究不同领域的传闻分析的问题。它铲球首次与计算传闻(SPR)的扩展的功率未编址的问题,并寻求检查蔓延功率的多上下文特征的功能。为此,奥尔波特和邮差的理论会被采纳。在它声称,有两个关键因素决定因素的传言,即重要性和模糊性的传播力量。所提出的谣传功率测量模型(RSPMM)计算通过利用基于文本的方法这需要上下文特征来计算谣言的传播力量两类SPR:谣言(FR)和真谣言(TR)。共51上下文特征被引入到测量SPR及其对分类的影响进行了研究,然后42个特征在两个类别“重要性”(28个功能)和“模糊”(14个功能)被选择为计算SPR。所提出的RSPMM是在两个标记的数据集,这是从Twitter和电报收集核实。结果表明:(i)所述建议的新功能是有效和高效率的FR和TRS之间进行区分。 (ⅱ)所提出的方法RSPMM仅集中在上下文特征而现有技术是基于结构和内容的功能,但RSPMM达到相当优秀的结果(F值= 83%)。 (ⅲ)的T-试验表明,SPR准则可以FR和TR之间显著区分结果,此外,它可以是作为验证传言真实性的新方法是有用的。Tie Strength in Online Social Networks and its Applications: A Brief Studyhttp://arxiv.org/abs/2002.07608Chandni Saxena, Tanvir Ahmad摘要: 在在线社会网络(OSN),了解绑定角色和交互(并列)的强度的因素是必不可少的,各种基于网络的应用模型。这些相互作用的识别可以提高链路预测的准确性,提高优势种,推荐的可靠性排名,增强针对性的营销决策支持系统。近年来,在OSN及其应用到不同领域的关系强度措施的研究兴趣有所增加,因此需要一个全面的检讨涵盖关系强度估算系统。本文的目的是提供一个深入审查,分析和探讨在线社会网络的关系强度。甲有条不紊类别关系强度估计技术进行了讨论和在各种网络类型的分析。关系强度估计的代表性应用也解决。最后,一组在在线社会网络的关系强度未来的挑战进行了讨论。Computing the k Densest Subgraphs of a Graphhttp://arxiv.org/abs/2002.07695Riccardo Dondi, Danny Hermelin摘要: 计算凝聚力子图是图论中一个核心问题。虽然凝聚力子图的许多配方导致NP难的问题,找到一个最密集的子能在多项式时间内完成。因此,最密集的子模型已成为凝聚力的最流行的概念。近日,数据挖掘社区已经开始寻找到计算最密集ķ在子图给定图,而不是一个,与子图之间的可能的重叠各种限制的问题。然而,似乎有从理论的角度来看这个重要的和自然的推广非常鲜为人知。在本文中,我们希望通过对k个最密集的子图问题的三个自然变种,以纠正这种情况。各变体的不同取决于所允许的子图之间的重叠量。在一个极端情况下,当不存在重叠是允许的,证明了该问题是NP-hard的对于k> = 3,但对于多项式时间解ķ<= 2。在另一个极端,当重叠允许没有任何限制和溶液子图只需要是不同的,我们表明,该问题是固定参数可解相对于k和承认对常数k一个PTAS。最后,当一个有限的重叠的被允许的子图之间,证明了该问题是NP-hard的对于k = 2。Elitism in Mathematics and Inequalityhttp://arxiv.org/abs/2002.07789Ho-Chun Herbert Chang, Feng Fu摘要: 菲尔兹奖,通常被称为数学的诺贝尔奖,是40岁以下的授予不超过四个数学家,每四年。近年来,它的授与已受到数学历史学家的审查,对奖励现有的精英,而不是原来的从代表性不足的社区提升数学家的目标。精英集中在引文中的做法和子域之前的研究;防止公平获得的结构性力量仍不清楚。在这里,我们表现出国家和行话民族认同之间的精英数学家的流量,使用网络分析和自然语言处理的240000名数学家和他们的顾问,advisee关系。我们发现,菲尔兹奖帮助二战后,日本的整合通过场周围形成奖牌的精英圈子的分析。阿拉伯,非洲和东亚的身份留在精英级别的代表性不足。通过流入和流出的分析,我们认为反驳少数民族社区创建自己的进入门槛的神话。我们的研究结果表明协调一致的努力,国际学术委员会,如颁奖,是一股强大的力量给予平等的机会。我们预计我们的学术系谱分析方法可以作为有用的诊断为学术领域内的平等。A flexible outlier detector based on a topology given by graph communitieshttp://arxiv.org/abs/2002.07791O. Ramos Terrades, A. Berenguel, D. Gil摘要: 离群或异常,检测是机器学习方法和统计预测模型的最佳性能至关重要。这不仅是在数据清洗工艺技术一步,但在很多领域,如欺诈票据检测,医疗应用和辅助诊断系统或检测安全威胁的一个关键问题。与此相反,以人口为基础的方法,基于邻里地方做法是要在小样本不平衡问题表现良好的潜力简单灵活的方法。然而,当地的做法主要关注的是,每个样本居委会的计算对方法性能的影响。大多数方法使用距离特征空间定义需要的几个参数仔细选择一个社区。这项工作提出了一种基于样本标签的视为拓扑流形特征空间异质性的地方措施的本地方法。拓扑结构是使用加权曲线特征空间编纂相互最近邻的社区计算。通过这种方式,我们提供了一套能够描述复杂的空间结构不带参数的微调多个街区。在真实世界的数据集的大量实验表明,我们的方法整体性能优于,无论是在多单视图设置局部和全局的战略。Latent Poisson models for networks with heterogeneous densityhttp://arxiv.org/abs/2002.07803摘要: 实证网络通常全局稀疏,具有小的平均数目每节点的连接,当与所述网络的总大小的。然而,该稀疏趋于不是均匀的,和网络也可以是局部密集,例如具有连接到网络的其余部分的大部分,或用节点的小基团具有大的概率它们之间的连接的几个节点。在这里,我们展示了如何潜伏泊松模型,其生成隐藏的多重图可以捕捉这个密度不均匀性有效,而在数学不是一些简单的模型图直接的替代品更容易处理。我们将展示如何这些潜在重图可以从数据上简单的图表来重建,以及如何使我们能够解开强加于度序列的制约dissortative度度的相关性,并改善社会结构的经验有关的场景识别。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!