核心速递
推导齐普夫定律——最省力原则VS最高效率;
使用广义主导树解释图的多粒度性;
- 从已有的观测生成大量人口的描述性社会网络:一种新颖的方法和生成器;
- 现代城市涌现为“超级细胞”,其中闭环工业系统是商品和服务的热点;
- JD贝尔纳思想对中国科学学的影响:对当今科学定量研究的启示;
- 考虑风险的微电网边缘计算能源调度:多主体深度强化学习方法;
- AGL:一个可扩展的系统用于工业用途的图机器学习;
- Hadath:从社交媒体地图到多分辨率事件扩展地图;
Deriving Zipf law — principle of least effort vs maximum efficiencyhttp://arxiv.org/abs/2003.02376摘要:这项工作提供了一个数学工具直接从理念得到齐普夫帕累托定律,生活系统始终遵循他们的活动最省力的规则。为了实现这个想法在考虑到工作的输出以及一般的方式,我们引入了功能效率,而不是努力。该效率与最大的大量的该输出工作的主体的所有的系综的总产量的同时最大化。该齐普夫帕累托定律自然地从这个演算变化出来。这种效率提供了性能的可能措施。The Multi-granularity in Graph Revealed by a Generalized Leading Treehttp://arxiv.org/abs/2003.02708摘要:有网络分层的特点,以及如何有效地揭示了网络中的分层特性是网络结构的研究问题。如果一个节点被分配给它所属的社区,如何将社区分配给社会,它属于是一个问题的一个更高的水平。在本文中,数据点的密度基于聚类任务的影响。通过形成的数据点的密度,数据点的分层差异的构造。与数据点之间的距离的组合,基于密度的领先树可以构造。但是,在一个图结构,它是建立领先树显示图上的节点的层次关系的问题。基于树的形成基于密度的方法中,本文延伸导致树图中的节点的分层结构的模型,论述图节点的重要性,并形成主导树,可以揭示图节点和所述的层次结构社区的依赖。实验是在真实数据组进行的,并且在实验中形成的树结构。该图领先树能很好地揭示图结构的层次关系。
从已有的观测生成
大量人口的描述性社会
网络:一种新颖的方法和生成器
Generate Descriptive Social Networks for Large Populations from Available Observations: A Novel Methodology and a Generatorhttp://arxiv.org/abs/2003.02213摘要:当模拟与面向主体的方法一个社会动态,研究人员描述了人群中相互作用的结构。考虑到庞大的网络收集的困难性,它们所依赖的应该探索可行的网络空间随机网络发生器。首先,我们确定建模的需求,包括将考虑到网络的属性对异质个体和区分不同类型的社会联系是导致不同的相互作用。我们指出在散统计和定性观察的表单数据,应当使用参数发电机的存在。我们提出了一个新的途径特有的基于主体的建模,我们在其中会产生从个人观察到的属性的社会联系,并返回它们的多重网络。社会经济属性,并生成规则之间的相互依存关系,被编码为贝叶斯网络。一个方法,通过这些参数的形式化建模指导。这种方法是通过描述交互的支持在肯尼亚农村避孕解决方案的扩散结构所示。Observational daily and regional photovoltaic solar energy production for the Netherlandshttp://arxiv.org/abs/2003.01728Benjamin P. M. Laevens, Olav ten Bosch摘要:本文介绍了获得由荷兰光伏太阳能系统产生的发电量,每天和地区的基础上,在2016年和2017年的新方法,我们确定了两个新的数据源来构建我们的方法:pvoutput,一个在线门户实时的太阳能产能的信息,和高分辨率辐射数据,从荷兰皇家气象研究所。结合这些资源,可以让我们每天的基础上链接辐射和能量。我们将此信息提供给我们的光伏系统的数据库,使我们能够获得日常和年度太阳能产量。我们分析由于考虑pvoutput系统的不同子集有一定的规范,如方向,倾斜和逆变器PV容量比的结果,在我们的日常和年度预测的变化。我们获得的877-946千瓦时/ kWp的和838-899千瓦时/ kWp的具体的年度能源产量为2016和2017年分别,这意味着在荷兰统计局目前使用的方法低估和高估分别在2016和2017年全年的产量。最后,我们我们国家的估计转化为全市太阳能产量。这项研究表明,太阳能发电的辐照基于措施是必要的,以产生两个国家和地区层面更准确的能源产量。Introducing the Spatial Conflict Dynamics indicator of political violencehttp://arxiv.org/abs/2003.01750Olivier J. Walther, Steven M. Radil, David Russell, Marie Trémolières摘要:现代武装冲突有跨越国界洒武装团体搬迁到国家那里是较少的军事能力或政治倾向与他们战斗的倾向。迄今为止,这些冲突的空间扩散仍然充分开发。为了填补这一空白,本文提出了一种新的空间冲突动态指标(SCDI),该措施的力度,并在2019年从1997年的地方一级政治暴力的空间集聚由于武装冲突位置和事件数据项目这种新的资源数据的杠杆作用从1997年至二零一九年(ACLED)。适用于北非和西非的情况下,新空间指示器显示哪些地区体验最矛盾,冲突地理位置如何变化随着时间的推移,以及如何干预外国影响冲突的地理。Discover Your Social Identity from What You Tweet: a Content Based Approachhttp://arxiv.org/abs/2003.01797Binxuan Huang, Kathleen M. Carley摘要:身份表示中的作用的个体或一组在高度分化当代社会播放。在本文中,我们的目标是基于角色的身份Twitter用户进行分类。我们首先会自动收集粗粒度的公众人物数据集,然后手动标注更细粒度的身份数据集。我们提出了Twitter的用户角色身份分类分层的自我关注的神经网络。我们的实验表明,该模型显著优于多个基准。我们进一步建议,提高了一大截我们的模型的性能转移的学习方案。这种转移学习也大大减少了对大量的人力标记数据的需要。Hypergraph Motifs: Concepts, Algorithms, and Discoverieshttp://arxiv.org/abs/2003.01853Geon Lee, Jihoon Ko, Kijung Shin摘要:超图自然代表团体互动,这是在许多领域无所不在:研究人员的合作,项目,蛋白质的相互作用联合共同采购,仅举几例。在这项工作中,我们提出了回答下列问题,以系统化的方式的工具:(Q1)什么是真正的世界超图的结构设计原则是什么?(Q2)我们如何能够比较不同大小的超图的局部结构?(Q3)怎样才能识别哪些域超图从?我们首先定义超图模体(H-基序),其描述的三个互相连接的超边连通的模式。然后,我们在超图作为它的出现相对于那些在适当的随机超图定义每个H-主题的意义。最后,我们定义特征轮廓(CP)为每H-主题的标准化意义的载体。对于第一季度,我们发现,H-模体11真实世界的5个域超图的出现显然不同于随机超图的区别。此外,我们证明了在各个领域的独特的CP捕捉局部结构模式,因而比较超图地址Q2和Q3的CP。我们的算法的贡献是提出MoCHy,一个家庭在一个超图计数H-模体出现并行算法。从理论上分析他们的速度和准确性,我们证明经验的高级近似版本MoCHy-A +分别高达25倍比基本近似和详细的版本更快更准确和32X。
现代城市涌现为“超级细胞”,其中
闭环工业系统是商品和服务的热点
Modern cities emerge as ‘super-cells’ where enclosed industrial systems are hotspots of goods and serviceshttp://arxiv.org/abs/2003.01881Jie Chang, Ying Ge, Zhaoping Wu, Yuanyuan Du, Kaixuan Pan, Guofu Yang, Yuan Ren, Mikko P. Heino, Feng Mao, Zelong Qu, Xing Fan, Yong Min, Changhui Peng, Laura A. Meyerson摘要:当时的假设认识城市作为“超级有机体”,这既提供了一种组织原则,为城市和填充生态系统和整个地球之间的层级生命系统的标量差距。然而,生物和城市的特质之间最类比是不恰当的使超级有机体模型不切实际的,因为获取新知识的一种手段。使用的城市和其他生命系统的15个性状的聚类分析,我们发现,现代城市更类似于真核细胞,而不是多细胞生物。封闭式工业系统如工厂和温室,主宰现代城市和类似于细胞器作为提供高通量商品和服务的热点。因此,我们提出了一个“超级电池城市模型”作为比超生物模型更合适。除理论意义,我们的模型也承认密闭的工业系统,改善城市的活力和可持续性功能组件。Developing a Resilient, Robust and Efficient Supply Network in Africahttp://arxiv.org/abs/2003.02131Bruce A. Cox, Christopher M. Smith, Timothy W. Breitbach, Jade F. Baker, Paul P. Rebeiz摘要:供应链需要平衡竞争的目标;除了效率,他们需要的是弹性的对抗性和环境的干扰,稳健的长期需求的不确定性。显著的研究已经进行了设计高效的供应链,以及近期的研究主要集中在弹性的供应链设计。然而,弹性和强大的供应链一体化的设计较少很好的研究。本文开发的方法,包括弹性和坚固性供应链设计。使用西非,这是困扰着持续的后勤问题的地区,我们制定区域风险评估框架,然后应用类别风险西非的使用公开数据的国家。接下来,我们开发了一个数学模型,利用这个框架来设计的弹性供应网络,最大限度地减少,同时确保中断后的网络功能的成本。最后,我们通过几个似是而非的紧急情况下检查网络的鲁棒性需求的不确定性。
JD贝尔纳思想对中国科学学的
影响:对当今科学定量研究的启示
Impact of JD Bernal Thoughts in the Science of Science upon China: Implications for Quantitative Studies of Science Todayhttp://arxiv.org/abs/2003.02135Yong Zhao, Jian Du, Yishan Wu摘要:约翰·德斯蒙德·伯纳尔(1901至1970年)是分子生物学中最杰出的科学家之一,也被视为国父科学的科学。科学的他的书的社会功能奠定了理论基础的学科。在这篇文章中,我们总结了他在科学的科学思想四位主要特点:社会历史的角度来看,理论模型,定性和定量方法,科学规划和政策的研究。中国不断改革,基于科学的科学的研究证据的科学技术体系。因此,我们分析的伯纳尔科学 - 的 - 科学思想的科学学在中国的发展的影响,并讨论它们如何有效地采取更进一步的科学的定量研究。
考虑风险的微电网边缘计算能源
调度:多主体深度强化学习方法
Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A Multi-Agent Deep Reinforcement Learning Approachhttp://arxiv.org/abs/2003.02157Md. Shirajum Munir, Sarder Fakhrul Abedin, Nguyen H. Tran, Zhu Han, Eui Nam Huh, Choong Seon Hong摘要:近年来,多接入边计算(MEC)是用于处理物联网(IOT)应用程序和服务网络的大规模扩张的关键因素。然而,MEC网络的能耗取决于挥发性任务诱导能源需求估计风险。作为一个能源供应商,微电网可以促进无缝的能源供应。然而,随着能源供应相关的风险也由于可再生和不可再生能源提高到不可预知的能源发电。特别是能源短缺的风险是参与在能源消耗和产生的不确定性。在本文中,我们研究了微电网供电MEC网络风险意识的节能调度问题。首先,我们制定考虑了能源消耗和生成,其中目标是尽量减少MEC网络能源短缺的损失条件值下的风险(CVaR的)测量的优化问题,我们证明这个问题是一个NP-困难的问题。其次,我们采用了多剂随机的博弈,保证了联合政策纳什均衡分析我们制定的问题,并表明了该模型的收敛。第三,我们推导出通过将多剂深强化学习(MADRL)溶液的基于异步优点演员评论家(A3C)具有共享神经网络算法。这种方法减轻了状态空间的维数的诅咒,并选择主体商所提出的问题中最好的政策。最后,实验结果建立通过考虑所提出的模型比单和随机主体模型两者的高精度节能调度CVaR的一个显著的性能增益。
Factorized Graph Representations for Semi-Supervised Learning from Sparse Data
http://arxiv.org/abs/2003.02829Krishna Kumar P., Paul Langton, Wolfgang Gatterbauer摘要:节点分类是图数据管理的一个重要问题。它通常来自那些反复从几个标记种子节点启动各种标签繁殖方法解决。用于与类之间的任意相容性的曲线图,这些方法关键取决于知道必须由领域专家或启发式来提供兼容性矩阵。我们能不能,而不是直接估计正确的兼容性在一个有原则的和可扩展的方式稀疏标号图?我们肯定回答这个问题,建议你采用一种遥远的兼容性估计方法的作品即使在极其稀少标记图(例如,1万个节点被标注)在它的后面需要标注剩余节点的一小部分时间。我们的方法首先创建多个因式分解图表表示(具有独立的曲线图的大小),然后对这些较小的图草图估计。我们定义代数放大作为利用一种算法的更新方程的代数性质来放大稀疏信号的更普遍的想法。我们证明了我们的估计是数量级比另一种方法,并且最终到终端的分类精度与使用金标准的兼容性更快。这使得它的任何现有的标签传播方法的便宜的预处理步骤,并删除启发式当前依赖性。http://arxiv.org/abs/2003.02320Aidan Hogan, Eva Blomqvist, Michael Cochez, Claudia d’Amato, Gerard de Melo, Claudio Gutierrez, José Emilio Labra Gayo, Sabrina Kirrane, Sebastian Neumaier, Axel Polleres, Roberto Navigli, Axel-Cyrille Ngonga Ngomo, Sabbir M. Rashid, Anisa Rula, Lukas Schmelzeisen, Juan Sequeda, Steffen Staab, Antoine Zimmermann摘要:在本文中,我们提供了知识图谱全面的介绍,,最近已在要求实施数据的多样化,动态化,规模化的集合场景囊括显著的注意力从工业界和学术界。一般的介绍后,我们鼓励和对比的是用于知识图各种基于图的数据模型和查询语言。我们讨论架构,身份和背景知识图的角色。我们讲解知识如何表示和使用的演绎和归纳技术的组合提取。我们总结的创建,丰富,质量评估,细化,并出版知识图的方法。我们提供突出开放的知识图表和企业知识图,其应用程序的概述,以及他们如何使用上述技术。我们的结论与高水平的未来研究方向为知识图。Bow-tie structure and community identification of global supply chain networkhttp://arxiv.org/abs/2003.02343Abhijit Chakraborty, Yuichi Ikeda摘要:我们在度分布,层次结构,以及全球供应链网络中的度相关性方面的全球供应链网络的拓扑性质研究。全球供应链的数据是由标准普尔Capital IQ的平台的网站,收集各种数据公司2018年建造的入点和出度分布与度指数为2.42和OUT-特征的幂律度指数= 2.11。聚类系数衰变作为幂律指数= 0.46。节点度的相关度指示不存在相配的。GWCC的蝴蝶结结构显示,OUT分量是最大的,它由总公司的41.1%。所述参比组分包含总公司16.4%。我们观察到,在上游或下游侧的企业大多分布在参比仅几步之遥。此外,我们发现网络的群落结构和表征他们根据自己的定位和行业分类。我们观察到的最大的社区主要由总部设在美国消费品板块的。这些企业属于在全球供应链网络的蝴蝶结结构的OUT分量。最后,我们确认命题S1(路径长度短),S2(幂律度分布),S3(高集聚系数),S4(“装修变得更富”增长机制),S5有效性的电源 - (截断全球供应链网络中的法律学位分配),并与重叠边界S7(群落结构)。AGL: a Scalable System for Industrial-purpose Graph Machine Learninghttp://arxiv.org/abs/2003.02454Dalong Zhang, Xin Huang, Ziqi Liu, Zhiyang Hu, Xianzheng Song, Zhibang Ge, Zhiqiang Zhang, Lin Wang, Jun Zhou, Yuan Qi摘要:机器学习曲线上已经逐渐成为强大的学习工具,图数据。但是,它是具有挑战性的工业社区充分利用技术,如图表神经网络(GNNS),解决因为在图表中固有的数据依赖于规模的现实问题。因此,我们不能简单地训练GNN与经典的学习系统,该假设数据并行实例参数服务器。现有系统中的图数据或者在单个机器或图表存储从远程存储在内存中的快速访问。主要缺点是在三倍。首先,他们不能,因为内存的容量,或图商店和工人之间的带宽上的限制规模。其次,他们需要图门店额外的开发没有很好利用成熟的基础设施,如MapReduce的是保证良好的系统属性。第三,重点培养,但忽视了推理图的优化,从而使他们的非集成系统。在本文中,我们设计AGL,一个可扩展的,容错性和集成系统,与GNNS全功能训练和推理。我们的系统设计遵循消息传递方案GNNS的计算基础。我们设计生成ķ -hop附近,对每个节点的信息完全子图,以及通过从边邻居合并值,并通过MapReduce的传播值,出边的邻居做了简单的推论。此外,ķ -hop附近包含每个节点的信息,完整的子图,所以我们简单地做参数服务器上的训练,由于数据的独立性。我们的系统AGL,成熟的基础设施来实现,可以在数十亿节点和千亿边在14个小时完成图的2层图注意网络的训练,并完成推理1.2小时。Fragility of spectral clustering for networks with an overlapping structurehttp://arxiv.org/abs/2003.02463Chihiro Noguchi, Tatsuro Kawamoto摘要:团体或社区,在真实世界的网络通常重叠。这是发展社区重叠检测方法的动机,因为对于非重叠社区的方法可能不执行。然而,用于非重叠社区检测方法劣化机理很少被理论研究。在这里,我们分析谱聚类,不考虑重叠结构,通过使用复制法从统计物理性能。我们上重叠随机块模型分析揭示了如何将结构信息是从领先的特征向量丢失,因为重叠的结构。
Hadath:从社交媒体地图
到多分辨率事件扩展地图
Hadath: From Social Media Mapping to Multi-Resolution Event-Enriched Mapshttp://arxiv.org/abs/2003.02615Faizan Ur Rehman, Imad Afyouni, Ahmed Lbath, Saleh Basalamah摘要:公开数据正在迅速增加,并会继续与技术,传感器,智能手机的发展和物联网的成长。来自多个来源的数据可以提高覆盖范围,并提供有关周边利益的事件和多点相关知识。数据的一个源的强度可以通过提供补充信息补偿另一个源的缺点。地图也越来越受欢迎一天按一天,人们用它来顺利,高效地实现他们的日常任务。从空白开始映射一百多年前,多类型的地图都可以与兴趣,实时交通更新或社交媒体显示微博的点。在本文中,我们介绍Hadath,一个系统,从各种可用数据源的兴趣显示多分辨率的现场活动。该系统已被设计成能够通过封装传入非结构化数据到通用数据分组来处理多个类型的输入。系统提取从通用数据包感兴趣的地方活动,并确定它们的时空范围,在地图上显示这样的事件,使当用户改变尺度级别,只显示适当的范围内活动。这使我们能够显示对应于规模来看现场活动 - 在城市规模观看时,我们看到的高影响力的事件,而在一个邻里变焦,更为地方利益的事件突出显示。最终的输出创造了一个独特和动态的地图浏览体验。最后,为了验证我们提出的系统中,我们进行了社交媒体数据的实验。Phase transitions in a decentralized graph-based approach to human languagehttp://arxiv.org/abs/2003.02639Javier Vera, Felipe Urbina, Wenceslao Palma摘要:齐普夫定律建立了大型语料库字频率尺度行为。在人类语言Zipfian性质的出现为演讲者和听众的利益的最优化问题事先说明。在另一方面,类似人类的词汇可以被看作是二部图。本文的目的是双重:二分,图法对人的词汇中,提出了Zipfian特性的形成分散的语言博弈模式。要做到这一点,我们定义了一个语言博弈,其中人工坐席的群体参与理想化的语言互动。数值仿真表明的相变的从初始的无序状态的外观以三种可能的相对于语言的形成。我们的研究结果表明,在语言Zipfian性质似乎从赋有二分词意映射主体之间的分散化语言的交互部分出现。Modeling the Popularity of Twitter Hashtags with Master Equationshttp://arxiv.org/abs/2003.02672Oscar Fontanelli, Ricardo Mansilla摘要:在这项工作中,我们介绍了基于主方程来描述主题和主题标签的Twitter的社会网络的普及时间演化的模型。具体来说,我们建模某一主题标记出现在网络作为时间的函数的上的次数。在我们的模型中,这个量的行为取决于网络的度分布和外在的利益得到了社会各界的主题或主题标签。从主方程,我们能够得到的均值和方差明确的解决方案。我们提出了一个伽马内核函数的话题人气,这是很简单的,并产生合理的结果建模。最后,我们通过分析通过公共API获得的实际Twitter的数据验证模型的合理性。Properties of Erdos-Renyi Graphshttp://arxiv.org/abs/2003.02673Hang Chen, Vahan Hurovan, Stephen Kobourov摘要:我们研究图属性,如直径,密度和集聚系数,而这些图属性之间的关系。而对于小个顶点的图,我们可以精确地计算出平均值,范围为每个感兴趣的财产,这成为不可行的大图。因此,我们分析图表的属性和使用的Erd ħö S-R ‘恩义图表,其中模型以及底层的图空间的属性之间的关系。具体而言,我们专注于在图论和图挖掘利息13种性质。我们的数值研究这些性质的行为,为顶点数量的增加,对于艾尔德 ^ h ØS-R ‘恩义模型,并与已知的理论界,在适用的情况比较结果。我们还使用线性和非线性模型基础上,其他属性来预测一个特定的属性。EPINE: Enhanced Proximity Information Network Embeddinghttp://arxiv.org/abs/2003.02689摘要:无监督同质网络嵌入(NE)表示网络的每个顶点到低维向量,同时保持了网络信息。邻接矩阵保留大部分的网络信息,并直接charactrize一阶接近度。在这项工作中,我们致力于在更深层次的邻接矩阵挖掘有价值的信息。在相同的目的,许多NE方法计算由邻接矩阵,这是不准确的和精心设计的足够的功率高次接近。相反,我们建议重新界定高阶接近以更直观的方式。此外,我们设计了一个计算新算法,这减轻了精确计算高阶接近领域的可扩展性问题。现实世界的网络数据集综合性实验证明下游机器学习任务,如网络改造,链路预测和节点分类我们方法的有效性。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!