迈向自动化的性暴力报告跟踪;
社会网络个人资料的大规模并行匹配;
- 利用空腔方法研究有向控制集问题:警告传播和人口动态;
- 通过基于注意力的多任务跨媒体维度建模理解教学风格;
- 用穿戴式传感器检测拥挤社会场景的F-结构和角色:使用LSTMs结合空间关系学和动力学;
- 二阶模型的麻烦,或如何用一阶模型产生停停走走的交通;
- 使用细粒度的潜在主题分析事件检测哥伦比亚安全推特消息;
Towards Automated Sexual Violence Report Trackinghttp://arxiv.org/abs/1911.06961Naeemul Hassan, Amrit Poudel, Jason Hale, Claire Hubacek, Khandakar Tasnim Huq, Shubhra Kanti Karmaker Santu, Syed Ishtiaque Ahmed摘要: 追踪性暴力是一项艰巨的任务。在本文中,我们提出了一种基于监督学习的自动性暴力报告跟踪模型比其基于众包的同行更可扩展和可靠。我们考虑受害者,肇事者上下文和暴力的性质界定性暴力报告的跟踪问题。我们发现,我们的模型能识别用精密性暴力的报告和80.4%和83.4%的召回,分别。此外,我们还期间和 #MeToo运动后采用的模式。一些有趣的研究结果发现这是不是从一个粗浅的分析容易辨认。Large-Scale Parallel Matching of Social Network Profileshttp://arxiv.org/abs/1911.06861Alexander Panchenko, Dmitry Babaev, Sergei Obiedkov摘要: 配置文件匹配算法中,输入一个社会网络和回报的用户配置文件,如果存在的话,同一个人在另一个社会网络的配置文件。这种方法在网络营销,搜索,安全,和许多其他领域的,这就是为什么这个话题看到了普及最近激增的现成应用。在本文中,我们提出使用最少的监控,并以0.54召回达到0.98的精度的用户身份解析方法。此外,该方法在计算上是有效的并且容易并行化的。我们表明,该方法可用于匹配的Facebook,最流行的社会网络在全球范围与VKontakte等,讲俄语的用户中最流行的社会网络。 Innovation and Strategic Network Formationhttp://arxiv.org/abs/1911.06872摘要: 我们研究创新的典范与大量创造结合多个离散的想法新技术公司。这些想法可以通过私人投资,或通过社会学习获得。企业面临保密,以保护现有的知识产权和开放性之间进行选择,这有利于社会学习。这些决策决定了企业间的互动率,而这些互动率进入我们的模型中产生的学习网络链接概率。更高的互动率,对其他企业施加正面和负面的外部性,因为有更多的学习也更有竞争力。我们表明,平衡学习网络是稀疏和密集的网络之间的临界阈值。一个自然的推论是,在平衡状态,从互动占主导地位的正外部性:创新速度,甚至平均企业利润将得到显著提高如果网络更密集。因此,有较大的收益增加超过临界阈值的互动率—-但即使平衡后自然干预仍然至关重要。一个政策解决方案是引入信息中介机构,如没有奖励谁是神秘的公共创新。这些中介可以通过发送由一个私营公司的想法到另一个有利于高创新的平衡。 Wikidata from a Research Perspective — A Systematic Mapping Study of Wikidatahttp://arxiv.org/abs/1908.11153Mariam Farda-Sarbas, Claudia Müller-Birn摘要: 维基数据是包含结构化数据的最编辑知识基地之一。它作为在维基媒体领域,并超出了很多项目的数据源。自2012年10月成立以来,它已经越来越多地在其两个社群和其内容的长期增长。这种增长是通过扩大数量的研究,重点维基数据反映出来。我们的研究旨在通过提供一个系统的映射的研究,以确定现有研究的当前局部覆盖以及其需要进一步调查的白色斑点维基数据进行研究的概况。在这项研究中,选择了从期刊和会议论文67同行评审的研究,并分成有意义的类别。我们描述性的描述这组数据通过展示发布频率,发布地点和作者的由来,揭示目前的研究重点。这些特别包括有关数据质量,包括与语言覆盖面和数据完整性的问题方面。这些结果表明了一些未来的研究方向,例如,多种语言和克服语言的差距,许多对维基数据的数据,维基数据的各个学科的潜力,以及用户界面的可用性的质量的影响。 Topological based classification using graph convolutional networkshttp://arxiv.org/abs/1911.06892Roy Abel, Idan Benami, Yoram Louzoun摘要: 在彩色图中,节点类通常与它们的邻居类或在与每个节点相关联的图不掺入信息相关联。在这里,我们建议节点类也与节点的拓扑特征有关。我们使用这种关联来提高总体图机器学习和具体而言,图卷积网络(GCN)。首先,我们表明,即使在不存在的节点上的任何外部信息,可以在节点类的使用任一拓扑特征,或使用邻居类作为输入到GCN预测得到良好的精度。这种精度是略小于可以使用基于内容GCN获得一个。其次,我们表明,明确增加拓扑作为输入到GCN时与节点外部信息相结合,并不能提高精度。然而,添加与类似的拓扑结构的GCN远距离节点之间的边不显著提高其精度的附加邻接矩阵,导致的结果比在多个数据集的现有技术方法的所有状态更好。 An Induced Multi-Relational Framework for Answer Selection in Community Question Answer Platformshttp://arxiv.org/abs/1911.06957Kanika Narang, Chaoqi Yang, Adit Krishnan, Junting Wang, Hari Sundaram, Carolyn Sutter摘要: 本文针对识别的最佳人选答案社区问题解答(CQA)论坛提问的问题。因为个人经常光顾CQA论坛寻求答案细致入微的问题,问题是很重要的。我们开发引起的关系图卷积网络(IR-GCN)架构来解决问题的小说。我们提出三点贡献。首先,我们引入了模块化的框架分开与标签选择机制的图的构造。我们用等价关系诱导图包含在派系和识别两种标签分配机制—-标签相反,标签共享。然后,我们将展示如何来编码GCNs这些分配机制。其次,我们表明,编码对比产生歧视性放大—-加强在嵌入空间节点之间的距离。第三,我们展示了一个令人惊讶的结果—-提升技术提高学习了熟悉的叠加,融合,或聚集接近神经结构。我们展示了在50个StackExchange社区中广泛的实验状态的最先进的神经基线的强劲业绩。
利用空腔方法研究有向控制
集问题:警告传播和人口动态
The Directed Dominating Set problem studied by cavity method: Warning propagation and population dynamics http://arxiv.org/abs/1911.06974摘要: 对于有向图(有向图)的最小支配集是一个典型的硬组合优化问题。在以前的文章中,我们曾用腔方法这个问题。虽然我们找到了一个给定的图,使该极小支配尺寸的很好估计的解决方案,我们进一步发展了一步副本对称性破缺理论,确定无向极小支配集问题的基态能量。对于无向最小支配集问题的解决方案显示出空间既缩合过渡和定期随机图群集变迁。我们还开发了无向的Erd ħö S-R ‘恩义图的零点温度测量传播算法来查找的基态能量。在本文中,我们继续发展的一步副本对称性破缺理论找到有向极小支配集问题的基态能量。我们发现如下。 (1)当连接性大于3.704芯渗滤阈值的警告传播方程不能收敛。正面的边有两种类型的警告,但负面的边有一个。 (2)我们确定的基态能量和一个Erd ħö S-R ‘恩义随机图的转变点。 (3)调查传播抽选算法具有与置信传播算法的抽取可比良好的结果。关键词:有向最小支配集,复制品对称性破坏,的Erd ħö S-R ‘恩义图表,警告传播,调查传播抽取。Emergence of Self-Sustained Oscillations for SIRS Model on Random Networkshttp://arxiv.org/abs/1911.07031摘要: 我们研究从持久阶段灭绝相的相变的SIRS(易感/感染/难治/敏感)的疾病随机网络上传播的模式。通过研究时空演变和随机网络这种模式的同步参数,我们发现,在随机网络,节目在一个狭窄的范围内聚集系数的数值非常小的同步阶段这种模式。这一发现证实了文献中得出的结论。 [4],聚类系数是负责同步阶段中的小世界网络的出现。Critical Threshold For SIRS Model on Small World Networks http://arxiv.org/abs/1911.07035摘要: 我们研究从持久阶段为SIRS(易感/感染/难治/敏感)的疾病,小世界网络上传播模型灭绝相的相变。我们显示出与小世界网络这个模型相关联的所有参数的影响,我们创建完整的相空间。我们获得的结果是与在参考文献获得的那些相一致。[7]在该网络的病症的有限值从一个波动特有状态到在感染亚群的大小自持振荡的相转变的存在方面。而且我们的研究结果宣称,这一转变发生特别在平均集群化转变,从高至低。聚类系数对SIRS模型在网络上的影响可以从参考文献中获得的结果来理解。 [9],其表示现有的环网络中,为了该疾病在整个网络的节点频繁传播的重要性。其中,集群往往传播感染紧密的社区之一。因此,当环是在网络内部高,再感染发生了网络在许多地方和在不同的时间,它看起来像在发生感染的第二时间段的一种随机性。当循环的次数是低反之,再感染发生在特定的地点和时间在网络上,它看起来像在发生感染的第二个时期是一种规律性的。 Mining Unfollow Behavior in Large-Scale Online Social Networks via Spatial-Temporal Interactionhttp://arxiv.org/abs/1911.07156Haozhe Wu, Zhiyuan Hu, Jia Jia, Yaohua Bu, Xiangnan He, Tat-Seng Chua摘要: 跟踪和取消关注,这分别表示关系建立和关系解散:在线社会网络(的OSN)通过两个普遍的行为的发展。社会网络演进的研究主要集中在后续的行为,而取消关注行为已很大程度上被忽略了。矿业取消关注行为是困难的,因为用户对取消关注决策不仅受到像信息量和互惠用户属性的简单组合的影响,而且也受它们之间的复杂的相互作用。同时,之前的数据集很少包含推断这种复杂的相互作用足够的纪录。为了解决这些问题,我们首先构建一个大型的真实世界的微博数据集,记录详细的180万个中国用户的帖子的内容和关系的动态。接下来,我们定义用户的属性为两大类:空间属性(例如,用户的社会角色)和时间属性(例如,用户帖子的内容)。利用构建的数据集中,系统地研究用户的时间和空间属性之间的相互影响如何有助于取消关注行为。然后,我们提出有用于取消追踪预测异构信息(UMHI)一种新颖的统一模型。具体地,我们的模型UMHI:1)捕获通过社会网络结构用户的空间属性; 2)通过推断用户张贴的内容,并取消关注历史用户的时间属性;和3)由非线性MLP层模型的空间和时间属性之间的相互作用。在构建数据集综合评价表明,该UMHI模型优于基准方法,通过对平均16.44%的精确性方面。此外,性因素分析确认两个空间属性和时间属性是挖掘取消关注行为至关重要。Rumor Detection on Social Media: Datasets, Methods and Opportunitieshttp://arxiv.org/abs/1911.07199Quanzhi Li, Qiong Zhang, Luo Si, Yingchi Liu摘要: 社会化媒体平台已经被用于信息和新闻采访,他们在许多应用中非常有价值的。然而,他们也导致谣言和假新闻的传播。已经采取了许多努力,探测并通过分析其内容,并使用机器学习技术的社会背景下揭穿社交媒体上的传言。本文给出了传闻中检测领域的最新研究的概况。它提供了用于检测传闻数据集,并审查基础上,他们开发什么类型的信息和他们采取接近重要研究的完整列表。更重要的是,我们也为今后的研究目前一些新的方向。 Understanding the Teaching Styles by an Attention based Multi-task Cross-media Dimensional modellinghttp://arxiv.org/abs/1911.07253Suping Zhou, Jia Jia, Yufeng Yin, Xiang Li, Yang Yao, Ying Zhang, Zeyang Ye, Kehua Lei, Yan Huang, Jialie Shen摘要: 教学风格在帮助学生取得学业成功的重要作用。在本文中,我们探讨的有效了解教师的教学风格的新问题。具体地,我们研究1)如何定量地表征各种教师教学样式各种教师和2)如何建模跨媒体教相关的数据(语音,面部表情和身体动作,内容等人)和教学之间的微妙关系样式。使用由教育企业,一个新的概念叫教学风格语义空间提供了超过10000份的反馈问卷中选择的形容词(TSSS)的基础上的快感觉醒维理论来描述定量和全面的教学风格十分发达。然后,多任务深学习基于模型,基于注意机制的多路多任务深层神经网络(AMMDNN),提出准确和稳健捕捉跨媒体功能和TSSS之间的内在关系。基于基准数据集,我们进一步发展,包括4541全标注的跨模态教学班一个全面的数据集。我们的实验结果表明,所提出的AMMDNN性能优于(0.0842在平均的一致性相关系数(CCC)而言)基线的方法。为了进一步证明了该TSSS和我们模型的优势,一些有趣的案例研究进行的,如不同的老师和课程中教学方式比较,并利用教学质量分析所提出的方法。
用穿戴式传感器检测拥挤
社会场景的F-结构和角色:使用
LSTMs结合空间关系学和动力学
Detecting F-formations & Roles in Crowded Social Scenes with Wearables: Combining Proxemics & Dynamics using LSTMs http://arxiv.org/abs/1911.07279Alessio Rosatelli, Ekin Gedik, Hayley Hung摘要: 在本文中,我们研究了自动识别个对话组,或所谓的F-编队利用空间关系学和动力学。更正式地说,我们的目标自动识别可穿戴式传感器数据从2人未来是否表示F-形成成员。我们还探讨了联合检测成员和与他们的谈话(即扬声器或听众)采取的角色对的详细描述信息的问题。我们共同建模使用通过每人单个可穿戴式传感器获得的二进制的接近度和加速度空间关系学和动力学的概念。我们测试的这是在现实生活采风活动收集到的可公开获得的数据集MatchNMingle方法。我们独立显著优于他们发现这两种方式进行的是融合,提供0.975的AUC均采用30秒的窗口数据时。此外,我们的调查角色的检测显示,每对角色需要精确检测不同的时间分辨率。Learning epidemic threshold in complex networks by Convolutional Neural Networkhttp://arxiv.org/abs/1911.07281Qi Ni, Jie Kang, Ming Tang, Ying Liu, Yong Zou摘要: 深度学习参加了比赛,因为不久前学习和识别的物理系统相变等多体量子系统,其基本晶格结构一般规律,因为他们是在欧氏空间。 Real Networks公司具有在动力在其中发挥作用显著复杂的结构特点,并由此复杂网络的结构和动力学信息不能直接通过现有的神经网络模型的经验教训。在这里,我们提出一种新颖且有效的架构相结合,结构和动力学信息到学习过程来学习复杂的网络流行阈值。考虑到欧氏空间中学习的强劲表现,卷积神经网络(CNN)的使用,并与困惑方案的帮助下,我们可以精确识别的流行动态的爆发阈值。以表示为CNN欧几里德空间中的高维网络的数据集,我们通过使用图表示学习算法减少网络的维数和离散嵌入空间以将其转换成图像状结构。然后,我们创造性地通过多通道图像的结构嵌入合并节点的动态状态。通过这种方式,该模型可以借鉴结构和动态信息的结论。大量模拟表明在合成的和经验网络数据集很大的性能。我们的终端到终端的机器学习框架是强大和普遍适用于具有任意大小和拓扑结构复杂的网络。 Layer-Dependent Importance Sampling for Training Deep and Large Graph Convolutional Networkshttp://arxiv.org/abs/1911.07323Difan Zou, Ziniu Hu, Yewen Wang, Song Jiang, Yizhou Sun, Quanquan Gu摘要: 图卷积网络(GCNs)最近收到广泛的关注,因为它们在不同的图任务和不同领域的成功应用。对于大型图培训GCNs,但是,仍然是一个挑战。原始全批次GCN训练需要计算在每GCN层的曲线,这使以高的计算和存储器成本的所有节点的表示。为了缓解这一问题,一些基于采样的方法被提出来训练上的节点的子集GCNs。其中,节点明智邻居采样方法递归样品固定数目的邻居节点,并且从指数生长邻居尺寸从而其计算成本患有;而逐层重要性采样方法丢弃该邻居依赖性的限制,并且因此跨层采样的节点从稀疏连接问题的困扰。为了解决上述两个问题,我们提出了所谓的层依赖的重要性采样(LADIES)一种新的有效采样算法。基于在上层采样节点上,女士们选择他们的邻居节点,构建二分子图,并相应地计算的重要性概率。然后,样品固定数目由所计算出的概率的节点,并递归地每一层进行这样的程序来构造整个计算图。我们从理论和实验证明,我们提出的抽样算法优于在时间和存储成本方面先前的抽样方法。此外,女士们被证明具有较好的泛化精度比原有全批GCN,由于其随机性。
二阶模型的麻烦,或如何用
一阶模型产生停停走走的交通
The trouble with 2nd order models or how to generate stop-and-go traffic in a 1st order modelhttp://arxiv.org/abs/1911.07547Jakob Cordes, Andreas Schadschneider, Antoine Tordeux摘要: 行人动力学的经典二阶模型,如社会力模型,从动态,例如各种不切实际的行为遭受向后运动,振动和行人的重叠。这些影响是不相关的运动方程的离散化,但内在的动力。他们是通常出现在二阶模型强大的惯性作用的结果。我们发现,实验观察到的停止和去的行为,这是任何行人模型的一个重要试验,可以用随机一阶模型不从强大的惯性所产生的动力文物遭受转载。该模型提供了一种基于相关噪声的停止和去行为的新机制。An Application of Random Walk on Fake Account Detection Problem: A Hybrid Approachhttp://arxiv.org/abs/1911.07609Ngoc C. Lê, Manh-Tuan Dao, Hoang-Linh Nguyen, Tuyet-Nhi Nguyen, Hue Vu摘要: 社会网络在当今的世界上显著的作用。社会网络的重要性,例如Facebook或Twitter,是不可否认的。然而,他们也有很多问题。其中之一是打击假冒账户防御机制的必要性。这显然不是一个简单的任务,从正宗的那些独立的假帐户。在本文中,我们提出了一个排序方案,既包括基于图和基于特征的方法,以帮助假冒Facebook个人主页进行检测。利用支持向量机(SVM) 引用 cortes1995和SybilWalk 引用 JWZ17,型号超过设定的数万越南的Facebook账户来实现高精确度。When Coincidence has Meaning: Understanding Emergence Through Networks of Information Token Recurrencehttp://arxiv.org/abs/1911.07642摘要: 我在本文中概念化为具有不一定是观察到的因果关系的事件之间捕获的巧合的新方法。建立在先验信息瀑布的方法,我概括罕见的微观层面的事件和宏观层面的制度变迁之间的相互作用的张量理论。后来,我讨论一些被用于实践这里列出的理论假设的验证希望的候选应用领域。这是寻求打下基础,以发现对一个复杂系统的宏观状态的可衡量的影响,因此被认为是有意义的巧合普遍数学性质的初步工作。The geopolitics behind the routes data travels: a case study of Iranhttp://arxiv.org/abs/1911.07723Loqman Salamatian, Frederick Douzet, Kevin Limonier, Kavé Salamatian摘要: 互联网的全球扩张带来了许多挑战,地缘政治。网络空间是许多国家的战略优先的空间。了解并代表其地理仍然是一个持续的挑战。然而,我们需要理解网络空间作为人类组织的空间来分析参与者的策略。这种地理需要多学科的对话关联的地缘政治,计算机科学和数学。网络空间被表示为三个叠置的和相互作用的层次:物理的,逻辑的和信息性的层。本文通过连接的结构和边界网关协议(BGP)的分析集中在逻辑层上。该协议确定由数据所采取的路线。已利用各国控制信息流,并能阻断访问内容(上升到互联网的完全破坏),或者主动的战略目的,如劫持流量或攻击的基础设施。一些国家已经选择了BGP策略。这项研究的目的是描述这些战略,将其链接到当前的体系结构,并了解他们在危机时期应变能力。我们的假设是,有在国家层面的网络架构通过BGP形,和利益相关者的战略之间的连接。我们选择把重点放在伊朗的情况,因为伊朗提出了一个有趣的BGP架构,并拥有在中东地区的连接的中心位置。此外,伊朗在几个正在进行的地缘政治分歧的中心。我们的观察使人们有可能推断出三种方式,伊朗可能已经使用BGP实现其战略目标:追求一个自我维持的全国互联网与控制的边界;该会成立一个伊朗联网,以方便检查;和连接的杠杆作用的区域影响力的工具。Consistent recovery threshold of hidden nearest neighbor graphs http://arxiv.org/abs/1911.08004Jian Ding, Yihong Wu, Jiaming Xu, Dana Yang摘要: 通过应用程序,如发现在社会网络紧密联系,并在组装基因组生物学的启发子序列,研究在 N - 点完全图恢复隐藏的 2K -nearest邻居(NN)图的问题,它的边权重独立并根据 P_N在隐藏 2K -NN图表和 Q_N否则边分布。伯努利分布对应的特殊情况下,以瓦特-斯托加茨小世界图的变体。我们重点关注两类渐近恢复的保证作为 n个到 infty :(1)准确的恢复:所有的边概率趋向于一个正确分类; (2)几乎完全恢复:错误分类的边的预期数量为 O(NK)。我们表明,最大似然估计达到(1)精确恢复为 2 文件ķ了N ^ O(1) 如果 liminf 压裂2 alpha_n LOG N> 1 ; (2) 1几乎完全恢复文件ķ功课左(压裂日志N LOG 日志N 右)如果 liminf 压裂KD(P_N || Q_N) 日志N> 1 ,其中 alpha_n triangleq -2 LOG INT SQRT d P_N d Q_N 是为了中的R ‘恩义发散压裂1 2 和 d(P_N || Q_N)是相对熵。在温和的分布假设,这些条件被示出为理论上信息所需的任何算法成功。在分析中的一个关键挑战是 2K-NN图,通过边给定数量从隐藏一个不同的枚举。Graph Learning for Spatiotemporal Signal with Long Short-Term Characterizationhttp://arxiv.org/abs/1911.08018Yueliang Liu, Wenbin Guo, Kangyong You, Lei Zhao, Tao Peng, Wenbo Wang摘要: 从高维时空信号采自然协会已收到显著关注的各个领域,包括生物学,气候学和财务分析,等等。由于不同的应用广泛的关系,想法,服用相关财产的充分利用找到时空信号的有意义的见解已经开始出现。在本文中,我们研究揭示图表,更好地揭示数据背后的关系,有长期和短期相关性在时空信号帮助的问题。考虑空间和时间关系的时空信号模型首次提出。特别地,具有高斯马尔可夫过程的低秩表示一起被采用来描述信号时间的相关行为。接下来,我们投了图学习问题作为联合低阶分量估计和图推理拉普拉斯问题。低阶和基于平滑-时空图学习方法(GL-LRSS)提出了一种新颖地介绍时空时间顶点信号分析领域之前平滑。通过共同利用长期观测的低等级财产和短时观测平滑,整体性能得到了有效提高。在人工和真实世界的数据集实验证明学习所提出的GL-LRSS的准确度国家的最先进的电流低秩估计和图学习方法的改进显著。 Hunting for Troll Comments in News Community Forumshttp://arxiv.org/abs/1911.08113Todor Mihaylov, Preslav Nakov摘要: 还有的巨魔就是不同的定义。当然,一个巨魔可谁试图操纵民意(有时钱),等最后的定义有人谁戏弄人,使他们感到愤怒,或某人谁冒犯的人,或谁想要控制任何单一的讨论某人或某人是一个占主导地位的保加利亚和东欧的公共话语,这是我们本文的重点。在我们的工作中,我们研究两种意见操控巨魔:已经从泄露的声誉管理合同,并提到巨魔已经由几个不同的人叫这么透露支付巨魔。我们发现,这些定义是明智的:我们建立两个分类,可以由非巨魔有81-82%的准确度从一个区分后通过这样的支付巨魔;同一分类上实现所谓提到巨魔与非巨魔帖子81-82%的准确率。
Adaptive Greedy versus Non-adaptive Greedy for Influence Maximizationhttp://arxiv.org/abs/1911.08164Wei Chen, Binghui Peng, Grant Schoenebeck, Biaoshuai Tao摘要: 我们认为 EMPH自适应影响最大化问题:给定一个网络和预算ķ,反复选择在网络上ķ种子最大化使用者的预期数量。在 EMPH全采用反馈模型,选择每个种子后,种子选取器观察所有所得收养。在 EMPH近视反馈模型,所述种子拾取器仅观察是否所选择的种子采用的每个邻居。通过对影响最大化贪婪基于算法/启发式的极端成功的启发,我们提出 EMPH 贪心自适应性间隙,其比较所述自适应贪婪算法到其非自适应对方的性能的概念。我们的第一个结果表明,对于子模的影响最大化,自适应贪婪算法可以执行多达(1-1 / e)的 - 差于非自适应贪婪算法分数,该比率是紧的。更具体地,在一侧上,我们提供示例,其中自适应贪婪算法的性能仅是(1-1 / e)的非自适应贪婪算法在四个设置的性能的分数:两个反馈模式和两个该 EMPH独立级联模型和 EMPH线性阈值模型。在另一侧,我们证明,在任何子模级联,自适应贪婪算法总是输出一个(1-1 / e)的 - 近似在最佳非自适应种子选择收养的预期数量。我们的第二个结果表明,与全采用反馈一般子模的级联模型,自适应贪心算法可以无限制的因素优于非自适应贪心算法。最后,我们提出了自适应贪心算法的无风险的变种,总是执行不超过非自适应贪心算法差。Forecasts in Schelling’s segregation modelhttp://arxiv.org/abs/1911.08191摘要: 在谢林的隔离模式,主体商优化自己的位置连续移动导致次优分离的人口分布,即使所有的主体商有混合社区相同的优先级。一个隔离模式这一总体结果所依据的主要假设的是,主体依赖于即时效用之间的比较,以使他们的移动决策。相反,当然更合理,我们假设在这篇文章中主体商的预测后状态需要使用过去的状态启发式的线性外推,以使他们的决定。我们表明,一个相对小的一组参数,考虑预测主体商可以显著地减少在一个框架靠近谢林的模型子最优。On Equilibrium Metropolis Simulations on Self-Organized Urban Street Networks http://arxiv.org/abs/1911.08358Jerome Benoit Saif Eddin Jabari摘要: 城市街道网络的复杂性,充分认识到居住在自己的信息网络。信息网络映射道路节点和映射路口边。自组织城市的信息网络通常有一个无标度分布。最近的波动模型细观其规模,打浆度链接到他们surprisal的平均量的保存。在这里,surprisal衡量城市居民的惊讶和优柔寡断。都市算法可以在理论上允许以产生波动的信息网络,与所述标度指数作为逆温度,在热等均衡。在本文中,我们展示了Metropolis算法如何应用到城市街道网络一起案例。我们的案例研究,老艾哈迈达巴德,维持都市报平衡,并提供有前途的热力学样的结果。我们的工作打开门一统计物理框架,为了解自组织城市街道网络如何发展。
使用细粒度的潜在主题分析
事件检测哥伦比亚安全推特消息
Event detection in Colombian security Twitter news using fine-grained latent topic analysishttp://arxiv.org/abs/1911.08370Vladimir Vargas-Calderón, Nicolás Parra-A., Jorge E. Camargo, Herbert Vinck-Posada摘要: 文化和社会动力学是必须被理解为把握什么是社会关心的重要概念。为此,对社区产生什么样的信息的极好来源是新闻,特别是近几年,在大众媒体巨头使用社会网络进行交流和互动与他们的观众。在这项工作中,我们使用的方法从哥伦比亚Twitter的新闻发现在微博潜在主题账户,以确定在该国最突出的事件。我们要特别注意安全,暴力和犯罪相关的微博,因为围绕哥伦比亚社会暴力的环境。潜话题发现方法,我们利用通过K-均值聚类算法使用的鸣叫FastText和认定集群构建鸣叫的矢量表示。簇的数目是通过测量对于一个范围的隐含狄利克雷分布(LDA)模型的主题的数目的 C_V相干找到。最后,我们使用统一流形逼近和投影(UMAP)降维可视化的鸣叫载体。一旦涉及到安全性,暴力和犯罪的集群被确定,我们继续给每个集群内应用相同的方法进行细粒度分析,其中在新闻中提到的具体事件组合在一起。我们的方法是能够发现新闻事件的特定集合,这是执行的人怎么搞的不同类型的新闻Twitter的主题,使用安全性,暴力和犯罪相关的微博强调了广泛的分析基线。Critical behaviors of high-degree adaptive and collective-influence percolationhttp://arxiv.org/abs/1911.08421 Jung-Ho Kim, Soo-Jeong Kim, K.-I. Goh摘要: 网络的巨大集群如何在删除节点或链路地址网络的健壮性,可成帧为渗流问题的关键方面消失。各种策略来选择去除节点在文献中进行了研究;例如,一个简单的随机故障或高度自适应(HDA)渗滤。最近被称为基于量新的攻击策略的集体影响力(CI)已经从优化渗透的角度提出。通过连续地消除具有最大CI值的节点,它被证明是能够拆除的网络更加快速,突然比许多现有的方法。在本文中,我们着眼于渗透过程之后基于度的攻击和随机网络基于CI攻击的关键行为。通过广泛的Monte Carlo模拟通过数值解的协助下,我们估计HDA渗滤和那些CI渗滤与 ELL = 1,2 的各种临界指数。结果表明,这些攻击型渗流过程中,尽管显示显然更突然崩溃,但在逾渗转变点具有标准平均场关键的行为。我们进一步发现,在最高学位及CI节点广泛简并可以提供观测结果的根本原因。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧