查看原文
其他

创业生态系统涌现出部门多样性 | 网络科学论文速递12篇

The following article is from 网络科学研究速递 Author ComplexLY



心速递


  • 创业生态系统涌现的部门多样性;

  • 自激活影响最大化;

  • OutdoorSent :语义特征可以帮助深度学习室外图像的情感分析吗?;

  • 在 Facebook 上使用用户意见推荐业务合作伙伴;

  • 基于统计密度的图聚类算法性能分析;

  • 间接相互作用影响接触网络结构和扩散动力学;

  • Zorro:消费者数据定价的模型不可知系统;

  • iGEM 合成 DNA 序列中层次结构和重用的演化;

  • 路线博弈中的混乱之路:无政府状态价格为一时,人口增长推动的周期倍增的不稳定性、混沌和无效率;

  • IP 流量建模为链路流进行基于度的异常检测;

  • 时间交互网络中的多维离群点检测:Twitter 上的政治沟通应用;

  • 单篇论文如何作用于影响因子:对学术出版的启发;



 创业生态系统涌现出部门多样性

 

原文标题: 

The emerging sectoral diversity of startup ecosystems

地址: 

http://arxiv.org/abs/1906.02455

作者: 

Clement Gastaud, Theophile Carniel, Jean-Michel Dalle

 

摘要: 由于最近提供了全面而详细的创业公司在线数据库,因此有可能更直接地调查创业生态系统,即特定地区的创业人口数量。在本文中,我们分析了欧洲和美国20多个这样的生态系统的出现,特别关注其部门多样性。


使用新的可视化工具分析这些生态系统的行业景观确实突出了多样性方面的显著差异,我们使用源自生态科学的指标来进行描述。数值模拟表明,可以使用基于部门资金的简单优惠附加模型来解释新兴生态系统中涌现出的多样性。



 自激活影响网络最大化

 

原文标题: 

Self-Activation Influence Maximization

地址: 

http://arxiv.org/abs/1906.02296

作者: 

Lichao Sun, Albert Chen, Philip S. Yu, Wei Chen

 

摘要: 我们将自激活结合到传播影响中并提出自激活独立级联(SAIC)模型:除了被选择作为种子之外,节点可以是自激活的,并且影响从选择的种子和自激活节点传播。自我激活反映了真实世界的场景,例如人们自然地与朋友分享产品推荐,即使没有营销干预。它还导致两种新形式的优化问题:


a) 抢占影响最大化(PIM):旨在找到 k 节点,如果自激活,可以在其他自我之前达到最多节点 - 激活节点;

(b) 提升优先影响最大化(BPIM):旨在选择保证被激活的 k 种子,并且可以在其他自激活节点之前达到最多的节点。


我们提出了针对PIM和BPIM的可扩展算法,并证明它们实现了PIM的 1-ε 近似和BPIM的 1-1/e-ε近似,对于任何 ε> 0 。通过对真实图的广泛测试,我们证明了我们的算法在解决方案质量方面显著优于基线算法,并且当自激活行为在节点之间不均匀时,也优于 BPIM 的基线。


 

 OutdoorSent:语义

特征可以帮助深度学习

 室外图像情感分析吗?

 

原文标题: 

OutdoorSent: Can Semantic Features Help Deep Learning in Sentiment Analysis of Outdoor Images?

地址: 

http://arxiv.org/abs/1906.02331

作者: 

Wyverson B. de Oliveira, Leyza B. Dorini, Rodrigo Minetto, Thiago H. Silva

 

摘要: 例如,用户在日常或休闲活动中贴出的户外图像中的意见挖掘可以提供有价值的信息,以更好地了解城市地区。在这项工作中,我们提出了一个框架,用于对用户在社会网络上共享的户外图像的情感进行分类。


我们比较了最先进的ConvNet架构的性能,即VGG-16,Resnet50和InceptionV3,以及专为情绪分析而设计的架构。还考虑了这种分类器的组合,称为集合的策略。我们还使用不同的实验设置来评估从场景属性导出的深度特征和语义信息的合并如何可以提高分类性能。


该评估探索了一个新的数据集,即 OutdoorSent,从 Instagram 提取的地理化城市户外图像,它们涉及三种情感极性(正面,负面和中性),以及另一个公开的数据集(DeepSent)。我们观察到,与语义特征相关的知识的结合倾向于提高低复杂 ConvNet 架构的准确性。此外,我们还证明了我们的结果在美国芝加哥市的适用性,表明它们可以帮助理解城市不同区域的主观特征。例如,城市的特定区域倾向于集中更多特定情绪类型的图像。 ConvNet 架构,训练模型和建议的室外图像数据集已公布在文后网站上。


 

 在 Facebook 上使用

用户意见推荐业务合作伙伴

 

原文标题: 

Towards Business Partnership Recommendation Using User Opinion on Facebook

地址: 

http://arxiv.org/abs/1906.02338

作者: 

Diego P. Tsutsumi, Amanda Fenerich, Thiago H. Silva

 

摘要: 确定战略业务伙伴关系可以为企业提供竞争优势;然而,由于商业环境中存在的动态和不确定性,这项任务可能具有挑战性。为了帮助企业完成这项任务,本研究提出了一种企业之间的相似性模型,该模型考虑了用户对社交媒体上企业共享内容的看法。


因此,该模型捕获由虚拟世界中的用户生成的企业之间的重要虚拟关系。此外,我们提出了一种在所考虑的模型中检测商业社区的算法。我们还提出了一种算法来识别检测到的社区中可能的业务异常值,这可以代表一种自动识别非显而易见关系的方法,这种关系可能值得企业主特别关注。通过在 Facebook 上探索大约2.8亿用户反应,我们表明我们的结果可能有利于开发新的战略业务合作推荐服务。

 


 

基于统计密度的

图聚类算法性能分析


原文标题: 

A Statistical Density-Based Analysis of Graph Clustering Algorithm Performance

地址: 

http://arxiv.org/abs/1906.02366

作者:

Pierre Miasnikof, Alexander Y. Shestopaloff, Anthony J. Bonner, Yuri Lawryshyn, Panos M. Pardalos

 

摘要: 测量图聚类质量仍然是一个悬而未决的问题。为了解决这个问题,我们引入了基于簇内和簇间密度比较的质量测量,伴随其差异显著性的统计测试以及聚类质量评估的逐步例程。我们的零假设不依赖于图的任何生成模型,这点不像使用配置模型作为空模型的模块化。


与常用的模块化测量方法不同,我们的测量结果表明它符合良好的聚类质量函数的公理。它们还具有直观的图论解释,正式的统计解释,并且可以轻松地测试其重要性。我们的工作集中在这样一种观点,即良好的聚类图将显示出比簇间密度大得多的簇内密度。我们开发测试来验证这种集群结构的存在。


我们在许多压力测试场景下进行测试,并将其行为与常用的模块化和电导测量进行比较。经验压力测试结果证实我们的指标与既定指标相比有更高的效益。特别是,它们显示出对图结构的响应更快,对数据实现期间的样本大小和故障更不敏感,并且对连接的不确定性更不敏感。这些功能在较大数据集的上下文中或者当数据可能包含连接模式中的错误时尤其重要。


 

 间接相互作用影响

接触网络结构和扩散动力学

 

原文标题: 

Indirect interactions influence contact network structure and diffusion dynamics

地址: 

http://arxiv.org/abs/1906.02405

作者: 

Md Shahzamal, Raja Jurdak, Bernard Mans, Frank de Hoog

 

摘要: 个体层面的交互模式影响联络网络上的扩散行为。大多数当前的扩散模型仅考虑个体之间的直接作用来构建潜在的传播网络。然而,在受感染的个体离开交互空间之后易感个体与感染性物品相互作用的延迟间接相互作用也可能导致传播事件。我们定义了一个称为相同位置的扩散模型,它是基于不同时间传输(SPDT)的扩散,它考虑了这些间接交互的传输链路。

 

我们的 SPDT 模型改变了网络动态,其中个体之间的连通性随链接传染性的衰减率而变化。我们通过模拟在数据驱动的接触网络上传播的空气传播疾病来研究SPDT 扩散行为。  SPDT 模型显著增加扩散动力学(特别是对于具有低链接密度的网络,其中间接相互作用产生新的感染途径)并且能够产生真实的疾病繁衍速度。我们的结果表明,与具有直接相互作用的当前扩散模型相比,SPDT 模型更有可能导致爆发。我们发现包含间接连接的扩散动力学不能通过当前模型重现,突出了间接连接预测爆发的重要性。


 

 Zorro:消费者数据

定价的模型不可知系统

 

原文标题: 

Zorro: A Model Agnostic System to Price Consumer Data

地址: 

http://arxiv.org/abs/1906.02420

作者: 

Anish Agarwal, Munther Dahleh Devavrat Shah, Dyland Sleeper, Andrew Tsai, Madeline Wong

 

摘要: 个人数据对于向用户展示有向广告至关重要 - 广告是网络的经济支柱。但是,数据如何在线交易存在严重的低效率:


(1)用户不会决定发布哪些信息,也不会因此隐私损失而获得报酬;

(2)算法广告商陷入效率低下的长期合同中,他们购买用户数据而不知道它提供的价值。


本文提出了一个 Zorro 系统,旨在纠正上述两个问题。作为主要贡献,我们提供了“数据价值”(VoD)的自然“绝对”定义 - 对于任何数量的利益,它是个人价值与人口均值之间的差值。如何操作这个定义仍然有争议,独立于买方的 VoD 模型。我们提出了一种依赖于矩阵估计的模型无关解决方案,并使用它来估算点击率(CTR)。举例说明(2),Zorro 使广告商能够逐个查询地测量用户数据的价值,并且仅基于其在估计 CTR 时提供的准确度的增加。相比之下,广告商目前与第三方数据销售商签订了低效的长期数据合同。我们在大型广告点击数据集上突出显示两个结果:


(i)我们的系统具有 R ^ 2 = 0.58,符合相关问题的最佳结果(例如内容推荐)。至关重要的是,我们的系统与模型无关 - 我们在不访问广告客户专有模型的情况下估算点击率,这是任何此类定价系统的必需属性;

(ii)我们的实验显示,销售用户数据的增量值范围为30%-69%,具体取决于广告类别。


粗略地说,如果没有提供用户数据,这意味着广告客户的价值至少会损失160亿美元。关于(1),除了允许用户获得数据共享的报酬外,我们还将数学框架扩展到用户提供明确意图的时候。


 

 iGEM 合成 DNA 序列中

层次结构的演化与重新使用

 

原文标题: 

Evolution of Hierarchical Structure & Reuse in iGEM Synthetic DNA Sequences

地址: 

http://arxiv.org/abs/1906.02446

作者: 

Payam Siyari, Bistra Dilkina, Constantine Dovrolis

 

摘要: 许多复杂的系统,无论是人工的还是自然的,都呈现出分层模块化:较小的模块,每个模块都提供某种功能,用于执行更复杂功能的大型模块中。在此之前,我们已经提出了一个称为 Evo-Lexis 的建模框架,它提供了有关不断发展的分层系统的一些基本问题的见解。 Evo-Lexis 模型的预测应使用来自不断发展的系统的实际数据进行测试,其中输出可以通过序列很好地表示。


在本文中,我们研究了 iGEM 合成 DNA 数据集序列的时间序列,以及得到的iGEM 层次结构是否表现出 Evo-Lexis 框架预测的定性属性。与 Evo-Lexis 相反,在 iGEM 中,重用量在数据集的时间线期间减少。虽然这会导致开发成本效率较低且不太深的 Lexis-DAG,但数据集在重用特定节点方面比其他节点更容易出现偏差。这导致 Lexis-DAG 采用具有相对较高的 H-score 值和稳定的核心节点组的沙漏形状。尽管核心集的重用偏差和稳定性,数据集在目标之间呈现出大量的多样性,这与  Evo-Lexis 的建模一致。

 

 

 路线博弈中的混乱之路:调和率

等于1下,人口增长推动的周

期倍增的不稳定性、混沌和无效率

 

原文标题: 

The route to chaos in routing games: Population increase drives period-doubling instability, chaos & inefficiency with Price of Anarchy equal to one

地址: 

http://arxiv.org/abs/1906.02486

作者: 

Thiparat Chotibut, Fryderyk Falniowski, Michał Misiurewicz, Georgios Piliouras

 

摘要: 我们研究了路线选择博弈的学习动态模型,以探索总需求的增加如何影响系统性能。我们专注于具有线性成本的两个平行边的非原子路由博弈,其中所有单体使用具有固定学习速率的乘法权重更新演化。之前的博弈论平衡分析表明,在大规模人口限制中,系统绩效接近最优,正如调和率下降所示。


然而,在这项工作中,我们揭示了由人口增长驱动的非均衡现象的相当不良后果。随着总需求的增加,我们证明价格避免地变得非平衡,通常是混乱的。调和率预测近乎最佳的表现不适用于这种情况。相反,时间平均社会成本可能会在大的人口限制中收敛到其最差的可能值。每个系统都具有承载能力,超过该承载能力,动力学是不平衡的。如果平衡流是对称的 50-50 %分裂,则系统呈现一个倍周期分岔。当需求超过承载能力时,第二期的单个周期吸引子取代了吸引定点。


一般来说,对于非对称均衡流,增加需求会使系统不稳定,从而使系统最终变为具有正拓扑熵的 Li-Yorke 混沌。这种需求驱动的不稳定性来自任何一对线性成本函数。值得注意的是,在任何非平衡状态下,边上的时间平均流量(正好)会收敛到均衡流,这是一种类似于零和博弈中无后悔学习的属性。我们的结果扩展到任何缩小学习率的序列,例如, ,允许动态增加的人口规模。


 

 IP 流量建模为链路

流进行基于度的异常检测

 

原文标题: 

Degree-based Outlier Detection within IP Traffic Modelled as a Link Stream

地址:

http://arxiv.org/abs/1906.02524

作者: 

Audrey Wilmet, Tiphaine Viard, Matthieu Latapy, Robin Lamarche-Perrin

 

摘要: 本文旨在精确检测和识别 IP 流量中的异常事件。为此,我们采用链接流形式,正确捕获数据的时间和结构特征。在此框架内,我们专注于发现 IP 地址随时间变化的异常行为。由于  IP 配置文件的多样性,此功能通常是异构分布的,阻止我们直接发现异常。为了应对这一挑战,我们设计了一种方法来检测异常值,并在一系列相似的异构分布中精确地识别它们的原因。我们将其应用于 IP 流量的几个 MAWI 捕获,并且我们表明它成功地检测了异常网络活动方面的相关模式。


 

 时间交互网络中

的多维离群点检测:

Twitter 上的政治沟通应用

 

原文标题: 

Multidimensional Outlier Detection in Temporal Interaction Networks: An Application to Political Communication on Twitter

地址: 

http://arxiv.org/abs/1906.02541

作者:

 Audrey Wilmet, Robin Lamarche-Perrin

 

摘要: 在社会网络 Twitter 中,用户可以相互交互并通过转发传播信息。这些数以百万计的互动可能会导致媒体事件的影响超出 Twitter 框架。在本文中,我们彻底探索了相互作用,以便更好地理解某些趋势的出现。首先,我们认为 Twitter 上的互动是一个三元组(s,a,t)意味着用户 s ,称为传播者,已经转发了一条用户 a (作者 )的推文,这里面时间则是 t 。我们将这组交互建模为具有三个维度的数据立方体:spreaders,authors 和 time。


然后,我们提供了一种构建不同上下文的方法,其中上下文是一组表征事件环境的特征。最后,这些上下文允许我们根据几个维度和各种观点找到相关的意外行为:用户在给定时间内与其通常行为相比是异常的,两个用户之间的关系与所有其他关系相比是异常的,等等。我们将我们的方法应用于与2017年法国总统大选相关的一系列转发,并表明可以在 Twitter 上建立有关政治组织的有趣见解。


 

 单篇论文如何作用于

影响因子:对学术出版的启发

 

原文标题: 

How a Single Paper Affects the Impact Factor: Implications for Scholarly Publishing

地址: 

http://arxiv.org/abs/1906.02660

作者: 

Manolis Antonoyiannakis

 

摘要: 由于影响因子(IF)是平均数,且对于大多数期刊很小,因此IF是不稳定的。我们使用2017年期刊引用报告中11639种期刊的数据研究单篇论文如何影响IF。我们将由单张纸引起的 IF 增益(或损失)定义为波动率,这与期刊大小成反比。我们发现每年有数百种期刊出现高波动性,因为它们被引用次数最高的论文:它是小型期刊中被高度引用的论文,还是小型和低引用期刊的中等(甚至低)引用论文。


例如,1218种期刊的引用率最高,其 IF 提高了20%以上,而231种期刊的提升率超过了50%。我们发现,小型期刊获得的奖励远远超过发表高被引论文的大型期刊,并且对于发表低引用论文也会受到更多惩罚,特别是如果他们有高 IF。这个机制为著名的高 IF 期刊保持小规模,以及在 IF 排名中保持竞争力提供了强大的动力。我们讨论了突破性论文在着名期刊中的含义。鉴于这种不均衡的奖励机制,我们还质疑 IF 的期刊排名实践。



来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


图上的端到端学习和优化 等5篇

探索数据集选择对衡量国际研究合作的影响 等12篇

共享汽车匹配算法如何导致司收入巨大差异 等12篇

图注意力自动编码器 等31篇

复杂网络中的嵌套性:观察、涌现和启示 等23篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    从ACL 2024录用论文看混合专家模型(MoE)最新研究进展
    CVPR 2024全部奖项公布!近万人线下参会,谷歌华人研究员获最佳论文奖
    【ACL2024】阿里云人工智能平台PAI多篇论文入选ACL2024
    MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer
    北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式

    文章有问题?点此查看未经处理的缓存