为什么大多数COVID-19感染曲线呈线性?;
- 贫困水平、社会和个人异质性解释了SARS-CoV-2流行病在拉丁美洲的增长;
- 方向性,异质性和相关性在流行病风险和传播中的作用;
- 通过Twitter对大数据进行机器学习以了解公众对COVID-19的反应;
- 感觉现在该重新开放了吗?基于重新开放情绪分析的COVID-19新常态情景;
- GeoCoV19:具有位置信息的数以亿计的多语言COVID-19推文的数据集;
- COVID-19公众情绪见解和推特分类的机器学习;
- 使用基于探针的数据评估信号化主干道性能的大规模可并行化方法;
- 具有数千万个节点的大规模复杂网络的多重分形分析的高效计算沙箱算法;
- 识别区域经济中的关键部门:使用投入产出数据的网络分析方法;
- 中国COVID-19爆发期间的不实信息分析:文化、社会和政治纠缠;
- 从Reddit上COVID-19个人经历的叙述中提取症状;
- SSFX(太空音效)短片电影节:使用电影节模型激发创意艺术科学并吸引新观众;
原文标题:
Why are most COVID-19 infection curves linear?
http://arxiv.org/abs/2005.11302Stefan Thurner, Peter Klimek, Rudolf Hanel摘要:许多国家/地区已超过其第一个COVID-19流行高峰。传统的流行病学模型将这种情况描述为非药物干预的结果,这种干预将增长率降至恢复率以下。在大流行的这一新阶段,许多国家的确诊病例随着时间的延长几乎呈线性增长。这种新的收容制度很难用传统的模型来解释,在传统的模型中,感染数量要么爆发性增长,直到达到畜群免疫力,要么疫情被完全抑制(零新病例)。在这里,我们根据接触网络的结构对此令人费解的观察结果进行解释。我们表明,对于任何给定的传播率,都存在着一定数量的社交接触者 D_c ,在此之下必须发生线性增长和低感染率。在 D_c 以上,发生了传统的流行病学动态,例如在SIR型模型中。在根据传输速率和具有传染性的天数的经验估计值校准我们的相应模型时,我们发现 D_c sim 7.2 。假设现实的接触网络的程度约为5,并假设锁定措施会将其减少到家庭规模(约2.5),我们将以极高的精度重现实际的感染曲线,而无需对参数进行拟合或微调。特别是,我们比较了美国和奥地利,作为一个国家的例子,该国家最初没有采取措施,而一个国家则在早期做出了严厉的封锁。我们的发现质疑标准舱室模型用于描述COVID-19围堵阶段的适用性。在其中观察到线性增长的可能性实际上为零。
预防COVID-19:气溶胶指南
原文标题:
Avoiding COVID-19: Aerosol Guidelines
地址:http://arxiv.org/abs/2005.10988作者:Matthew Evans
摘要:COVID-19大流行已使人们更加关注了解呼吸道病毒传播机制的需求。在为预期的流感大流行做准备时,过去几十年间已积累了大量文献,这些文献表明,短距离气溶胶途径是一条重要的途径,尽管常常被忽略。我们为通过气溶胶传播的COVID-19建立了简单的数学模型,将其应用于已知的爆发,并提出了工作场所通风和占用的定量指导原则。
贫困水平、社会和个人异质性
解释了SARS-CoV-2流行病
在拉丁美洲的增长
Poverty levels, societal and individual heterogeneities explain the SARS-CoV-2 pandemic growth in Latin Americahttp://arxiv.org/abs/2005.11201José Miguel Ponciano, Juan Adolfo Ponciano, Juan Pablo Gómez, Robert D. Holt, Jason K. Blackburn摘要:拉丁美洲正遭受SARS-CoV-2大流行的严重影响,但是贫穷和薄弱的公共卫生机构阻碍了收集必要的精确数据来为经典的SEIR流行病模型提供信息。我们提出了一种替代方法,该方法利用了统计生态学和保护生物学的进步,以增强稀疏数据在预测和缓解流行病中的价值。我们的方法导致了所谓的随机流行病Gompertz模型,该模型具有很少的参数,可以灵活地将异质性纳入种群内部和跨时间传播。我们证明了贫困对整个拉丁美洲十四个国家的流行病影响很大,并表明我们的方法如何提供灵活,随时间变化的疾病风险预测,可用于完善公共卫生策略。
原文标题:
Infections and Identified Cases of COVID-19 from Random Testing Data
http://arxiv.org/abs/2005.11277Allen Caldwell, Vasyl Hafych, Oliver SChulz, Lolian Shtembari摘要:关于Covid-19,有许多难以理解的数字。使用随机测试的报告,评估每次感染的死亡率,并将其用于提取有关实际感染比例以及在不同国家成功识别感染的更多信息。
原文标题:
The role of directionality, heterogeneity and correlations in epidemic risk and spread
http://arxiv.org/abs/2005.11283Antoine Allard, Cristopher Moore, Samuel V. Scarpino, Benjamin M. Althouse, Laurent Hébert-Dufresne摘要:大多数流行病传播模型,包括许多专门为COVID-19设计的模型,都隐含地认为社会网络是无方向性的,即,每当发生接触时,感染就很可能在任一方向传播。尤其是,这种假设意味着最可能传播疾病的个体也最有可能从他人那里获得该疾病。在这里,我们回顾了随机有向图论的结果,结果表明,许多重要数量,包括生殖数量和流行病大小,都敏感地取决于出入和出入度的联合分布(“风险”和“传播”) ,包括它们的异质性以及它们之间的相关性。通过考虑各种类型的联合分布,我们阐明了为什么某些类型的异质性会导致偏离SIR模型的标准Kermack-McKendrick分析,即所谓的质量作用模型,其中接触是同质且随机的,而有些则不会。我们还表明,一些结构化的SIR模型是由个体类型(年龄或活动)之间复杂的联系方式所告知的,只是泊松过程的混合体,并且往往不会明显偏离最简单的质量作用模型。最后,我们指出了这种有针对性的结构可能对政策产生的影响,既可以用于联系追踪策略,也可以用于旨在防止超级传播事件的干预措施。特别是,有向网络具有经典“友谊悖论”的前向和后向版本-前向链接倾向于导致高风险的个人,而后向链接则导致具有高传播的个人-这样,前向链接和后向链接会导致高风险向后接触跟踪对于发现超级传播事件并防止将来的感染级联是必要的。
原文标题:
The Fallibility of Contact-Tracing Apps
http://arxiv.org/abs/2005.11297Piotr Sapiezynski, Johanna Pruessing, Vedran Sekara摘要:自从COVID-19在全球范围内爆发以来,我们一直在关注有关联系人跟踪应用程序的辩论-有关大流行的技术支持反应。随着公司,学者,政府和公民社会讨论实施这些应用程序的正确方法,我们注意到了反复出现的隐含假设。拟议的解决方案专为拥有互联网访问权限和智能手机所有权的人而设计,人们愿意且能够安装这些应用程序,并且收到有关可能感染病毒的通知的人可以进行测试并可以安全隔离。在这项工作中,我们挑战这些假设。我们不仅表明全球范围内没有足够的智能手机来达到所需的采用门槛,而且还强调了互联网的广泛缺乏,这对某些群体的影响更大:老年人,低收入者和社交距离有限的人。不幸的是,这些也是COVID-19面临最高风险的人群。我们还报告说,已经以选择加入方式部署的联系人跟踪应用程序显示令人失望的采用水平。我们警告过度扩展现有的州和公司监视权可能带来的后果。最后,我们描述了多种情况,无论访问权限或策略如何,联系人跟踪应用程序都无济于事。在这项工作中,我们呼吁采取全面,公平的政策应对措施,优先考虑最弱势群体的需求,保护人权并考虑长期影响,而不是着眼于技术优先解决方案。
通过Twitter对大数据进行机器学习
以了解公众对COVID-19的反应
原文标题:
Machine learning on Big Data from Twitter to understand public reactions to COVID-19
http://arxiv.org/abs/2005.08817Jia Xue, Junxiang Chen, Chen Chen, ChengDa Zheng, Tingshao Zhu摘要:该研究旨在了解Twitter用户对COVID-19的讨论和反应。我们使用机器学习技术来分析从2020年1月20日至2020年3月7日收集的约180万条与冠状病毒相关的推文消息。共确定了11个重要主题,然后将其归类为10个主题,例如“中国境外(全球) ”,“在韩国爆发COVID-19”,“在纽约爆发的早期迹象”,“钻石公主巡游”,“经济影响”,“预防/防护措施”,“当局”和“供应链”。结果并未显示与治疗和/或症状相关的消息作为Twitter上的常见话题。我们还进行了情绪分析,结果表明,对当局的信任仍然是一种普遍的情绪,但可以识别出对当局的信任,对疾病爆发的恐惧以及对可能采取的预防措施的期望。还讨论了研究的意义和局限性。
感觉现在该重新开放了吗?
基于重新开放情绪分析
的COVID-19新常态情景
原文标题:
Feeling Like It is Time to Reopen Now? COVID-19 New Normal Scenarios based on Reopening Sentiment Analytics
http://arxiv.org/abs/2005.10961Jim Samuel, Md. Mokhlesur Rahman, G. G. Md. Nawaz Ali, Yana Samuel, Alexander Pelaez摘要:冠状病毒大流行带来了复杂的挑战和不利环境。这项研究发现了封锁带来的令人担忧的社会经济后果中的公众情绪,并探讨了随之而来的四种潜在的情绪相关情景。COVID-19的严重性和残酷性导致极端感觉的发展以及情绪和精神保健方面的挑战。这项研究确定了情感后果-极端恐惧,困惑和不稳定的情绪的存在,以及信任和期待的混合。为了有效的决策和政策,有必要衡量主要的公众情绪趋势。这项研究使用时间与COVID-19保持一致的Twitter数据分析了公众情绪,以确定与“重新开放”经济有关的主导情绪趋势。当前的研究使用文本分析方法论来分析公众对于两种潜在分歧情景的支持-提前开放和延迟开放以及每种情况的后果。当前的研究基于探索性文本分析和文本数据可视化得出的结论是,来自美国Twitter用户的Tweets数据显示出更多的信任情绪支持,而不是担心重新开放美国经济。通过额外的验证,这可以为州政府,联邦政府,公司和社会领袖提供宝贵的时间敏感机会,以指导国家迈向成功的新正常未来。
原文标题:
Risk scoring calculation for the current NHSx contact tracing app
http://arxiv.org/abs/2005.11057Mark Briers, Marcos Charalambides, Chris Holmes摘要:我们考虑了NHS COVID-19应用程序最初将如何根据个人最近与报告有冠状病毒症状的人的联系来计算风险分数。
原文标题:
COVID-19: The unreasonable effectiveness of simple models
http://arxiv.org/abs/2005.11085
Timoteo Carletti, Duccio Fanelli, Francesco Piazza摘要:当新型冠状病毒SARS-CoV2(COVID-19)在2020年3月被WHO宣布为大流行病时,科学界已经做好了充分准备,努力理解国家主管部门收集的迅速增长的大量数据世界各地的。然而,尽管新颖的理论方法多种多样,而且许多广泛建立的模型也很全面,但叙述爆发过程的官方人物仍然勾勒出一幅难以捉摸和令人生畏的画面。在这里,我们清楚地表明,COVID-19爆发的动力学属于SIR模型及其扩展的简单通用性类别。我们的分析自然使我们确定,任何理论方法都存在根本的局限性,即所报告数据背后的测试框架具有不可预测的非平稳性。但是,我们展示了如何可以自洽地量化这种偏差,并如何从数据中挖掘有用和准确的信息。特别是,我们描述了报告率的时间演变如何控制明显的流行高峰的发生,在疫情爆发时测试力度不够的国家通常遵循真实的流行高峰。尽早而果断地进行测试的重要性似乎是我们分析的必然结果,因为一开始就进行大量测试的国家显然早于其真正的高峰,而总的死亡人数则较少。
GeoCoV19:具有位置信息的数以亿计
的多语言COVID-19推文的数据集
原文标题:
GeoCoV19: A Dataset of Hundreds of Millions of Multilingual COVID-19 Tweets with Location Information
地址:
http://arxiv.org/abs/2005.11177
作者:
Umair Qazi, Muhammad Imran, Ferda Ofli
摘要:在过去的几年中,在突发公共卫生事件,自然或人为灾难等大规模融合事件中,社交媒体平台的使用激增。在为流行病和大流行病爆发做准备时,这些非传统数据源对于疾病预测和监视变得至关重要。在本文中,我们介绍了GeoCoV19,这是一个大型Twitter数据集,包含自2020年2月1日起在90天内发布的超过5.24亿条多语言推文。此外,我们采用基于地名词典的方法来推断推文的地理位置。我们假设,这种大规模的,多语言的,地理定位的社交媒体数据可以使研究社区能够评估社会如何集体应对这一前所未有的全球危机,并开发计算方法来应对诸如识别假新闻,了解社区的挑战等挑战。知识差距,建立疾病预测和监测模型等。
原文标题:
Likelihood of survival of coronavirus in a respiratory droplet deposited on a solid surface
http://arxiv.org/abs/2005.10897Rajneesh Bhardwaj, Amit Agrawal摘要:我们预测并分析了感染COVID-19的受试者的呼吸滴的干燥时间,这是感染另一名受试者的关键时间。液滴的干燥是通过扩散限制蒸发模型预测的,该模型是将无固定液滴放在固定有接触线的部分润湿的表面上。考虑液滴体积,接触角,环境温度和湿度的变化。我们基于几种条件下液滴的寿命来分析液滴中存在的病毒的存活机会,并发现病毒的存活机会受到这些参数中的每一个的强烈影响。使用该模型计算出的液滴内部的剪切应力大小不足以消除病毒。我们还探讨了五个不同城市的液滴干燥时间与COVID-19扩散速度之间的关系,发现它们之间的相关性很弱。
原文标题:
COVID-19 Public Sentiment Insights and Machine Learning for Tweets Classification
http://arxiv.org/abs/2005.10898Jim Samuel, G. G. Md. Nawaz Ali, Md. Mokhlesur Rahman, Ek Esawi, Yana Samuel摘要:随着冠状病毒大流行,另一场危机以大规模恐惧和恐慌现象的形式出现,这是由于信息不完整且常常不准确所致。因此,迫切需要解决和更好地理解COVID-19的信息危机并评估公众情绪,以便可以实施适当的消息传递和政策决策。在本文中,我们使用冠状病毒特有的Tweets和R统计软件及其情绪分析包,确定了与大流行相关的公众情绪。我们使用必要的文本数据可视化技术支持的描述性文本分析,对随着COVID-19在美国达到峰值水平而产生的恐惧感随时间的进展进行深入研究。此外,我们在文本分析的背景下提供了两种基本机器学习(ML)分类方法的方法学概述,并比较了它们在对不同长度的冠状病毒推文进行分类中的有效性。我们使用朴素贝叶斯方法观察到短推文的强分类精度为91%。我们还观察到逻辑回归分类方法在较短的Tweets上可提供74%的合理准确性,而对于较长的Tweets而言,这两种方法均显示相对较弱的性能。这项研究提供了对冠状病毒恐惧情绪发展的见解,并概述了相关的方法,含义,局限性和机会。
原文标题:
Automatic Detection of Influential Actors in Disinformation Networks
http://arxiv.org/abs/2005.10879Steven T. Smith, Edward K. Kao, Erika D. Mackin, Danelle C. Shah, Olga Simek, Donald B. Rubin摘要:数字通信和社交媒体的武器化,以巨大的规模,速度和影响力开展虚假信息运动,对识别和打击敌对势力行动(IO)提出了新的挑战。本文提出了一个端到端框架,可以自动检测虚假信息,网络和有影响力的参与者。该框架集成了自然语言处理,机器学习,图分析和新颖的网络因果推理方法,以量化各个参与者在传播IO叙事中的影响。我们通过在2017年法国总统大选期间收集的Twitter数据集以及Twitter披露的已知IO帐户,展示了其在现实世界敌意IO运动中的能力。我们的系统能够以96%的精度,79%的召回率和96%的PR曲线下区域来检测IO帐户,绘制出显著的网络社区,并根据活动来发现高影响力的帐户,从而摆脱传统影响统计数据的影响数量和网络中心性。结果得到来自美国国会报告,调查新闻和Twitter提供的IO数据集的独立IO帐户独立来源的证实。
原文标题:
Phase transitions and stability of dynamical processes on hypergraphs
http://arxiv.org/abs/2005.10891Guilherme Ferraz de Arruda, Michele Tizzani, Yamir Moreno摘要:超图自然地代表了更高阶的交互作用,这种交互作用从社会交互作用一直出现到神经网络和其他自然系统。尽管它们的重要性已得到公认,但尚无描述超图上一般动力学过程的理论框架。在本文中,我们弥合了这一差距,并得出了在任意超图上定义的动力学系统的稳定性的表达式。该框架使我们能够揭示出,在不动点附近,相关结构是超图的图投影,并且有可能确定给定过程中每个结构顺序的作用。我们还分析性地解决了两个普遍关注的动力学问题,即社会传染和扩散过程,并表明稳定性条件可以在结构和动力学组成部分中解耦。我们的结果表明,在社会传染过程中,只有成对的相互作用在吸收状态的稳定性中起作用,而对于扩散动力学,相互作用的顺序起着不同的作用。我们的首次尝试是为进一步探索超图上的动力学过程提供一个通用框架。
原文标题:
A Survey of Information Cascade Analysis: Models, Predictions and Recent Advances
http://arxiv.org/abs/2005.11041Fan Zhou, Xovee Xu, Goce Trajcevski, Kunpeng Zhang摘要:从用户生成的内容(如微博和科学论文)到在线业务(如病毒式营销和广告),我们日常生活中的数字信息泛滥,为探索和利用信息演化的轨迹和结构提供了前所未有的机会级联。学术界和工业界的大量研究努力旨在更好地理解推动信息传播的机制并量化信息传播的结果。本文对信息流行度预测方法进行了全面的回顾和分类,从特征工程和随机过程到图表示,再到基于深度学习的方法。具体来说,我们首先正式定义不同类型的信息级联,并总结现有研究的观点。然后,我们提出一种分类法,将现有作品分为上述三个主要类别以及每个类别中的主要子类别,然后我们系统地审查前沿研究工作。最后,我们总结了现有研究工作的利弊,并概述了该领域的开放挑战和机遇。
原文标题:
Graph Random Neural Network
http://arxiv.org/abs/2005.11079Wenzheng Feng, Jie Zhang, Yuxiao Dong, Yu Han, Huanbo Luan, Qian Xu, Qiang Yang, Jie Tang摘要:图神经网络(GNN)已将深度学习方法推广到图结构化数据中,在图挖掘任务中具有良好的性能。但是,现有的GNN通常会遇到带有稀疏标记节点的复杂图结构,并且会受到非稳健性,过度平滑和过度拟合的限制。为了解决这些问题,我们提出了一个简单而有效的GNN框架-图随机神经网络(Grand)。与现有GNN中的确定性传播不同,Grand采用随机传播策略来增强模型的鲁棒性。这种策略自然也使Grand能够将传播与特征变换解耦,从而减少了过度平滑和过度拟合的风险。此外,随机传播是图数据扩充的有效方法。在此基础上,我们通过利用多次扩展中未标记节点的分布一致性,为模型提出了Grand的一致性正则化方法,提高了模型的泛化能力。在图基准数据集上进行的大量实验表明,在半监督图学习任务上,Grand明显优于最新的GNN基线。最后,我们表明Grand缓解了过度光滑和过度拟合的问题,并且其性能与坚固性结合在一起。
使用基于探针的数据评估信号化
主干道性能的大规模可并行化方法
原文标题:
Massively Parallelizable Approach for Evaluating Signalized Arterial Performance Using Probe-based data
http://arxiv.org/abs/2005.11147Subhadipto Poddar, Pranamesh Chakraborty, Anuj Sharma, Skylar Knickerbocker, Neal Hawkins摘要:主干道的有效运行对于社区的安全与活力至关重要。要管理此性能,考虑需求的动态性质,就需要通过各种策略来更新交通信号的时序。机构用于这些活动的资源通常很稀少,并且主要是由于公众的抱怨。本文为干道上的交通信号重新定时提供了一种数据驱动的优先级排序方法。为了消除对可用检测的任何依赖,基于探针的数据用于评估性能指标。基于探测器的数据来自于车载全球定位系统的观测数据,从而无需安装现场交通基础设施。本文提供了一种工作流程,用于根据捕获信号操作不同方面的基于探针的信号性能度量来测量和比较动脉走廊上的不同部分。所提出的方法可以用作指导机构寻求改变其信号控制的工具。该方法识别一组动态日,然后根据非动态日评估出行率。动态天数代表段上流量的变化性。非动态日的绩效指标包括平均旅行率,旅行率的日内变化,旅行率的日间变化,最小旅行率离散度以及两个变量,其中包括总体旅行率变化。因此,具有大量动态路段以及正常情况下性能较差的走廊将是自适应控制的候选者。在爱荷华州得梅因市内的11条走廊上进行了案例研究,确定了梅勒干草路和大学大道适合进行自适应控制。
原文标题:
Degree Heterogeneity in a Graph Facilitates Quicker Meeting of Random Walkers
http://arxiv.org/abs/2005.11161Yusuke Sakumoto, Hiroyuki Ohsaki摘要:多个随机游走是一个模型,用于在图上移动多个独立的随机游走,并且被应用于各种图算法。为了设计使用多个随机游走的有效图算法,必须研究理论上的考虑以深刻理解图算法的特性。第一次见面时间是多次随机游走的重要指标之一。第一次开会时间定义为多个随机游走者在同一节点上开会所花费的时间。第一次会面时间与会合问题密切相关。在各种工作中,已经分析了多次随机行走的第一次会面时间。但是,许多以前的工作都集中在规则图上。在本文中,我们分析了任意图中多次随机游走的首次会面时间,并阐明了图结构对其预期值的影响。首先,我们使用谱图论推导了两个随机游走者的预期首次会面时间的谱公式。然后,使用导出的谱公式检查预期的第一次会议时间的主成分。所得的主要成分表明,(a)预期的第一次会议时间几乎由 n /(1 + d rm std ^ 2 / d rm avg ^ 2)和(b)预期的第一次会议时间主导。会议时间与多个随机游走的起始节点无关,其中 n 是节点数。d rm avg 和 d rm std 分别是每个节点加权度的平均值和标准偏差。n 和 d rm avg ,以及 d rm std 与图结构的统计信息有关。根据分析结果,加权度数的系数方差 d rm std / d rm avg (度数异质性)有助于更快地满足随机游走者的需求。
具有数千万个节点的
大规模复杂网络的多重
分形分析的高效计算沙箱算法
原文标题:
A computationally-efficient sandbox algorithm for multifractal analysis of large-scale complex networks with tens of millions of nodes
http://arxiv.org/abs/2005.11187Yuemin Ding, Jin-Long Liu, Xiaohui Li, Yu-Chu Tian, Zu-Guo Yu摘要:多重分形分析(MFA)是有用的工具,可以系统地描述理论和实验分形模体的空间异质性。分形分析的一种广泛使用的方法是盒盖。已知它是NP硬的。更严重的是,与分形分析算法相比,MFA算法具有更高的计算复杂度。在用于复杂网络的各种MFA算法中,沙盒MFA算法的行为具有最佳的计算效率。但是,现有的沙箱算法在计算上仍然很昂贵。在具有数千万个节点的大规模网络中实现MFA变得具有挑战性。还不清楚通过大大增加理论网络的规模是否可以改善MFA结果。为了解决这些挑战,本文针对大型网络的MFA提出了一种计算有效的沙箱算法(CESA)。我们的CESA采用广度优先搜索(BFS)技术直接搜索中心节点每一层的邻居节点,然后检索所需的信息。CESA的输入是从压缩稀疏行(CSR)格式派生而来的稀疏数据结构,该格式设计用于压缩存储大型网络的邻接矩阵。理论分析表明,CESA可以将现有沙箱算法的时间复杂度从三次降低到二次,并且将空间复杂度从二次提高到线性。我们针对典型的复杂网络执行了MFA实验,以验证我们的CESA。最后,我们的CESA被应用于一些典型的大规模大型现实网络。
识别区域经济中的关键部门:
使用投入产出数据的网络分析方法
原文标题:
Identifying Key Sectors in the Regional Economy: A Network Analysis Approach Using Input-Output Data
http://arxiv.org/abs/2005.11285Fernando DePaolis, Phil Murphy, M. Clara DePaolis Kaluza摘要:通过将网络分析技术应用于大型投入产出系统,我们确定了本地/区域经济中的关键部门。作为Blochl等人的扩展,我们通过使用基于随机游走的量度来克服传统集中度量度的局限性。(2011)这些更适合分析非常密集的网络,即那些大多数节点都连接到所有其他节点的网络。这些措施还允许存在递归关系(循环),因为它们在经济系统中很常见(取决于聚集的水平,大多数公司在同一工业部门中的其他公司买卖)。我们提出的集中度措施非常适合捕捉通常的产出和就业乘数所没有的部门效应。我们还开发了R包(xtranat),用于处理IMPLAN(R)模型中的数据并计算新开发的度量。Production networks and epidemic spreading: How to restart the UK economy?http://arxiv.org/abs/2005.10585Anton Pichler, Marco Pangallo, R. Maria del Rio-Chanona, François Lafond, J. Doyne Farmer摘要:我们分析了英国经济分阶段重启的不同情景的经济学和流行病学。我们的经济模型旨在解决COVID-19大流行的独特特征。社会疏离措施影响供求双方,投入产出约束在限制经济产出中发挥关键作用。生产功能的标准模型不足以对锁定的短期影响进行建模。由IHS Markit对行业分析师进行的一项调查使我们能够评估每个行业在两个月内对生产绝对必要的投入。我们的模型还包括库存动态以及失业和消费之间的反馈。我们证明经济结果对生产功能的选择非常敏感,表明供应约束如何导致强大的网络效应,并发现一些与直觉相反的效应,例如仅重新开放少数几个行业实际上会降低总产出。特定于职业的数据和联系调查使我们能够估计不同行业如何影响疾病的传播率。我们研究了六个不同的重新开放方案,提出了对R0增长和GDP增长的最佳估计。我们的结果表明存在一个合理的折衷办法,可以使R0的增加相对较小,并可以显著提高经济产出。这对应于以下情况:所有面向非消费者的行业都重新开放,学校仅对需要育儿的工人开放,每个可以在家工作的人都继续在家工作。
中国COVID-19爆发期间的不实
信息分析:文化、社会和政治纠缠
Analysis of misinformation during the COVID-19 outbreak in China: cultural, social and political entanglementshttp://arxiv.org/abs/2005.10414Yan Leng, Yujia Zhai, Shaojing Sun, Yifei Wu, Jordan Selzer, Sharon Strover, Julia Fensel, Alex Pentland, Ying Ding摘要:COVID-19导致了一次信息传播大流行,这可能削弱公众的信任,阻碍病毒遏制并使大流行本身不复存在。不断变化和零散的媒体格局是错误信息传播的主要驱动力。使用腾讯的事实检查平台发现的错误信息并在微博上发帖,我们的结果表明,错误信息的演变遵循关注问题的周期,涉及诸如城市封锁,治愈和预防以及学校重新开放等主题。权威的来源在这些主题上占主导地位,但由于人们先前的信仰和文化习俗,其影响变得复杂。最后,社交媒体与已建立的或传统的媒体系统之间有着复杂的关系。有时它们会互相促进,但总的来说,社交媒体可能拥有自己的主题循环。我们的发现揭示了COVID-19期间错误信息的独特特征,并为消除中国乃至全世界的不实信息提供了见解。
Particle modeling of the spreading of Coronavirus Disease (COVID-19)http://arxiv.org/abs/2005.10357Hilla De-Leon, Francesco Pederiva摘要:到2020年5月中旬,COVID-19大流行已感染了近500万人,并已蔓延到全世界几乎所有国家。对此,世界上许多国家已经采用了不同的方法来降低感染率,例如隔离病例,关闭学校和大学,禁止公共活动,以及大多数情况下迫使社会隔离,包括地方和国家封锁。在我们的工作中,我们使用基于蒙特卡洛(MC)的算法来使用最新的流行数据预测不同人群密度的病毒感染率。我们使用三种不同的锁定模型以及约束的八种不同组合来测试冠状病毒的传播,这使我们能够检查每种模型和约束的效率。该模型的主要预测是,无限制的一周周期计划和两周的锁定周期可以帮助控制病毒感染。特别是,这种模型在伴随社会距离和有症状患者的完全隔离时降低了感染率。
Face Coverings, Aerosol Dispersion and Mitigation of Virus Transmission Riskhttp://arxiv.org/abs/2005.10720I. M. Viola (1), B. Peterson (1), G. Pisetta (1), G. Pavar (1), H. Akhtar (1), F. Menoloascina (1), E. Mangano (1), K. E. Dunn (1), R. Gabl (1), A. Nila (2), E. Molinari (3 and 4), C. Cummins (5), G. Thompson (6), C. M. McDougall (7), T. Y. M. Lo (7 and 8), F.C. Denison (9), P. Digard (10), O. Malik (11), M. J. G. Dunn (12), F. Mehendale (13) ((1) School of Engineering, University of Edinburgh, UK, (2) Lavision UK Ltd., Bicester, UK, (3) UKRI Centre for Doctoral Training in Biomedical AI, School of Informatics, University of Edinburgh, UK, (4) College of Medical, Veterinary and Life Sciences, University of Glasgow, UK, (5) Maxwell Institute for Mathematical Sciences, and Institute for Infrastructure and Environment, Heriot-Watt University, Edinburgh, UK, (6) Centre for Clinical Brain Sciences, Edinburgh, UK, (7) Paediatric Critical Care Unit, Royal Hospital for Sick Children, Edinburgh, UK, (8) Usher Institute, University of Edinburgh, Edinburgh, UK, (9) The Queens Medical Research Institute Edinburgh BioQuarter, Edinburgh, UK, (10) The Roslin Institute, University of Edinburgh, UK, (11) Department of Anaesthesia, Royal Hospital for Sick Children, Edinburgh, UK, (12) Dept of Critical Care, NHS Lothian, Royal Infirmary of Edinburgh, UK, (13) Global Cleft Lip and Palate Research Programme, Global Health Research Centre, Usher Institute, University of Edinburgh, UK)摘要:SARS-CoV-2病毒主要通过从感染者口腔喷出的带有病毒的液体颗粒传播。在某些国家/地区,要求公众使用面罩来减轻病毒传播的风险-但是,尚未确定其外在效果。我们使用了背景导向的Schlieren技术来研究一个人安静地,沉重地呼吸,咳嗽时以及脸部不同时排出的气流。我们发现,所有没有出口阀的面罩都会使喷射流的前端流量减少90%以上。对于不带呼气阀的FFP1和FFP2面罩,前通流不会分别延伸超过一半和四分之一米。手术和手工制作的口罩以及面罩会产生一些泄漏射流,包括强烈的向后和向下射流,这可能会造成重大危害。我们还模拟了气雾生成过程(拔管),结果表明这是临床医生的主要危害。这些结果可以帮助决策者做出明智的决定,并帮助PPE开发人员通过设计提高其产品有效性。
从Reddit上COVID-19
个人经历的叙述中提取症状
Symptom extraction from the narratives of personal experiences with COVID-19 on Reddithttp://arxiv.org/abs/2005.10454Curtis Murray, Lewis Mitchell, Jonathan Tuke, Mark Mackay摘要:社会媒体对COVID-19的讨论为该病毒如何影响人们的生活提供了丰富的信息来源,这在质量上与传统的公共卫生数据集有所不同。特别是,当个人在社交媒体上自我报告病毒传播过程中的经历时,它可以识别出患者出现症状的每个阶段的情绪。在Reddit论坛r / COVID19Positive上的帖子包含来自COVID-19阳性患者的第一手资料,深入了解了与病毒的个人斗争。这些帖子通常具有时态结构,指示出现文字所指症状后的天数。使用主题建模和情感分析,我们量化了自症状发作以来的前14天中,COVID-19讨论在个人整个经历中的变化。关于发烧,咳嗽和喉咙痛等早期症状的讨论主要集中在帖子开始时,而表示呼吸问题的语言则在十天左右达到顶峰。还确定了一些围绕关键案例的对话,并以大致恒定的速度出现。我们确定了与这些症状的发展相关的两个清晰的正面和负面情绪群,并绘制了它们之间的关系。我们的结果为COVID-19的患者体验提供了一个视角,该视角可以补充其他医学数据流,并可以揭示何时可能出现精神健康问题。
COVID-19 social distancing and air pollution in New York Cityhttp://arxiv.org/abs/2005.10303Ahmed Mustafa, Timon McPhearson摘要:世界各地的城市都采取了限制措施和自我检疫措施来对抗冠状病毒病(COVID-19)。媒体和学术界的许多文章都报道了COVID-19大流行的措施导致全世界空气质量的提高。纽约市是全球任何地区确诊的COVID-19病例最多的国家,因此,自2020年3月中以来,纽约市一直在采取积极的在家中和社交疏远措施。我们追踪了二氧化氮的每周变化(根据纽约市的Sentinel-5P卫星数据,在2020年2月1日至2020年5月1日之间,NO2是一种主要的空气污染物,接近地球表面。我们的分析还考虑了天气条件和NO2的历史趋势,表明许多因素都对空气质量产生影响,没有明确的信号表明社会疏远是造成空气质量下降的原因,因此迫切需要进行更详细的分析以提供信息。更好地了解纽约市的在家定购和空气质量的多个决定因素之间的关系。
原文标题:
Repeat Contacts and the Spread of Disease: An Agent Model with Compartmental Solutionhttp://arxiv.org/abs/2005.10311摘要:使用从物理模型得出的新的遭遇概率,我们增强了SIR隔室模型以进行疾病传播。相同的初始轨迹和相同的 R_0 值的方案可以大相径庭,这取决于我们熟人圈子陈旧的速度-导致最终案件数的数量级差异。自感染以来的平均时间变化会产生动量效应,这会反馈到新的感染率中,并在疫情的后期迅速下降。暴发可能在早期迅速消失,但是一旦错过了这一机会,效果就会减弱,然后,只有畜群免疫才能有所帮助。
Sequential Estimation of Network Cascadeshttp://arxiv.org/abs/1912.03800Anirudh Sridhar, H. Vincent Poor摘要:考虑到网络数据的嘈杂时间序列,我们考虑了定位网络级联源的问题。最初,级联从一个未知的受影响顶点开始,并在每个时间步确定地扩展。目的是要找到一种自适应过程,该过程尽可能快地输出对源的估计,但要遵守估计误差。对于一般类图,我们描述了一系列矩阵顺序概率比率检验(MSPRT),随着估计误差趋于零,该检验是一阶渐近最优的,直至一个恒定因子。我们将结果应用于格子和规则树,并表明MSPRT对于规则树是渐近最优的。我们通过仿真来支持我们的理论结果。
Semantic Search of Memes on Twitterhttp://arxiv.org/abs/2002.01462Jesus Perez-Martin, Benjamin Bustos, Magdalena Saldana摘要:模因正成为分析社交媒体行为的有用数据来源。但是,要解决的问题是如何正确识别模因。由于每天在社交媒体上发布的模因数量巨大,因此需要一种用于对大型模因数据集进行分类和搜索的自动方法。本文提出并比较了几种将图像自动分类为模因的方法。另外,我们提出了一种方法,该方法允许我们实现一个使用文本查询从数据集中检索模因的系统。我们使用从智利的Twitter用户收集的大型模因数据集实验性地评估了这些方法,并由一组专家进行了注释。尽管某些评估方法是有效的,但仍有改进的空间。
Long-term electricity market agent based model validation using genetic algorithm based optimizationhttp://arxiv.org/abs/2005.10346Alexander J. M. Kell, Matthew Forshaw, A. Stephen McGough摘要:政府,行业和机构经常使用电力市场建模来探索不同时间范围内情景的发展。例如,可再生能源成本的降低将如何影响天然气发电厂的投资,或者是征收碳税或补贴的最佳策略?基于成本优化的解决方案是了解不同长期能源方案的主要方法。但是,这些类型的模型具有某些局限性,例如需要以规范的方式进行解释,以及电力市场始终保持均衡的假设。通过这项工作,我们证明了基于主体的模型是模拟去中心化电力市场的可行技术。本文的目的是验证基于主体的建模框架,以增强对其在政策和决策制定中使用的能力的信心。我们的框架可以使用不完善的信息来建模异构主体。该模型使用基于规则的方法来近似现实世界中分散电力市场的基本动态。我们以英国为案例研究,但是我们的框架可以推广到其他国家。我们通过使用 k -means聚类方法选择有代表性的用电天数和天气来增加模型的时间粒度。我们证明了我们的框架可以模拟2013年至2018年英国观测到的从煤炭到天然气的过渡。我们还能够模拟到2035年的未来情景,类似于英国政府,商业和工业战略部(BEIS)预测。我们显示在这段时间内核电的增长更为现实。这是由于以下事实:在目前的核技术下,电力几乎是瞬间产生的,短期边际成本很低cite Department2016。
On the Aggression Diffusion Modeling and Minimization in Online Social Networkshttp://arxiv.org/abs/2005.10646Marinos Poiitis, Athena Vakali, Nicolas Kourtellis摘要:到目前为止,在线社会网络中的攻击行为已经得到了研究,其中大多数是使用几种机器学习方法来检测静态环境中的此类行为。但是,攻击在网络中的传播方式几乎没有受到关注,因为它嵌入了建模挑战。实际上,对侵略性如何从一个用户传播到另一个用户进行建模是一个重要的研究主题,因为它可以实现有效的侵略性监视,尤其是在迄今为止应用了简单的用户阻止技术的媒体平台中。在本文中,我们专注于如何对Twitter上的侵略传播进行建模,因为它是一种流行的微博平台,在该平台上,侵略有多种发作。我们提出了基于两个众所周知的扩散模型(独立级联(IC)和线性阈值(LT))的各种方法,以研究社会网络中的攻击性演变。我们实验性地研究了每种方法在使用真实Twitter数据时,如何在不同参数(例如,用户选择模型种子,权衡用户的边,用户的激活时间等)等参数的情况下,对侵略传播进行建模的能力。基于建议的方法,性能最佳的策略是通过基于程度的方法选择种子用户,根据其社交圈的重叠权衡用户优势并在考虑其攻击程度的同时激活用户的用户。我们进一步采用性能最佳的模型来预测哪些普通的实际用户将来会变得积极起来(反之亦然),并在此预测任务中达到AUC = 0.89。最后,我们通过发起竞争性的级联来“告知”和“医治”侵略者,研究使侵略最小化的方法。我们表明,IC和LT模型可用于侵略性最小化,从而为当前流行的在线社会网络平台采用的阻止技术提供了较少干扰的替代方案。
SSFX(太空音效)短片
电影节:使用电影节模型激发
创意艺术科学并吸引新观众
SSFX (Space Sound Effects) Short Film Festival: Using the film festival model to inspire creative art-science and reach new audienceshttp://arxiv.org/abs/2005.10692摘要:地球磁层中声波的超低频类似物在太空天气中起着至关重要的作用,但是,公众基本上没有意识到这种对我们日常生活和技术的风险。为了潜在地吸引新的观众,SSFX制作了8年的人耳可听见的卫星波录音,目的是利用它来创作艺术品。该项目与电影业专业人士合作,采用了国际电影节的标准流程,以挑战独立电影制作人以创造性的方式将这些声音纳入短片中。在特别的电影节上,从22份参赛作品中选出了7部涵盖各种主题/类型(尽管声音相同)的电影进行放映。这些作品随后在众多国际知名电影节和放映中放映。这些事件吸引了各种各样的非科学观众,从而给他们带来了一些意想不到的影响,从而证明了与艺术界合作如何与通常不参与科学的艺术家和观众展开对话。
CSNE: Conditional Signed Network Embeddinghttp://arxiv.org/abs/2005.10701Alexandru Mara, Yoosof Mashayekhi, Jefrey Lijffijt, Tijl De Bie摘要:符号网络是一种数学结构,可对诸如朋友/敌人或信任/不信任之类的实体之间的正负关系进行编码。最近,有几篇论文研究了这些网络的有用的低维表示(嵌入)的构造,以预测缺失的关系或符号。现有的用于符号预测的嵌入方法通常在其优化功能中实施不同的状态概念或平衡理论。但是,这些理论通常不准确或不完整,这会对方法性能产生负面影响。在这种情况下,我们介绍了条件符号网络嵌入(CSNE)。我们的概率方法将网络中标志的结构信息与细化细节分开建模。结构信息以先验的形式表示,而嵌入本身则用于捕获细粒度的信息。然后,将这些组件严格集成在一起。CSNE的准确性取决于是否存在足够强大的结构先验模型来建模带符号的网络,目前尚无文献报道。因此,作为第二个主要贡献,我们发现它本身具有很高的价值,我们还介绍了一种基于最大熵(MaxEnt)原理构造先验的新颖方法。这些先验可以对节点的 emph 极性(其链接为正的程度)以及带符号的 emph triangle counts)(对网络中结构平衡的保持程度进行度量)进行建模。在各种现实世界网络上进行的实验证实,CSNE在符号预测任务上的表现优于最新技术。此外,MaxEnt先验本身虽然不如完整的CSNE准确,但却以非常有限的计算成本获得了与最新技术相抗衡的准确性,从而在资源受限的情况下提供了出色的运行时准确性折衷。
Strategies for an efficient official publicity campaignhttp://arxiv.org/abs/2005.10710摘要:在一个有一套规则的社会中,我们考虑了意见形成的过程。由于公众舆论的漂移,这些规则会随着时间而改变,部分原因是宣传运动。舆论是由选民态度的整合形成的,选民的态度既可以是保守的(同意),也可以是宽松的(同意同龄选民)。这些姿态在系统的相空间中由稳定的固定点表示。在这封信中,我们研究了官方宣传活动必须具备的属性,才能使公众舆论赞成。
Markets for Efficient Public Good Allocationhttp://arxiv.org/abs/2005.10765Devansh Jalota, Marco Pavone, Yinyu Ye摘要:在没有监管机制的情况下,公共物品经常被过度消费,或者像Covid-19大流行一样完全被闲置,该地区实行社会距离限制以限制可以共享公共场所的人数。在这项工作中,我们通过基于市场的机制来填补这一缺口,以有效地分配容量受限的公共产品。为了设计这些机制,我们利用了费舍尔市场的理论,在该理论中,每个主体商都获得了人为的货币预算,他们可以花这些预算来购买公共物品。尽管费舍尔市场为建模资源分配问题提供了强大的方法论基础,但其适用性仅限于涉及两种约束条件的环境-个人购买者的预算和商品的能力。在公共产品分配问题中出现的其他物理约束条件的存在,促使人们有必要对费舍尔市场框架进行修改,以解决这些更为普遍的约束条件。在我们的机制中,我们通过扰动主体商的预算来专门修改Fisher市场的社会优化问题。基于附加物理约束的对偶变量设置扰动,以使新定义的社会和个体优化问题的KKT条件相等。虽然被扰动的社会问题可能与最初的社会目标并不相似,但我们证明与被扰动问题相对应的最优分配与未被扰动问题的最优分配密切相关。最后,为了计算摄动常数,我们提出了一个定点过程,建立了它的收敛性,并提出了数值实验来证实我们的收敛结果。因此,我们的机制在理论上和计算上都克服了费希尔市场的根本限制,即仅考虑产能和预算约束。
Asymmetries in football: The pass-goal paradoxhttp://arxiv.org/abs/2005.10816D.R. Antequera, D. Garrido, I. Echegoyen, R. Lopez del Campo, R. Resta Serra, J. M. Buldu摘要:我们调查足球队传球次数与进球数之间的关系。我们分析了西班牙国家联赛“ LaLiga”(2018/2019)一个完整赛季的380场比赛。我们观察到进球数与球队传球次数成正相关。这样,本赛季末排名最高(底部)的球队比其他球队获得更多(更少)的传球。但是,根据匹配的部分进行分析时,我们观察到很强的不对称性。有趣的是,在比赛的第二部分,传球次数减少,同时进球数增加。这种矛盾现象出现在大多数球队中,并且与通过次数无关。这些结果证实,在比赛的第一部分中,进球比在下半场中得分更高。声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!