核心速递
人类财富演变:趋势与波动;
- Covid-19:伦巴第大区、贝加莫和布雷西亚省的数据分析;
- DeepSIP:一种通过时间多模CNN预测网络故障服务影响的系统;
- 使用位置大数据校准用于业务分析的动态Huff模型;
- 基于对中国四个疫情最严重地区和意大利五个疫情最严重地区的研究,冠状病毒疾病传播(COVID-19)与环境因素之间的关系的统计调查;
- SEIR模型中COVID 19社区传播的管理策略;
- 哥伦比亚波哥大的人们发表了什么冠状病毒相关症状的帖子?;
- 复杂系统的隐藏脆弱性——变化的后果,变化中的后果;
- BaitWatcher:一个轻量级的Web界面,用于检测不一致的新闻标题;
Human wealth evolution: trends and fluctuationshttp://arxiv.org/abs/2003.11502Paolo Sibani, Steen Rasmussen摘要:是否可以对人类财富历史进行因果描述?为了对此问题进行调查,我们引入了一个简单的因果关系模型,尽管该模型具有很强的聚集性,但前提是所观察到的财富增长主要由人类的合作努力驱动,而人类的合作努力的强度却随着财富的增加而增加。作为经验参考,我们使用时间序列描述了三个欧洲国家(英国,法国和瑞典)的八个世纪的人均年国内生产总值。该模型需要足够大的人口来应对破坏性事件,例如饥荒,流行病和战争,而不是破坏社会的基本运转。然后,可以用具有三个自由参数的常微分方程来描述财富的发展趋势。该解决方案具有有限的时间奇异性,这表明缺乏长期的可持续性。发生奇异的年份在一个公元2020年前后在一个国家与另一个国家之间略有变化。1900年后缩减的GDP时间序列对于奇异点的产生产生了相似的值,因此可以预测一百多年前。从早期到公元1700年缩减GDP序列也会对奇异时间产生稳定一致的预测。功率谱是针对跨越八个世纪的去趋势数据以及同一时期的前四个世纪和最后四个世纪获得的。所有谱都有一个整体特征,即功率随频率的平方成反比而下降。嵌入的峰让人想起经济文献中描述的周期,但也出现在时间序列上早于工业化。GDP系列的背景波动被暂时解释为社会对破坏性随机事件的反应。例如重大发现之后的新经济活动以及战争和流行病。
Covid-19:伦巴第大区、
贝加莫和布雷西亚省的数据分析
Covid-19: Data analysis of the Lombardy region and the provinces of Bergamo and Bresciahttp://arxiv.org/abs/2003.10518Marco Picariello, Paola Aliani摘要:伦巴第大区以及贝加莫和布雷西亚两省的死亡数据分析显示出该流行趋势的两面:所有数据均显示与3月10日(伦巴第大区有关的数据是不完整的)的偏差,以及随后计算阳性病例和死亡的方式的变化;根据3月11日首相法令的遏制措施,这种流行病的传播虽然本质上仍呈指数级增长,但其乘积系数却降低了。我们的分析得出的结论是,这种情况尚无到达平台期趋势,由此可以预测伦巴第地区的死亡人数趋势。因此,我们得出的结论是,政府3月11日实施的围堵措施将使3月27日的死亡人数从8000人减少到6500多人。A simple iterative map forecast of the COVID-19 pandemichttp://arxiv.org/abs/2003.10532André E. Botha, Wynand Dednam摘要:我们开发了一个简单的3维迭代图模型来预测冠状病毒疾病的全球传播。我们的模型仅包含一个拟合参数,我们可以根据世界卫生组织每天提供的病例总数和新病例的数据确定该参数。我们发现我们的模型非常适合当前可用的数据。它预测,从世界卫生组织提供第一份“状况报告”之日(2020年1月21日,第一天)起,该病将在六至七个月内完全发作。预计该疾病将感染全球约25%的人口,即约19.5亿美元的人口,约有85百万美元的生命。除非有可能采取严厉的新措施,否则预计全球新病例数将在第126天(大约2020年5月中旬)达到顶峰,估计每天有7千5百万的新病例。由于我们的简单模型非常适合现有的全球数据,因此我们建议,迄今为止采取的遏制大流行的措施可能无法有效遏制病毒的全球传播。因此,应仔细权衡目前为遏制冠状病毒而采取的措施的有效性及其对世界经济的影响。Is a COVID19 Quarantine Justified in Chile or USA Right Now?http://arxiv.org/abs/2003.10879R. I. Gonzalez, F. Munoz, P. S. Moya, M. Kiwi摘要:在当前的COVID-19大流行期间,必须发出预警以降低死亡率。但是,诸如权威机构和普通民众这样的非专业人士在理解这种大流行的真正原因时会遇到一些问题,而对其风险的低估/高估在新闻界和社交媒体中是司空见惯的。在这里,我们定义了一个指数,称为COVID-19负担指数,该指数与特定国家/地区的医疗系统治疗重症和重症病例的能力相关。如果医疗保健系统中没有额外的压力,则其值为0;当即将崩溃时,其值为1.0。截至2020年3月23日,我们显示智利,美国,英国以及其他国家/地区目前必须降低感染率,否则,在不到7天的时间里,它们可能会处于灾难性的境地,例如意大利,西班牙和伊朗。Translational Knowledge Map of COVID-19http://arxiv.org/abs/2003.10434Cesar Aguado-Cortés, Victor M. Castaño摘要:一个COVID-19的转化知识图谱,分析基于以下术语和关键词共现的科学论文和网络引用:主要数据库(MEDLINE,Web of Science和Scopus)中的covid-19、2019-ncov和sars-cov-2。covid-19的某些研究领域是相互联系的,但在结构、内容和演变上都不同。Influence-based Community Partition with Sandwich Method for Social Networkshttp://arxiv.org/abs/2003.10439Qiufen Ni, Jianxiong Guo, Chuanhe Huang, Weili Wu摘要:社区划分是生物网络,社会网络等许多领域的重要问题。这个问题的目的是通过网络拓扑分析数据之间的关系。在本文中,我们考虑了社会网络中IC模式下的社区划分问题。我们将该问题表述为组合优化问题,旨在将给定的社会网络划分为不相交的M社区。目的是通过在每个社区内最大化社会网络的影响力传播的总和。现有工作表明,对社区划分问题(IMCPP)的影响最大化是NP难题。我们首先证明IC模型下IMCPP的目标函数既不是亚模也不是超模。然后构造并证明了超模上限和亚模下限,从而可以应用三明治框架。针对上界和下界问题设计了连续贪婪算法和离散实现,两个问题的算法都获得了1-1 / e的近似值。我们还设计了一个简单的贪婪算法来求解原始目标函数,并对其应用三明治近似框架,以保证依赖于数据的近似因子。最后,我们的算法在两个真实的数据集上进行了评估,这清楚地验证了我们的方法在社区划分问题中的有效性以及我们的方法相对于其他方法的优势。Where Should You Park Your Car? The 1/2 Rulehttp://arxiv.org/abs/2003.10603P. L. Krapivsky, S. Redner摘要:我们调查一维停车位,其中汽车以 lambda 的速度进入,每辆车试图将其停在原点附近的目标位置。停放的汽车也以1的速度发车。进入的驾驶员看不到停放的汽车以外的地方,以获得更理想的空地。我们分析了一类策略,其中驾驶员忽略 tau L 以外的空地,其中 tau 是风险阈值, L 是最远的停放汽车的位置,并尝试在第一个停放遇到的可用现货比 tau L 更近。当所有驾驶员都采用此策略时,在 tau = frac 1 2 时,最大停车位的概率最大,而在最佳位置停车的概率为 frac 1 4 。Spread of infectious disease and social awareness as parasitic contagions on clustered networkshttp://arxiv.org/abs/2003.10604Laurent Hébert-Dufresne, Dina Mistry, Benjamin M. Althouse摘要:诸如流感之类的生物传染与诸如流感疫苗接种运动之类的相关信息的传播之间相互作用的模型已有悠久的历史。关于网络上互动传染病传播的最新研究表明,这些互动传染病可能与网络结构产生反直觉的相互作用。在这里,我们概括了这些框架之一,以解决意识和疾病传播的三个重要特征:第一,我们在高度聚类的,流行的网络上模拟动态,以模仿工作场所和家庭的作用。第二,意识传播会通过降低其传播率来影响生物传播的传播,而这种传播在有意识或已接种疫苗的个体不太可能被感染的情况下;第三,生物传播也影响意识传播的传播,但是会通过提高其传播率来使感染者更容易接受并且更可能分享与疾病有关的信息。在这种情况下,我们发现已知会阻碍疾病传播的不断增加的网络聚类实际上可以使他们在有意识的模型中维持较大的疾病流行。这一违反直觉的结果违背了传统观点,即认为随机网络是合理的,因为它们可以提供最坏情况的预测。为了进一步研究此结果,我们基于两步分支过程(即预期的三次感染数量)提供了一种封闭形式的标准,以识别参数空间中聚类和共感染的净效应发生变化的不同区域。总而言之,我们的结果再次强调了在疾病建模中超越随机网络的必要性,并说明了即使在相互作用的传染病的复杂模型中也可能进行的分析类型。
DeepSIP:一种通过时间多模
CNN预测网络故障服务影响的系统
DeepSIP: A System for Predicting Service Impact of Network Failure by Temporal Multimodal CNNhttp://arxiv.org/abs/2003.10643Yoichi Matsuo, Tatsuaki Kimura, Ken Nishimatsu摘要:当网络中发生故障时,网络运营商需要识别服务影响,因为服务影响是处理故障的重要信息。在本文中,我们提出了基于深度学习的服务影响预测(DeepSIP),该系统使用时间多模态卷积神经网络(CNN)来预测从故障中恢复的时间以及由于网络元素故障而导致的流量损失)。由于恢复时间对于服务水平协议(SLA)是有用的信息,并且流量的损失与故障的严重程度直接相关,因此我们将其视为服务影响。由于网络元素未明确包含有关服务影响的任何信息,因此很难预测服务影响。因此,我们旨在通过提取有关故障的隐藏信息来预测来自syslog消息和流量的服务影响。为了从多模式且高度相关且具有时间依赖性的syslog消息和流量中提取有用的预测功能,我们使用了时间多模式CNN。与其他具有综合数据集的基于NN的方法相比,我们通过实验评估了DeepSIP和DeepSIP将预测误差降低了约50%。A Systematic Mapping of Software Engineering Challenges: GHTorrent Casehttp://arxiv.org/abs/2003.10750Abdulkadir Seker, Banu Diri, Halil Arslan, Mehmet Fatih Amasyalı摘要:Git用作许多开源软件项目的分布式版本控制系统。一种基于Git的服务GitHub是针对开源软件项目的最常见的代码托管和存储库服务。对于研究软件工程的研究人员而言,这些平台上托管的内容提供了很多有价值的数据。还有一些获取GitHub数据的方法,例如GitHub Archive,GitHub API或GHTorrent。在这些选项中,GHTorrent是文献中最广为人知和使用的GitHub数据集。尽管有一些有关整个GitHub平台上软件工程挑战的综述研究,但尚没有有关GHTorrent数据集特定研究的综述。在这项研究中,使用GHTorrent作为数据源的172项研究被归类为软件工程挑战的范围,并进行了系统的制图研究。此外,已经指出了数据集的利弊,并指出了文献中的重点问题和公开挑战。q-Weibull distributions describing commercial service routeshttp://arxiv.org/abs/2003.10856Ronan S. Ferreira, Priscila C. A. da Silva摘要:我们将结合复杂的网络工具和实际数据,对巴西的公路运输方式进行调查。我们的分析涉及一个数据集,该数据集基于巴西运输局数据库中列出的服务路线。尽管通常以幂律法描述全球道路网络的连通性分布,但我们报告称其更适合q-Weibull分布提供的巴西案例。在我们的方法中,节点承担位置的角色,而链接代表其中的服务路由。有趣的是,对于特定范围的传出连接,数据分布的尾部会迅速下降。通过研究网络的谱中心性和用于输入和输出分布的不同分布混合物的模式,揭示了导致这种下降的机制。除了讨论幂律描述外,我们还报告了两种不同分布的对比。它们由q-Weibull一个插值:Weibull和q指数分布。此外,我们研究了该网络的互易性,这反映了相互链接对动力学过程的影响。对于人类流动性,运输和多模式视角的研究,这种分析是必不可少的。Calibrating the dynamic Huff model for business analysis using location big datahttp://arxiv.org/abs/2003.10857Yunlei Liang, Song Gao, Yuxin Cai, Natasha Zhang Foutz, Lei Wu摘要:Huff模型已广泛用于基于位置的业务分析中,用于描绘包含潜在客户到商店的交易区域。校准霍夫模型及其扩展需要经验性的位置访问数据。许多研究依赖劳动密集型调查。随着移动设备可用性的提高,基于位置的平台中的用户可以以精细的时空分辨率共享有关其位置的丰富多媒体信息,这为商业智能提供了机会。在这项研究中,我们提出了一种基于时间的动态Huff模型(T-Huff),用于基于位置的市场份额分析,并根据人口稠密的美国十个城市的手机位置数据,使用大规模商店访问模式来校准此模型。通过比较两种类型商店的每小时访问模式,我们证明了校准的T-Huff模型比原始Huff模型在预测不同类型的业务(例如,超级市场与百货商店)随时间的市场份额方面更为准确。我们还确定了区域差异性,大城市地区公交系统发达的人们对长途旅行的敏感性较低。此外,还检查并总结了可能影响人们访问决定的一些社会经济和人口因素(例如家庭收入中位数)。Mapping the Landscape of Artificial Intelligence Applications against COVID-19http://arxiv.org/abs/2003.11336Joseph Bullock, Alexandra (Sasha) Luccioni, Katherine Hoffmann Pham, Cynthia Sin Nga Lam, Miguel Luengo-Oroz摘要:由SARS-CoV-2病毒引起的疾病COVID-19已被世界卫生组织宣布为大流行病,截至2020年3月22日,已有294,000例病例。在本综述中,我们概述了使用机器学习和更广泛的人工智能的近期研究,以不同规模解决COVID-19危机的许多方面,包括其分子、医学和流行病学应用。最后,我们讨论了有希望的未来研究方向以及促进AI研究所需的工具和资源。
基于对中国四个疫情最严重地区和
意大利五个疫情最严重地区的研究,
冠状病毒疾病传播(COVID-19)
与环境因素之间的关系的统计调查
Statistical investigation of relationship between spread of coronavirus disease (COVID-19) and environmental factors based on study of four mostly affected places of China and five mostly affected places of Italyhttp://arxiv.org/abs/2003.11277Soumyabrata Bhattacharjee (Royal School of Engineering & Technology, Guwahati, Assam, India)摘要:COVID-19是一种新型的冠状病毒疾病,由SARS-CoV-2病毒引起。它于2019年12月发现于中国,并迅速开始在国内传播。2019年12月31日,该病首次报告给世界卫生组织(WHO)中国驻国家代表处。从那时起,它已传播到全球大多数国家。然而,最近的趋势认为它会在夏季消失,这一趋势目前尚未得到适当的调查。考虑到潜伏期,本文研究了每日确诊COVID-19病例数与三个环境因素的关系,即最大相对湿度(RH_max)、最高温度(T_max)和最高风速(WS_max),对四个中国(北京,重庆,上海,武汉)和五个意大利(贝加莫,布雷西亚,克雷莫纳,洛迪,米兰)受影响最严重的地区进行了统计调查。研究发现,疫情与最大相对湿度和最高风速的关系几乎可以忽略,而与最高温度的关系在可以忽略至中度范围。Management strategies in a SEIR model of COVID 19 community spreadhttp://arxiv.org/abs/2003.11150Anca Radulescu, Kieran Cavanagh摘要:2019年的新型冠状病毒感染(COVID 19)是国际关注的持续性公共卫生突发事件。尽管爆发是前所未有的全球威胁,但我们在COVID 19流行病学,传播动态,调查工具和管理方面的知识仍然存在巨大差距。从积极的一面来看,目前对流行病的了解足够多,可以建立数学预测模型。我们在这里构建和分析第一步:用传统的SEIR流行病模型拟合COVID 19的特定动态区室和流行病参数,因为它在年龄不同的社区中传播。我们分析了流行病课程的当前管理策略(旅行禁令,服务关闭和中断,社会疏远)。在当前质疑其可持续性的背景下,我们会生成预测并评估这些控制措施的效率。Some numerical observations about the COVID-19 epidemic in Italyhttp://arxiv.org/abs/2003.11363摘要:我们对意大利最近发生的COVID-19流行病的总数进行了一些数值观察。该分析非常简单,并且改编自著名的SIR模型。考虑具有两个参数的tanh公式。公式化了参数之间的多项式相关性,给出了新感染高峰期的上限。结论中讨论了结果。
哥伦比亚波哥大的人们发表了
什么冠状病毒相关症状的帖子?
What is the people posting about symptoms related to Coronavirus in Bogota, Colombia?http://arxiv.org/abs/2003.11159Josimar E. Chire Saire, Roberto C. Navarro摘要:在过去的几个月中,有关由世界卫生组织(WHO)发明的covid-19冠状病毒新突变的警报越来越多,对许多领域产生了影响:经济,卫生,政治等。由于许多国家的迅速扩张,世卫组织宣布这种情况为大流行病。同时,人们正在使用社会网络来表达他们的想法,感受或实验,因此,这些人是社交感应器,有助于分析城市中正在发生的事情。本文的目的是使用症状学方法中的文本挖掘技术来分析居住在波哥大半径为50 km的哥伦比亚人的出版物。结果支持对与covid19症状有关的哥伦比亚流行的理解。Flow optimization process in a transportation networkhttp://arxiv.org/abs/1810.06330Fabricio L. Forgerini, Orahcio F. de Sousa摘要:许多网络(例如运输,配送和交付网络)都对其设计进行了优化,以提高效率,降低成本,提高其预期功能的稳定性等。分发货物(例如电,水,煤气,电话和数据)的网络(互联网)或邮件,铁路和公路等服务就是运输网络的示例。最佳设计可修复网络体系结构,包括群集,学位分布,层次结构,社区结构和其他结构指标。这些网络是专为高效运输而设计的,最大限度地减少了运输时间和成本。各种运输网络都面临相同的问题:其渠道之间的交通拥堵。在这项工作中,我们考虑了运输网络模型,在该模型中,我们优化/最小化了网络中每个通道/链路的通量/电流的成本函数。我们针对此问题进行了模拟和分析研究,重点关注已使用通道的比例以及通过这些通道的流量分布。我们的结果表明,在初始瞬态之后,使用通道的比例保持恒定,并且值得注意的是,此结果不取决于晶格结构(2D,3D或远程连接)。对于高流量,将使用网络中的所有通道。另一方面,在小流量限制下,我们观察到一种新颖的行为,即所用通道的比例取决于流量的平方根。Punishing defectors and rewarding cooperators: Do people discriminate between genders?http://arxiv.org/abs/2003.11067Hélène Barcelo, Valerio Capraro摘要:当人们负责惩罚叛逃者或奖励合作者时,人们是否会区分男女?回答这个问题可能对性别平等产生深远的影响,因为合作行为是我们社会的基础,通常通过惩罚或奖励来实施。在本文中,我们报告了两个预先注册的实验,希望我们对此有所启发。研究1(N = 1,077)表明,当人们负责一次性射击公共物品博弈中的惩罚(奖励)叛逃者(合作者)时,人们不会对性别进行区分。在这项研究中,惩罚/奖励是通过询问参与者是否要为减少/增加叛逃者/合作者的收益而付出的代价来实现的。研究2(N = 253)将研究1扩展到一种不同的惩罚/奖励方法。要求参与者将叛逃者/合作者的行为评分为1到5星。在这种情况下,我们也发现人们没有性别差异。所有这些结果对于按性别划分样本都是有力的:在我们的上下文中,当男人或女人负责惩罚叛逃者或奖励合作者时,他们都不区分性别。A Novel Metric Shows the Robustness of the Graph Communities to Brain-Tractography False-Positiveshttp://arxiv.org/abs/2003.11075Juan Luis Villarreal-Haro, Alonso Ramirez-Manzanares, Juan Antonio Pichardo-Corpus摘要:我们研究了大脑连通性图中的大脑束摄影术误报的影响。用于分析的代表性输入数据库是参与者在ISMRM-2015术式挑战赛上获得的一组束图。我们提出了2个新颖的指标来对与已知的地面真相进行比较的一张图进行质量排序。这项研究的结果表明,图社区的估计对于连通性中的高估过高具有鲁棒性。Covid-19 Tweeting in English: Gender Differenceshttp://arxiv.org/abs/2003.11090Mike Thelwall, Saheeda Thelwall摘要:2020年初,COVID-19成为对全球公共卫生的最紧迫威胁。在最近一段时间,政府对人口实行了部分自愿和部分强制性限制,以减缓病毒的传播,这是独一无二的。在这种情况下,公众的态度和行为对于降低死亡率至关重要。因此,分析有关该疾病的推文可能会深入了解公众反应,这可能有助于指导公共宣传运动。本文分析了2020年3月10日至23日有关COVID-19的3,038,026条英语推文。它着重于公众反应的一个相关方面:性别差异。结果表明,在家庭,社交距离和医疗保健方面,女性更可能发布有关该病毒的推文,而男性更可能发布有关体育活动取消,该病毒在全球的传播和政治反应的推文。因此,妇女似乎在直接维护人口安全的责任中所占比例过高。详细的结果可能有助于通知公众,并有助于了解病毒的传播。例如,在鼓励社会疏远的同时没有实施体育禁令可能会向男性发送混合信息。Large-scale network analysis reveals cheating spreads through victimization and observationhttp://arxiv.org/abs/2003.11139Ji Eun Kim, Milena Tsvetkova摘要:负面的八卦,欺诈或欺凌等反社会行为可能具有传染性,会在个人之间传播并通过社会网络荡漾。先前的实验研究表明,经历或观察到反社会行为的人更有可能反社会地表现。在这里,我们使用观察性研究区分受害和观察。我们对大型数字跟踪数据应用时态网络分析,以研究欺诈行为在在线博弈中的传播。我们分析了多人在线博弈PlayerUnknown’s Battlegrounds的1,146,941场比赛,其中多达100位玩家单独或成队对抗陌生人。我们确定了被玩家杀死或观察到作弊者的临时主题开始作弊,并评估了如果我们保留了团队和互动结构但假设了事件的替代序列,这些主题出现的程度。结果表明,只有经历和观察多次欺骗的人才可能存在社会传染。研究结果指出了针对性干预措施的策略,以阻止欺诈行为和反社会行为在在线社区,学校,组织和体育活动中的传播。The Hidden Fragility of Complex Systems — Consequences of Change, Changing Consequenceshttp://arxiv.org/abs/2003.11153摘要:短期生存和对建立我们未来的巨大投入正在产生一种新的意想不到的后果-隐藏的脆弱性。这是人类创造的社会技术系统的复杂性和结构复杂性的直接影响。这是不可避免的。因此,挑战在于,我们对这些系统以及导致其构建的社会动态能有多少了解和预测?Quantifying efficient information exchange in real network flowshttp://arxiv.org/abs/2003.11374Giulia Bertagnolli, Riccardo Gallotti, Manlio De Domenico摘要:网络科学能够对实际的互连系统进行有效的分析,其特征是拓扑结构和互连强度之间的复杂相互作用。众所周知,网络的拓扑会影响其对故障或攻击的恢复能力以及其功能。信息交换对于许多实际系统至关重要:互联网,交通网络和大脑是关键示例。尽管引入了用于分析网络流量的有效措施,即以加权连接为特征的拓扑,但在此我们显示它们无法捕获链路存在和链路权重的组合信息。在这封信中,我们提出了一种基于流量的物理估计器,该估计器可以针对每个加权网络进行计算,而与权重的大小和性质以及任何(缺失的)元数据无关。值得注意的是,结果表明,我们的估计器捕获了流量的异质性以及拓扑差异,并从包括运输,贸易,迁移和大脑网络在内的多个经验系统的渗滤分析获得了其补充信息。我们表明,切断最繁重的连接可能会提高系统的平均通信效率,因此,与直觉相反,稀疏网络不一定会降低效率。值得注意的是,我们的估算器可以比较来自不同领域的网络的通信效率,而不会因流量规模而产生可能的陷阱。Diffusion as a First Model of Spread of Viral Infectionhttp://arxiv.org/abs/2003.11449摘要:随着发展成为大流行,近几个月来,冠状病毒(COVID-19)的出现在2019年底成为主要新闻。在每个数学和物理课堂中,讲师都使用病例数的时间序列显示感染的指数增长。在本手稿中,我们提出了一种简单的传播过程作为传播感染的方式。该模型不如文献中的其他模型复杂,但是它可以捕获指数增长,并且可以根据迁移率(扩散常数),人口密度和传播概率进行解释。学生可以更改参数并确定增长率,并预测随时间变化的病例总数。还使学生有机会添加其他简单扩散模型中未考虑的因素。
BaitWatcher:一个轻量级的Web
界面,用于检测不一致的新闻标题
BaitWatcher: A lightweight web interface for the detection of incongruent news headlineshttp://arxiv.org/abs/2003.11459Kunwoo Park, Taegyun Kim, Seunghyun Yoon, Meeyoung Cha, Kyomin Jung摘要:在在线共享大量信息的数字环境中,新闻标题在新闻文章的选择和传播中起着至关重要的作用。一些新闻文章以夸大或误导性的标题吸引了观众的注意力。这项研究解决了 textit headline incongruity问题,其中新闻标题提出与相应文章的内容无关或相反的声明。我们提供 textit BaitWatcher,这是一个轻量级的Web界面,可引导读者在单击标题之前估算新闻文章中不一致的可能性。BaitWatcher利用分层递归编码器,可以有效地学习新闻标题及其关联的正文的复杂文本表示形式。为了训练模型,我们构建了一个百万级新闻文章数据集,我们还将其发布以供更广泛的研究用途。基于焦点小组访谈的结果,我们讨论了开发可解释的AI主体对于设计更好的界面以减轻在线错误信息影响的重要性。Space-time Bayesian analysis of the environmental impact of a dismissing nuclear power planthttp://arxiv.org/abs/2003.11495Antonio Petraglia, Carmina Sirignano, Raffaele Buompane, Antonio D’Onofrio, Afonso Maria Esposito, Filippo Terrasi, Carlo Sabbarese摘要:本工作涉及过去二十年来在位于意大利南部并于1979年关闭的Garigliano核电厂(GNPP)周围的Garigliano河平原进行的三次战役的数据。此外,一些调查数据考虑到整个切尔诺贝利事故在八十年代举行。分析了土壤样品(尤其是137Cs和236U比活)的结果在空间和时间上的扩展。使用贝叶斯方法已经克服了与经典环境放射数据分析有关的一些问题(数值的非正态分布,少量采样点,多次比较以及数值小于最小可检测活动的存在) 。本文的研究范围包括三个方面:(1)介绍加里利亚诺平原上一次战役的数据;(2)将这些数据插入较大的时空帧中;(3)展示了如何使用贝叶斯方法将其应用于放射性环境调查,并利用战役数据强调其相对于其他方法的优势。结果表明:(i)在过去的几十年中没有新的贡献;(ii)GNPP周围地区的比活值与在其他更远地区获得的比活值一致;(iii)137Cs的有效损耗半衰期因子远低于放射性核素的半衰期。Utilizing Deep Learning to Identify Drug Use on Twitter Datahttp://arxiv.org/abs/2003.11522Joseph Tassone, Peizhi Yan, Mackenzie Simpson, Chetan Mendhe, Vijay Mago, Salimur Choudhury摘要:社交媒体的收集和检查已成为研究用户心理活动和行为倾向的有用机制。通过分析收集到的Twitter数据,开发了用于对毒品相关推文进行分类的模型。使用与主题相关的关键词(例如语和吸毒方法),生成了一组推文。然后对潜在的候选对象进行预处理,得到3,696,150行的数据集。比较了多种方法的分类能力,包括支持向量机(SVM),XGBoost和基于卷积神经网络(CNN)的分类器。而不是简单的特征或属性分析,而是采用了深度学习方法来筛选和分析推文的语义。与其他方法相比,这两个基于CNN的分类器显示出最佳结果。第一个使用了2661个手动标记的样本进行了培训,而其他样本则包括最终生成的12142个样本的合成推文。准确性得分分别为76.35%和82.31%,AUC为0.90和0.91。此外,关联规则挖掘表明,通常提到的药物与经常使用的非法物质具有一定程度的对应性,证明了该系统的实用性。最后,合成生成的集合提供了更高的分数,提高了分类能力,并证明了该方法的价值。Automated Service Discovery for Social Internet-of-Things Systemshttp://arxiv.org/abs/2003.11524Abdullah Khanfor, Hakim Ghazzai, Ye Yang, Mohammad Rafiqul Haider, Yehia Massoud摘要:在本文中,我们建议设计一个自动化的服务发现过程,以允许移动众包任务请求者从大型物联网(IoT)网络中选择一小组设备来执行其任务。为此,我们将大型物联网网络划分为几个虚拟社区,其成员共享牢固的社会物联网关系。研究了两种社区检测算法,即Louvain和顺序统计本地方法(OSLOM)算法,并将其应用于实际的IoT数据集,以形成不重叠和重叠的IoT设备组。之后,将执行基于自然语言过程(NLP)的方法来处理众包文本请求,并相应地找到能够有效完成任务的IoT设备列表。这是通过将NLP输出(例如应用程序类型,位置,所需的可信度)与检测到的不同社区进行匹配来执行的。所提出的方法有效地帮助自动化并减少了移动众包应用程序的服务发现过程和招聘过程。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!