- 在旁观者眼中:对社交媒体使用COVID-19的中性和争议性术语的情感和主题分析;
- 具有自训练功能的域引导任务分解,用于检测社交媒体中的个人事件;
- 活动的爆发:在线心理健康论坛中寻求帮助和支持的时间模式;
- 社交媒体数据在城市规划中的潜力:巴西库里提巴啤酒街的发现;
原文标题:
Disease spreading with social distancing: a prevention strategy in disordered multiplex networks
http://arxiv.org/abs/2004.10593I. A. Perez (1), M. A. Di Muro (1), C. E. La Rocca (1), L. A. Braunstein (1 and 2) ((1) Instituto de Investigaciones Físicas de Mar del Plata (IFIMAR)-Departamento de Física, FCEyN, Universidad Nacional de Mar del Plata-CONICET, Mar del Plata, Argentina, (2) Physics Department, Boston University, Boston, MA, USA.)摘要:甲型(H1N1)流感,SARS,MERS和COVID-19等可能在本地和全球范围内构成威胁的疾病的不断出现,使得继续设计疾病传播模型和预防或预防策略十分重要。减轻其对人口的影响。由于隔离系统在任何情况下都很少见,特别是在人类接触网络中,因此在此我们研究了由两个不同的网络或通过分数 q相互连接的层组成的多重网络中的疾病传播的易感感染恢复模型。我们通过加权网络对每一层中个体之间的交互进行建模,因为人与人之间的交互是多种多样的(或无序的)。权重代表这些交互作用的接触时间,我们使用接触时间的分布为每一层分配一个个体障碍。使用模拟支持的分支理论,我们研究了一种社会疏远策略,在该策略中,我们减少了一层(或必要时两层)的平均接触时间。我们发现了一组与平均接触时间相关的病症参数,可以防止疾病流行。当疾病极有可能扩散时,无论疾病参数和共享结节的分数如何,系统始终处于流行阶段。但是,我们发现仍然有可能保护易感个体的巨大组成部分,这对于保持由两个相互连接的层组成的系统的功能至关重要。
Master equation analysis of mesoscopic localization in contagion dynamics on higher-order networkshttp://arxiv.org/abs/2004.10203Guillaume St-Onge, Vincent Thibeault, Antoine Allard, Louis J. Dubé, Laurent Hébert-Dufresne摘要:传染病的简单模型倾向于假定个人是随机混合的,但真正的互动并不是随机的成对遭遇:它们发生在明确定义的高级结构中,例如工作场所,家庭,学校和音乐会。我们使用基于团的近似主方程对具有高阶结构的网络的传播进行建模,其中我们跟踪团内的所有状态和相互作用,并假设它们之间存在均值场耦合。使用敏感感染敏感动力学,我们的方法使我们能够显示介观定位机制的存在,在这种机制下,疾病只能在网络中的大型子结构周围集中和自我维持。在这种情况下,相变被涂抹,其特征在于各种高阶结构的不均匀活化。在介观水平上,我们观察到相同大小的群中感染节点的分布可能非常分散,甚至是双峰的。当考虑网络在节点和集团级别上的异构时,我们分析地表征了结构参数空间中与介观局部化相关的区域。我们以特征向量本地化的角度来看待了这一现象,并讨论了如何需要关注高层结构才能在介观水平上辨别更细微的本地化。最后,我们讨论了介观局部化如何影响对结构性干预的反应,以及该框架如何为广泛的动力学提供重要见解。
在旁观者眼中:对社交
媒体使用COVID-19的中性和
争议性术语的情感和主题分析
原文标题:
In the Eyes of the Beholder: Sentiment and Topic Analyses on Social Media Use of Neutral and Controversial Terms for COVID-19
http://arxiv.org/abs/2004.10225Long Chen, Hanjia Lyu, Tongyu Yang, Yu Wang, Jiebo Luo摘要:在COVID-19大流行期间,“中国病毒”作为冠状病毒的有争议术语出现。在某些人看来,这似乎是一个中性术语,指的是病毒的物理起源。但是,对于许多其他人来说,该术语实际上是将种族与病毒联系在一起。在本文中,我们试图阐明该术语在Twitter上的实际用法。通过使用情感特征分析和主题建模,我们揭示了使用有争议的术语(例如“中国病毒”)和使用无争议的术语(例如“ COVID-19”)之间的实质差异。例如,使用有争议的术语的推文包含较高百分比的愤怒和负面情绪。他们还更频繁地指向中国。我们的研究结果表明,尽管“中国病毒”一词可以解释为中立或种族主义,但其在社交媒体上的使用强烈倾向于后者。
具有自训练功能的
域引导任务分解,用于
检测社交媒体中的个人事件
原文标题:
Domain-Guided Task Decomposition with Self-Training for Detecting Personal Events in Social Media
http://arxiv.org/abs/2004.10201Payam Karisani, Joyce C. Ho, Eugene Agichtein摘要:挖掘社交媒体内容以执行诸如检测个人经历或事件之类的任务,会遭受词汇稀疏,训练数据不足以及发明性词汇的困扰。为了减轻创建大量标记数据的负担并提高分类性能,我们建议分两个步骤执行这些任务:1.通过识别关键概念将任务分解为特定于领域的子任务,从而利用人对领域的理解;2.使用联合培训将每个关键概念的学习者结果组合在一起,以减少对带有标签的培训数据的需求。我们使用三种代表性的社交媒体挖掘任务,即个人健康提及检测,危机报告检测和药物不良反应监测,通过经验证明了我们的方法Co-Decomp的有效性和普遍性。实验表明,在可获得少量训练数据的情况下,我们的模型能够胜过最新的文本分类模型(包括那些使用最近引入的BERT模型的模型)。
活动的爆发:在线心理健康论坛
中寻求帮助和支持的时间模式
原文标题:
Bursts of Activity: Temporal Patterns of Help-Seeking and Support in Online Mental Health Forums
http://arxiv.org/abs/2004.10330Taisa Kushner, Amit Sharma摘要:近年来,社交媒体平台的兴起为那些遭受精神困扰的人提供了点对点的支持。对这些平台的影响的研究集中于短期的单岗位线程规模,或在任意时间段(数月或数年)内的长期变化。尽管很重要,但这样的任意时期并不一定会随着用户在严重困扰期间的进展而变化。使用来自心理健康平台Talklife的数据,我们发现用户活动遵循高活动期与无活动的交错期的独特模式,并提出了一种识别活动爆发和中断的方法。然后,我们展示了对突发性活动进行研究如何为在线心理健康社区中的一个关键问题提供个性化的中期分析:用户活动的哪些特征导致一些用户寻求支持和帮助,而其他用户则缺乏支持和帮助?通过使用两个独立的结果指标,即在一连串的活动中认知变化的时刻和自我报告的情绪变化,我们确定了两个可为用户改善结果的可行功能:持久性爆发以及为他人提供复杂的情感支持。我们的结果表明,考虑将爆发作为在线心理健康社区中心理社会变化的自然分析单位的价值。
原文标题:
Alleviating the recommendation bias via rank aggregation
http://arxiv.org/abs/2004.10393Qiang Dong, Quan Yuan, Yang-Bo Shi摘要:推荐系统的主要目标通常被称为“帮助用户找到相关项目”,因此提出了许多推荐算法。然而,这些面向准确性的方法通常遭受对流行商品的推荐偏见的问题,不仅用户而且商品提供商也不欢迎这种偏爱。为了缓解推荐偏差问题,我们针对现有算法的推荐结果提出了通用的排名汇总框架,该框架将面向用户和面向项目的排名结果线性地聚合在一起,并控制后一个排名过程的权重。在两个真实世界的数据集上的典型算法的实验结果表明,该框架可有效地提高任何现有的面向精度算法的推荐公平性,同时避免明显的精度损失。
原文标题:
Anger makes fake news viral online
http://arxiv.org/abs/2004.10399Yuwei Chuai, Jichang Zhao摘要:虚假新闻操纵着政治选举,罢工金融体系甚至煽动骚乱,比网上的真实新闻更具有病毒性,从而导致社会不稳定和民主制度不稳。人们发现,假新闻在网上更容易传染,可以用其引起的更多愤怒来解释。离线问卷进一步显示,愤怒导致更多的焦虑者受到焦虑管理和信息共享的激励,因此,假新闻比在线真实新闻更具感染力。我们的结果表明,在分析在线信息传播时,应综合考虑情绪的数字传染,尤其是愤怒。诸如在社交媒体中标记愤怒之类的治愈方法可能会在一开始就受到启发,以减慢速度或防止假新闻的蔓延。
原文标题:
Inferring Degrees from Incomplete Networks and Nonlinear Dynamics
http://arxiv.org/abs/2004.10546Chunheng Jiang, Jianxi Gao, Malik Magdon-Ismail摘要:从观察到的数据中推断复杂网络的拓扑特征对于了解从Internet和Internet到生物网络和社会网络的网络系统的动态行为至关重要。先前的研究通常集中在基于结构的估计上,以推断网络的大小,程度分布,平均程度等。很少的努力尝试从采样的诱导图中估计每个顶点的特定程度,这使我们无法测量蛋白质网络中节点的杀伤力和社会网络中的影响者。对于微小的采样诱导图,当前的方法会大大失败,并且需要特定的采样方法和较大的样本量。这些方法忽略了表示网络系统动力学行为的顶点状态信息,例如物种的生物量或基因的表达,这对于程度估计非常有用。我们通过开发一个使用采样拓扑和顶点状态信息来推断单个顶点度的框架来填补这一空白。我们将平均场理论与组合优化相结合,以学习顶点度。在具有各种动态性的真实网络上的实验结果表明,我们的框架可以产生可靠的程度估计,并通过用我们的估计程度替换采样的程度来显著改善现有的链路预测方法。
社交媒体数据在城市规划中的
潜力:巴西库里提巴啤酒街的发现
原文标题:
On the Potential of Social Media Data in Urban Planning: Findings from the Beer Street in Curitiba, Brazil
http://arxiv.org/abs/2004.10590Ville Santala, Giovane Costa, Luiz Celso Gomes-Jr, Tatiana Gadda, Thiago H. Silva摘要:社交媒体为各种类型的分析提供了大量数据。城市有机会探索这一新的数据源,以研究城市动态并补充用于城市规划的传统数据。我们在巴西库里提巴的城市规划背景下调查了Untappd社交媒体数据。我们分析了市政当局最近宣布的创建精酿啤酒街的项目,以促进库里提巴的当地啤酒发展,以研究探索社交媒体数据以支持该项目计划的潜力。我们的结果表明,社交媒体数据可能有助于指导啤酒街的创建决策,并有可能成为战略性城市规划工具。
原文标题:
ktrain: A Low-Code Library for Augmented Machine Learning
http://arxiv.org/abs/2004.10703摘要:我们介绍了ktrain,这是一个低代码的Python库,可让机器学习更易于访问且更易于应用。作为TensorFlow和许多其他库(例如,变压器,scikit-learn,stellargraph)的包装,它旨在使复杂的,先进的机器学习模型易于构建,训练,检查和部署初学者和经验丰富的从业者。以支持文本数据(例如,文本分类,序列标记,开放域问答),视觉数据(例如,图像分类)和图数据(例如,节点分类,链路预测)的模块为特色,ktrain提供了一个简单的方法统一的界面,使人们能够以最少的三到四个“命令”或代码行快速解决各种各样的任务。声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!