其他
在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说,在广袤的知识森林中,系统梳理脉络,才能更好地把握趋势。为此,我们精选国内外优秀的综述文章,开辟“综述专栏”,敬请关注。来源:专知地址:https://arxiv.org/pdf/2209.14930v1.pdf图被广泛用于复杂系统的建模,检测图中的异常是复杂系统分析中的一项重要任务。图异常是指图中的模式不符合图的属性和/或结构所期望的正常模式。近年来,图神经网络(GNNs)得到了广泛的研究,并成功地完成了节点分类、链接预测和图分类等困难的机器学习任务,这得益于在有效学习图表示中通过消息传递实现的高度表达能力。为了解决图异常检测问题,基于GNN的方法利用关于图属性(或特征)和/或结构的信息来学习对异常进行适当的评分。在这篇综述中,我们回顾了使用GNN模型检测图异常的最新进展。具体而言,我们根据图类型(即静态和动态)、异常类型(即节点、边、子图和全图)和网络架构(如图自动编码器、图卷积网络)对基于GNN的方法进行了总结。据我们所知,这次综述是第一次全面回顾基于GNN的图异常检测方法。图形是一种有效的数据结构,可以有效地表示和提取复杂的数据模式,广泛应用于社交媒体、电子商务、生物学、学术和通信等众多领域。图中表示的数据对象是相互关联的,对象通常表示为节点,它们的关系表示为节点之间的边。图的结构指的是节点如何通过单独的边相互关联,并且可以有效地表示节点之间甚至深远的关系。此外,通过使用节点和/或边的属性来增强图的结构表示,图可以在语义上得到丰富。异常检测是识别明显偏离通常观察到的模式的异常模式的过程。这是一项重要的任务,因为在各个领域的需求和应用不断增加。自从Grubbs等人[1]首次引入异常(或离群值)的概念以来,人们对异常检测进行了大量的研究。此后,随着近年来图挖掘技术的发展,图异常检测备受关注[2],[3]。图异常检测的早期工作很大程度上依赖于领域知识和统计方法,其中检测异常的特征大多是手工制作的。这种手工制作的检测任务自然非常耗时和费力。此外,真实的图通常包含大量的节点和标记有大量属性的边,因此是大规模和高维的。为了克服早期工作的局限性,最近深度学习方法在从图[4]中检测异常时受到了相当多的关注。深度学习具有非线性的多层结构,可以对大规模高维数据进行检测,并从数据中提取模式,从而获得令人满意的性能,而无需手工制作特征[5]、[6]。最近,图神经网络(GNN)通过学习图表示(例如[7],[8])中的消息传递机制具有高度的表达能力,因此被用于高效、直观地检测图中的异常。使用GNN,从图中学习和提取异常模式,即使是那些具有高度复杂结构或属性的图,也相对简单,因为GNN本身处理的图具有属性作为输入数据[9]。最先进的图异常检测方法[7]、[10]将GNN与现有的深度学习方法相结合,其中GNN捕获图的特征,而深度学习捕获其他类型的信息(如时间)。图1给出了用GNN进行图异常检测的一个例子。假设节点(A)和(C)根据节点属性被检测到异常,节点(A)和(B)根据图拓扑被检测到异常。那么,如果同时考虑节点属性和图拓扑作为异常因素,则只检测到节点(A)异常。GNN模型使我们能够通过同时检查图拓扑和节点属性来检测这种异常。在本综述中,我们概述了基于GNN的图异常检测方法,并主要从图的类型(即静态图和动态图)进行了综述。与其他调研相关的话题——图异常检测(一般)[2],[3],图像异常检测具体使用深度学习[11],[12],和一般的异常检测使用深度学习[13],[14],本调研旨在涉及的独特角度图使用GNN异常检测模型。鉴于GNN在图异常检测中的重要意义和正在进行的积极研究工作,我们相信,对这一特定主题的全面调研是及时的,对研究社区是有益的。图2为调研方法的时间轴。第三节中的调研是根据其他图异常检测调研[3]、[2]、[11]、[12]所使用的分类框架组织的。这一领域仍然是新的,尽管研究主题的分布似乎倾向于静态图中的节点异常,但已发表的方法覆盖了广泛的图(静态与动态、普通与属性)和异常类型(结构、节点、边、子图)。此外,在第四节中,我们分享了关于使用GNN进行图异常检测的几个有前途的机遇和挑战的观点。基于GNN的图异常检测A.基于GNN的静态图异常检测静态图异常检测的大部分研究都是针对节点异常,只有少数研究是针对边缘异常和子图异常。1)