因果发现最新进展及其在复杂系统中实践的探讨
摘要
在处理时序数据的因果关系时,检测两个变量之间的因果关系通常采用格兰杰因果关系。霍克斯过程是一种能描述复杂系统的点过程,广泛应用于社交网络分析、生物信息学、金融分析等多个领域。目前,在霍克斯过程中发现格兰杰因果关系是因果推断的重要研究内容,日益受到关注。本文分析当前因果推断技术的最新研究进展以及其应用于复杂故障诊断系统的工程实践,希望为致力于复杂系统中的因果发现的工程实践者提供一定的技术借鉴和参考。
在处理时序数据的因果关系时,检测两个变量之间的因果关系通常采用格兰杰因果关系(Granger causality)。霍克斯过程(Hawkes process)是一种能描述复杂系统的点过程,广泛应用于社交网络分析、生物信息学、金融分析等多个领域。目前,在霍克斯过程中发现格兰杰因果关系是因果推断的重要研究内容,日益受到关注。
本文分析了当前因果推断技术的最新进展以及其应用于复杂系统中的故障诊断系统的工程实践。本文首先探讨了霍克斯过程及文[1]在多变量霍克斯过程中引入拓扑结构的设计思路和方法,其次,将之与同样用于连续时间因果关系建模的连续贝叶斯模型[2]进行对比,最后探讨了文[1]方法在工程实践上可能遇到的问题和挑战。本文希望借此探讨为致力于复杂系统中的因果发现的工程实践者提供一定的技术借鉴和参考。
霍克斯过程是一种强度函数值依赖于历史事件的自激励点过程,其特征是其历史事件的影响以时间累加的形式进行。在霍克斯过程中一个重要的概念就是条件强度函数
作为点过程的变体,霍克斯过程也继承了点过程的基本语义。比如,图2中的随机变量
同时,截止到时间
标准霍克斯过程表示只有事件之间存在相互影响,事件并不受其他因素影响。这种假设没有考虑事件发生的物理结构,这往往会造成模型训练得到虚假、错误的因果关系。比如,假设现有三种事件类型
在文献[1]中,模型训练主要采用了EM(Expectation Maximization)迭代算法来评估最好的模型参数,其主要思想是从没有任何连边的空图和随机参数开始,然后在当前最优图结构上进行一次的边增加、删除、reverse操作,得到当前图的邻居图。然后在这些邻居图中根据模型的似然值 (Likelihood)找到比当前图更优的图,直到找不到为止,具体算法可参见[1]。
值得注意的是,该训练方法中由于使用了EM算法,也无可避免地具备EM迭代优化方法的计算属性。首先,EM算法可以保证收敛到一个稳定点,但是却不能保证收敛到全局的极大值,因此是局部最优算法。这跟算法的初始值有关,因此为确保结果的准确性和稳定性,运行时可以设置多个初始值。当然,当优化目标是凸函数时,可以保证收敛到全局最大值,这与梯度下降的迭代算法相同。由于是迭代优化算法,训练时间与效果往往跟实际经验相关,比如,超参数中迭代次数决定了运行时间,核函数中的衰减系数决定了算法效果,这也说明了工程能力或者说调参能力在算法实践中的巨大作用。此外,该训练方法与事件类型数量成平方阶关系,与EM的迭代次数一起,对计算成本提出了更大的需求。
作为霍克斯过程的演变模型,TTPM也只关注事件发生的时间点,而不管事件的持续时间,即事件间隔时间
同时,在复杂故障系统中,找出根故障节点可以为排除其他故障提供了解决方向。比如,系统中的两个警报器 A、B,如果警报器B是警报器A导致的,在解除了故障A多久之后故障B会自动解除?对于这样的问题,TTPM就不能很好解决。
当然,TTPM算法的性能严重依赖于BIC(Bayesian information criterion)惩罚因子、核函数中的衰减因子
由于水平有限,文中存在不足的地方,请各位读者批评指正,也欢迎大家参与我们的讨论。
[1] Cai, Ruichu/ Wu, Siyu / Qiao, Jie / Hao, Zhifeng / Zhang, Keli / Zhang, Xi THP: Topological Hawkes Processes for Learning Granger Causality on EventSequences 2021
[2] Nodelman, Uri, Christian R. Shelton, and Daphne Koller. "Continuous time Bayesian networks." arXiv preprint arXiv:1301.0591 (2012).
[3] Rizoiu, Marian-Andrei, et al. "A tutorial on hawkes processes for events in social media." arXiv preprintarXiv: 1708.06401 (2017).
[4] https://competition.huaweicloud.com/information/1000041487/introduction
往期推荐
壁仞科技研究院作为壁仞科技的前沿研究部门,旨在研究新型智能计算系统的关键技术,重点关注新型架构,先进编译技术和设计方法学,并将逐渐拓展研究方向,探索未来智能系统的各种可能。壁仞科技研究院秉持开放的原则,将积极投入各类产学研合作并参与开源社区的建设,为相关领域的技术进步做出自己的贡献。