在Zhou et al. (2023)这篇文章中,我们提出了一种基于深度条件生成学习进行高维时间序列马尔可夫性质的非参数检验方法。同时,它也可以被应用于马尔可夫模型的阶数选择。深度条件生成学习方法提供了一套强大的工具来灵活地学习条件概率分布,并已在诸多应用领域中使用,例如计算机视觉、图像处理和人工智能。然而,在统计学领域中,这类工具的使用和研究相对较少。我们采用这类模型以非参数的方式学习高度复杂的条件分布,并展示了相对于传统的核平滑和局部多项式回归的优势。
然而,计算(4)需要构造一个适当的估计量来估计。Chen and Hong (2012)提出使用局部多项式回归来估计。但是当的维度增加时,局部多项式回归往往表现不佳(Taylor
and Einbeck, 2013),相应的检验也可能失去相合性。现如今深度条件生成学习模型展示了估计复杂条件分布的出色能力(e.g., Kobyzev et al., 2020; Sohn et al., 2015)。这些工具可以用于估计,从而估计CCF 。然而,简单地将深度条件生成学习估计器代入到(4)中会在最终结果中引入严重的偏差,无法保证检验统计量的收敛到合理的极限分布。
在第四步中,我们计算检验统计量的临界值。在下,每个和都对应于一系列鞅差分序列的和。由于鞅差分仍然是鞅(Hamilton, 2020),根据高维鞅中心极限定理,在分布上收敛到一些高斯随机变量的最大值。这使我们能够使用Belloni and Oliveira
(2018)的高维乘法自助法来估计临界值。具体而言,我们将给定和所有的和堆叠在一起形成一个维向量,并通过以下方式估计该向量的协方差矩阵:
我们考虑了线性型VAR模型、非线性阈值模型和非线性GARCH模型,这些模型在时间序列文献中被广泛使用(e.g., Auestad and Tjøstheim, 1990; Cheng and Tong, 1992; Tschernig and Yang, 2000)。我们将我们提出的检验与两个基准检验方法进行比较,其中包括Chen and Hong (2012)的检验方法,该方法使用局部多项式回归(LPF)来估计相关系数函数(CCFs),以及Shi et al. (2020)的基于随机森林的检验方法,该方法最初用于强化学习,并经过修改和调整以适应我们的场景。
表1汇报了在显著性水平下,每个检验方法在500个重复模拟中的经验拒绝率。可以看出,当时,我们提出的检验方法有效地控制了第一类错误,并且在时有很好的效果去拒绝零假设。相反,两个基准检验方法在大样本下存在过高的第一类错误。例如,当时,Chen and Hong (2012)的检验方法在所有情况下的第一类错误超过0.09。这可能是由于局部多项式回归在多变量设置中在更高维度下容易出现问题(Taylor and Einbeck, 2013)。而Shi et al. (2020)的检验方法在应用于多元ARCH模型时存在相当大的第一类错误。这可能是因为他们的检验方法并不是针对时间序列数据设计的。
表 1: 在显著性水平为的情况下,当零假设被拒绝时,在500个数据复制中的比例。在所有示例中,马尔可夫模型的真实阶数为。我们比较了三种方法:我们提出的检验方法(MDN),Shi et al. (2020)的方法(RF)和Chen and Hong (2012)的方法(LPF)。
真实数据分析
我们将我们的方法运用于三个数据集:温度数据集(Chang et al., 2018),PM2.5数据集(Chang et al., 2018),以及糖尿病数据集(Marling and Bunescu, 2018)。表2展示了不同检验方法相应的-值。对于温度和PM2.5数据集,我们的检验表明马尔科夫性质成立。这个结果与文献中的研究结果一致,因为一个一阶的简单向量自回归模型足以对这些高维数据集进行建模(Chang et al., 2018)。对于糖尿病数据,检验结果表明马尔科夫模型的阶数为4,这与 Shi et al. (2020)的研究结果一致。相比之下,Chen and Hong (2012)的检验方法对于糖尿病数据集上在时的-值数值较大,而在时-值却很小。此外,Shi et al. (2020)的检验方法倾向于在温度数据集和PM2.5数据集上选择较大的值。
表 2: 以下是三个数据集(温度数据集、PM2.5数据集和糖尿病数据集)在下的顺序检验的-值,这里使用了三种方法:我们提出的检验方法(MDN),Shi et al. (2020)的方法(RF)和Chen and Hong(2012)的方法(LPF)。
参考文献
Auestad, B. and Tjøstheim, D. (1990), “Identification of Nonlinear Time Series: First Order Characterization and Order Determination,” Biometrika.
Belloni, A. and Oliveira, R. I. (2018), “A high dimensional Central Limit Theorem for martingales, with applications to context tree models,” arXiv preprint arXiv:1809.02741.
Chang, J., Guo, B., and Yao, Q. (2018), “Principal component analysis for second-order stationary vector time series,” The Annals of Statistics, 2094–2124.
Chen, B. and Hong, Y. (2012), “Testing for the Markov property in time series,” Econometric
Theory, 28, 130–178.
Cheng, B. and Tong, H. (1992), “On Consistent Nonparametric Order Determination and
Chaos,” Journal of the Royal Statistical Society: Series B (Methodological), 427–449.
Hamilton, J. D. (2020), Time series analysis, Princeton university press.
Kobyzev, I., Prince, S., and Brubaker, M. (2020), “Normalizing flows: An introduction and review of current methods,” IEEE Transactions on Pattern Analysis and Machine Intelligence.
Marling, C. and Bunescu, R. C. (2018), “The OhioT1DM dataset for blood glucose level prediction,” in KHD@ IJCAI.
Shi, C., Wan, R., Song, R., Lu, W., and Leng, L. (2020), “Does the Markov Decision Process
Fit the Data: Testing for the Markov Property in Sequential Decision Making,” in ThirtySeventh International Conference on Machine Learning.
Sohn, K., Lee, H., and Yan, X. (2015), “Learning structured output representation using deep
conditional generative models,” Advances in neural information processing systems, 3483–
3491.
Taylor, J. and Einbeck, J. (2013), “Challenging the curse of dimensionality in multivariate local
linear regression,” Computational Statistics, 28, 955–976.
Tschernig, R. and Yang, L. (2000), “Nonparametric Lag Selection for Time Series,” Journal of
Time Series Analysis.
Zhou, Y., Shi, C., Li, L., and Yao, Q. (2023), “Testing for the Markov Property in Time
Series via Deep Conditional Generative Learning,” J. R. Stat. Soc. Ser. B. Stat. Methodol.,
accepted.