时间序列分析中数据的平稳性判定研究
时间序列的平稳性判定是时间序列分析预测的关键技术,为了根据数据特征提供更为可靠合理的平稳性判定方法, 从数据平稳条件入手比较分析了时间路径图、自相关函数、DF检测和ADF检测四种方法的数学原理。以股票数据为应用背景, 采用EViews工具对时间序列的平稳性判定进行了实验仿真和对比分析, 得出对于复杂的时间序列多种检测方法综合检验更为可靠的结论, 为随机过程中数据分析预测的进一步研究提供数据预处理的技术参考。(来源:现代电子技术,作者:范涛涛、寇艳廷、刘晨、阎红灿)
引言
在自然现象和经济现象中, 人们为了探索某些事物或系统的运行规律, 需要观测所要研究的某种现象, 从而得到一定顺序的数据资料, 通过分析这些数据资料, 对事物或系统的未来发展进行预测或控制, 这种方法称为时间序列分析。时间序列分析[1]是对有序的随机数据 (信号) 处理的一种方法, 它的出发点是承认数据的有序性和相关性, 通过数据内部的相互关系来辨识系统的变化规律。
时间序列分析是定量预测方法之一, 其基本原理如下:一是承认事物发展的延续性, 应用过去数据, 就能推测事物的发展趋势;二是考虑到事物发展的随机性。进行数据平稳性检验的原因是:如果随机过程是非平稳的, 则用一个简单的代数模型来反映时间序列的过去和未来通常十分困难。所以对时间序列分析时通常要求时间序列是平稳的。但是在现实经济生活中, 情况往往是实际的时间序列数据是非平稳的, 而且主要的经济变量如消费、价格、收盘价往往表现为一致的上升或下降。
这样, 仍然通过经典的因果关系模型进行分析, 一般不会得到有意义的结果。所以, 时间序列分析中首先遇到的问题就是时间序列的平稳性判定问题。只有判定时间序列的平稳性, 将非平稳时间序列转化成平稳时间序列, 才能进一步对序列进行预测研究。
本文通过分析时间序列的平稳条件, 系统分析了常用的四种判定方法的数学原理, 并以股票数据为实验背景, 通过EViews工具对比研究了四种判定方法的实用性。
1 时间序列的概念及平稳性条件
时间序列是指同一种现象在不同时间上的相继观察值排列而成的一组数字序列。时间序列分析是一种动态数据处理的统计方法, 该方法基于随机过程理论和数据变动存在规律性与不规则数理统计学方法, 研究随机数据序列所遵从的统计规律, 用于解决实际问题。
1.1 时间序列的特征
时间序列中的每个观察值大小, 是影响变化的各种不同因素在同一时刻发生作用的综合结果。从这些影响因素发生作用的大小和方向变化的时间特性来看, 这些因素造成的时间序列数据的变动分为四种类型[1-2]:
(1) 趋势性:某个变量随着时间进展或自变量变化, 呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向, 但变动幅度可能不相等。
(2) 周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
(3) 随机性:个别为随机变动, 整体呈统计规律。
(4) 综合性:实际变化情况是几种变动的叠加或组合。
1.2 时间序列平稳的条件 如果时间序列{X:t N}满足:
(1) 对任何t∈N, E (Xt) =μ是与时间t无关的常数;
(2) 对任何t∈N, Var (Xt) =s2是与时间t无关的常数;
(3) 对任何t, k∈N, Cov (Xt, Xt+k) =gk是只与时期间隔k有关, 与时间t无关的常数。 则称该随机时间序列是平稳的, 而该随机过程是一平稳随机过程[3]。 在时间序列分析中用于数据平稳性判定的方法很多, 但其基本原理都遵从此定义, 下面就时间路径图检验、自相关函数检验、DF检验和ADF检验四种常用方法分析其数学原理, 并给出实例检测过程。
2 时间序列平稳性判断的理论分析
从时间序列的平稳性条件可以看出, 条件 (1) 与时间序列的均值有关, 条件 (2) 与时间序列的方差有关, 条件 (3) 与时间序列的协方差有关, 只有三个条件均满足才能确定时间序列是平稳的, 只要有一个条件不满足说明数据不平稳, 但要具体描述数据的不平稳特性, 对于不同的数据要采取不同的判定方法, 以便于进一步分析处理数据。
2.1 时序图检验
根据平稳时间序列均值、方差为常数的性质, 平稳序列的时序图应该显示出序列始终在一个常数值附近随机波动, 而且波动的范围有界、无明显趋势及周期特征。一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程;而非平稳序列则往往表现出在不同时间段具有不同的均值 (如持续上升或持续下降) 。 由于此方法只依据序列的均值、方差进行判断, 而没有考虑它的协方差, 故这种方法虽然简单容易操作, 但准确性不能保证。
2.2 自相关图检验
不同时间序列具有不同形式的自相关函数, 因此可以从时间序列自相关函数的图形来判断时间序列的稳定性, 但是, 自相关函数是纯理论性的, 对它所刻画的随机过程, 通常只能得到有限个观测值。一般地, 由样本数据计算出样本自相关函数
当k逐渐增大时, 迅速衰减, 则认为该序列是平稳的;如果它衰减非常缓慢, 则认为该序列是非平稳的。自相关分析法是进行时间序列分析的有效方法, 它简单易行、较为直观, 但计算量比较大。
对时间序列的平稳性除了通过图形直观判断外, 运用统计量进行统计检验则是更为准确与重要的。
2.3 DF检验
DF检验全称为迪基-富勒 (Dickey-Fuller) 检验法[4-6], 因迪基和富勒提出而得名, 是统计检验中普遍应用的一种检验方法。因为随机游走序列Xt=Xt-1+mt是非平稳的, 其中mt是白噪声。而该序列可看成是随机模型Xt=rXt-1+mt中参数r=1时的情形。也就是说, 对式Xt=rXt-1+mt做回归, 如果确实发现r=1, 就说随机变量Xt有一个单位根。上式可变形式成差分形式:ΔXt= (1-r) Xt-1+mt=dXt-1+mt是否存在单位根r=1, 也可判断是否有d=0。因此, 针对式ΔXt=a+dXt-1+mt检验为:零假设H0:d=0, 则序列非平稳;备择假设H1:d<0, 则序列平稳。
2.4 ADF检验
ADF检验[7-9]假定扰动项独立同分布, 但扰动项事实上多序列相关, 此时检验结果就会失效。但是, 如果放宽扰动项条件, 引入滞后差分项, 就可使扰动项服从独立同分布过程。为了保证DF检验中随机误差项的白噪声特性, Dicky和Fuller对ADF检验进行了扩充, 形成了ADF (Augment Dickey-Fuller) 检验。
检验的假设都是针对H1:d<0, 检验H0:d=0, 即存在一单位根。 模型1与另外两模型的差别在于是否包含有常数项和趋势项。同时估计出上述三个模型的适当形式, 然后通过ADF临界值表检验零假设H0:d=0。
(1) 只要其中有一个模型的检验结果拒绝了零假设, 就可以认为时间序列是平稳的;
(2) 当三个模型的检验结果都不能拒绝零假设时, 则认为时间序列是非平稳的。
3、 时间序列的平稳性判定实验仿真
EViews是一组处理时间序列数据的有效工具, 提供基于Windows平台的复杂的数据分析、回归及预测工具, 通过EViews能够快速从数据中得到统计关系, 并根据这些统计关系进行预测。 EViews在系统数据分析和评价、金融分析、宏观经济预测、模拟、销售预测及成本分析等领域中有着广泛的应用。本文利用EViews软件判定部分中国石化股票的收盘价序列是否平稳。
3.1 利用散点图判断平稳性
利用样本数据做散点图如图1所示, 由图形粗略判断数据是非平稳的。
图1 20天股票收盘价折线图
3.2 利用样本自相关函数判断稳定性
利用样本数据作自相关函数图形如图2所示。
图2 自相关函数图形
从图2中可以看出, 自相关函数随着k的增加, 衰减缓慢, 不是在零周围波动, 说明数据序列是非平稳的。
3.3 DF检验
单位根统计量ADF=-1.457 465都大于EViews给出的显著性水平1%~10%的ADF临界值, 所以接受原假设, 该序列是非平稳的, 如图3所示。
图3 DF检验结果
3.4 ADF检验
单位根统计量ADF=-3.098 119都大于ADF检验1%~10%的各种显著水平ADF临界值, 不能拒绝原假设, 即有单位根, 所以该序列是非平稳的, 见图4。
图4 ADF检验结果
4、 结 语
时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。时间序列平稳性的研究对于经济统计预测有一定的实用价值。本文讨论的四种检测方法中, 时间路径图和自相关函数是从数据平稳性定义出发进行检测的, 而DF检测和ADF检测是将问题转化为已知随机游走序列来判断的。实际检验时, 有必要根据数据特征选取合适的方法。若数据特征未知, 最好使用多种方法进行检验, 并对不同形式的检验结果进行比较和统一, 以求得到相对可靠、合理的结论。
5、参考文献
[1][美]克莱尔.时间序列分析及应用[M].潘红宇, 译.2版.北京:机械工业出版社, 2011.
[2]吴怀宇.时间序列分析与综合[M].武汉:武汉大学出版社, 2004.
[3]王燕.应用时间序列分析[M].北京:中国人民大学出版社, 2005.
[4]张果, 谭敏琦.时间序列平稳性的检验[J].导航, 2005 (2) :82-86.
[5]吕光明.对数据平稳性检验方法的比较研究[J].财经问题研究, 2004 (6) :77-80.
[6]管河山, 邹清明, 邓灵斌.时间序列平稳性分析的自动机制研究[J].南华大学学报:社会科学版, 2010 (3) :41-44.
[7]苏召学.时间序列变点的统计推断[J].山东建筑工程学院学报, 1996 (4) :85-88.
[8]莫达隆.利用ADF对时间序列进行建模[J].时代金融, 2010 (4) :46-47.
[9]吴翊, 易东云.测量误差平稳性检验的数据预处理研究[J].国防科技大学学报, 1996 (2) :130-134.
[10]左爱文, 郭宏武, 王保保.气象时间序列规则发现及其应用[J].陕西气象, 2006 (6) :8-11.