浅析华尔街数据分析利器:时间序列分析
验“金”室
文 / 中国工商银行云计算实验室 谢伟
简要来说,时间序列分析是一种用于处理时间序列数据或进行趋势分析的统计技术,其目的是通过建模产生可观察时间序列的随机机制,并基于该序列以及其他相关序列的历史趋势,来预测类似条件下的未来数据。当前,时间序列分析已被广泛应用于模式识别、计量经济学、金融学、天气预报等应用科学与工程学领域。
一
时间序列(Time Series)是什么?
通常来讲,时间序列是指按时间顺序索引的一系列数据点,其中最常见的方式是在连续、等间隔的时间点上获取序列。因此,它也可看作是一系列离散时间的数据集,如下图所示。
▲全球陆地海洋气温指数(1880-2019)
(来源:climate.nasa.gov)
由上图可见,全球气温从1910年之后不断攀升,并且近半个世纪以来呈现加剧上升的趋势。基于该时间序列,科学家将可以应用数学模型来预测未来十年甚至几十年的全球气温变化,进而帮助政府制定法律法规、引导科技发展或敦促民众改变生活习惯,以更好地应对全球气候变暖。
二
时间序列有什么特征?
时间序列的典型特征主要包括趋势、季节变动、循环波动和不规则波动等四种类型,但这些特征并不是每个序列都有。其中,趋势是指时间序列在长时期内呈现持续向上或向下的变动。季节变动是指时间序列在一年内重复出现的周期性波动,其受到诸如气候条件、生产条件、节假日或风俗习惯等多种因素的影响。循环波动是指时间序列出现非固定长度的周期性变动,但与趋势不同,它并非朝着单一方向持续变动,而是呈现出涨落相同的交替波动。
▲时间序列不同特征的四个示例(来源[6])
此外,不规则波动是指时间序列中除去趋势、季节变动和循环波动之后的随机波动,其通常是夹杂在时间序列中产生一种波浪形或震荡式的变动,但若是只含有随机波动的序列也被称为平稳序列(比如白噪声),如下图所示。
▲不规则波动--白噪声(来源[6])
三
时间序列分析要解决什么问题?
数千年来,预测未来一直都强烈吸引着人们的热情和关注,即便是如今,也有许多情况需要提前预测。例如,要决定是否在未来五年内建立另一个发电厂,即需要提前预测未来的用电需求量;要决定下周呼叫中心的人员日程安排,即需要对呼叫量进行预测;要调整库存存货,也需要对库存需求进行预测。当然,预测可能是会提前几年(如资本投资),也可能仅仅提前几分钟(如电信线路),一些历史数据乍看起来比较随机(比如天气变化、股市波动),但基于时间序列分析,人们将可以从历史数据中提取出有意义的统计信息和数据特征,进而比较科学地进行预测,以满足生产生活需要。
四
怎么做时间序列分析?
通常,在应用数学模型进行时间序列分析前,需要为时间序列建立一个合适的数学模型,常规的建模过程主要有以下三个步骤,但每个步骤都可能会执行多次,直到找到理想模型为止。
1.指定模型
指定模型是指挑选一个或多个适合观察的时间序列组成模型,用于观察时间序列的整体趋势,以及应用不同主题的相关知识(如生物学或商业知识等),从不同维度计算出所需的统计数据。但需要强调的是,此时选择的模型大多是暂时的,需要在稍后的分析中进行修订。
2.适配模型
一般而言,数学模型将不可避免地涉及一个或多个参数,其数值必须根据观察到的序列进行评估,而适配模型主要用于寻找给定模型中未知参数的最佳估值,常用做法包括最小二乘法或最大似然估计等。
3.检验模型
检验模型主要用于评估已指定并适配的模型的质量,包括模型对数据的拟合程度如何,模型的假设是否合理地满足等。如果没有发现不足之处,则可以确定已经完成建模,并且可以应用该模型,例如预测未来数据。否则,即需要根据不足之处选择其他模型,或是重新指定模型。
五
有没有通用的数学模型?
目前,业界用于时间序列分析的模型主要是自回归条件异方差模型(AutoRegressive Conditional Heteroskedasticity ,ARCH)和差分自回归移动平均模型(AutoRegressive Integrated Moving Average,ARIMA)。
其中,ARCH是获得2003年诺贝尔经济学奖的计量经济学成果之一。实践中,ARCH模型能准确地模拟时间序列变量的波动性变化,从而使人们更加准确地把握风险波动,因此其被广泛应用于金融工程学的实证研究当中,尤其在风险价值(Value at Risk)方面,更是成为华尔街人尽皆知的工具。
与之相比,ARIMA模型提供了另一种时间序列的预测方法,旨在描绘数据的自回归性(AutoCorrelations)。
除此之外,还有一些场景会应用比较复杂的模型,比如GARCH、长记忆随机波动率(LMSV)模型等。
六
总结
大数据时代,作为金融科技领域的从业人员,研究掌握时间序列分析理论和技术,将有助于从大量的金融业务场景中挖掘数据价值,进而持续提升业务价值。例如:
在普惠金融信贷领域,一方面,可预测中小企业在不同时期的融资需求,并适时储备合理的贷款资金;另一方面,也可用于预测坏账率,以提前做好风控准备,安排不良处置。
在IT运维领域,则可基于历史数据来分析预测业务访问流量,比如在双“十一”或春节期间,即可用其来预测是否需要提前扩容适量的网络设备和服务器,以应对流量高峰,提升客户体验。
在量化交易领域,更是可以用来精准预测金融市场趋势,以最大化利润、最小化损失。
总体而言,在金融科技行业,时间序列分析大有可为。
更多精彩内容
绘声绘色,识你懂你——表情识别智能迎宾赋能网点智慧营销
解读银行“RPA+AI”创新应用价值
如何解决边缘推理中那些异构的“坎”
浅析音视频智能分析在金融行业的应用
以小窥大,从视频考勤看边缘智能
FCC30+
长按左边二维码
关注我们不迷路