首页 > 范文大全 > 正文

基于ARIMA模型的伦敦金银市场协会黄金定价的异常值检测及检验

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于ARIMA模型的伦敦金银市场协会黄金定价的异常值检测及检验范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】采用Chang等人[1]提出的基于arima模型的异常值检测理论,利用GARCH模型与ARMA模型之间的联系,对通常服从GARCH模型的金融序列完成了ARMA模型框架下的异常值检测,并结合历史事件对检测结果做了解释和检验。在说明了GARCH模型转换为ARMA模型的理论依据和可操作性后,对收益率一次性拟合了ARMA模型,模型侦测到的异常值在实际情况中都有着较为显著的事实与之对应,表现了较高的效度和可信度。其较为简明的理论基础和方便的实践分析也具有一定的操作简便性。

【关键词】异常值;GARCH模型;ARMA模型;收益率

一、介绍

金融领域的时间序列作为一种观测研究(observational studies)得到的数据记录,其变量是不受研究者控制的,因此一些突发的意料外的事件往往会造成观测值的异常,并且这种异常不是误差,无法避免并且客观存在。因此,对异常值进行检测并拟合,或是消除其影响是正确识别及建立时间序列模型并对其加以分析的重要步骤。在Fox[2],Tsay[3]等人的研究基础上,Chang等人[1]基于ARIMA模型的异常值检测,并把异常值分为了2类,可加异常值(additive outlier,AO)和新息异常值(innovational outliers,IO)。随着异常值理论的发展,更多的异常值模型及检测方法被提了出来。Chen[4]针对双线性时间序列(bilinear time series)提出了采用Gibbs抽样的AO检测方法;Grané等人[5]针对波动模型(即对波动建模的序列,如GARCH模型族)提出了基于小波的检测方法。

本文采用[1]提出的较为简便方法,对序列进行了建模并找出了异常值。在对异常值解释中,这一方法的有效性得到了证实,检测出的几个显著的异常值点都对应着较为重要的新闻事件。这一方法的简便性使得使用它不需要太高深的统计学知识,并且易于用软件实现。

本文采用的数据是伦敦金银市场协会(London Bullion Market Association,LBMA)的黄金定价,之所以没有用股指数据是考虑到分析的时间跨度包含了金融危机,而作者的其他相关研究表明这段时间,以标准普尔500指数(Standard & Poor’s 500 index,S&P 500)为例,危机使得股指波动过于剧烈,模型拟合效果并不好,尽管异常值检测结果仍比较合理,但基于不恰当拟合的模型得到的结果作者认为还是缺乏说服力的。因此这里采用了相较于股指更稳定的金价来做分析。

二、模型拟合

对于金融序列,通常采用的建模对象是其收益率建模。收益率定义为。在有效性市场假设下,该收益率应当是没有相关性的序列[6],但这并不意味着它是白噪声。对数据进行检验可以知道,收益率的方差,也称为波动,是具有波动集群性的,可以用模型拟合,也就是Engle[7]提出的ARCH模型、Bollerslev[8]提出的GARCH模型以及后来的基于GARCH模型的各种衍生模型。进一步考虑到注意到当收益率已知时,就是的一个无偏估计量,因此可以把关于波动方差的GARCH模型

可见,如果把视为一个零均值、不相关、同分布的序列,则式(1)就是关于的模型。因此,对收益率的波动建立GARCH模型的阶数,就可以得到收益率所对应的ARMA模型阶数。但这里我们并没有按照式(1)以及对波动建立的GARCH模型直接求得收益率的ARMA模型,因为考虑到每一次模型拟合都会有残差和误差,也就是会丢失信息。因此利用GARCH模型确定阶数后,我们直接对收益率平方建立ARMA模型,并以此模型作为异常值检测的基础。

收益率的自相关函数和偏自相关函数都呈现出了白噪声的特点,这正符合市场有效性假设。而用于检验异方差性的McLeod-Li检验却表明第二次残差序列具有显著的异方差性,说明波动之间是可能存在相关关系的,因此由二阶矩方差的启示,把数据先平方再做相关性检验。异方差性也暗示了平方后的收益率应该具有自相关性。但这里的实证结果以及Shin & King[10]表示,高阶矩可能导致样本的函数值波动较大,从而体现在模型识别上就是模式不明晰.因此采用收益率的绝对值来进行模型识别.可以发现,收益率绝对值的自相关函数和偏自相关函数都拖尾。对于这种情形,这里采用Tsay & Tiao(1984)[11]的扩展自相关函数(extended autocorrelation function,EACF)法来给模型定阶[9]。表1给出了收益率绝对值的扩展自相关函数。

三、异常值检测

所谓异常值,就是指一些不符合整体数据所具有的规律的观测值。在排除由于测量或观测误差导致的可能性外(一般金融数据是不会有这种误差的),多是由于在异常值所在的时间参数取值上放生了突发的短期性变化,而非能够根本上改变数据分布特性的长期性变化。对时间序列来说,异常值通常有2种——可加异常值和新息异常值[1][2][3]。

可加异常值即基础过程(未受干扰过程)在时刻受到了扰动,使得该时间点的数值出现偏移,即,其中代表原始的、未受干扰的过程,为干扰值,为脉冲函数:

可见,可加异常值对于原始序列的影响仅仅存在于这一个时间点上。

新息异常值则是新息(误差)受到了扰动,即,其中为白噪声。为了说明新息异常值对原始序列的影响,我们把原始序列改写为的形式,那么受扰动的过程则可写作

其中。可见,即使时间已经过了发生扰动的时间点,时刻产生的新息异常值仍然会对序列此后的所有观测值产生影响。

识别一个观测值是IO还是AO,可以分别用统计量:

后的系数。通过对每个观测值计算该统计量,得到经验分布后再按一定的显著性水平判断一个观测值是否异常。这里采用了5%的显著性水平,AO、IO各得到22个,绝大部分所对应的观测点都相同,如表5所示。

对于表5中的异常值,作者选取了大于10的(第561、660、663、686、733个观测值)较大的几个,所对应的时间节点分别绘制在收益率图和估计的条件方差图中,如图1、图2所示。