首页 > 范文大全 > 正文

ARIMA模型在社会消费品零售总额预测中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇ARIMA模型在社会消费品零售总额预测中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

[摘要] 运用时间序列分析方法之一的单整自回归移动平均模型(arima)法,对中国社会消费品零售总额进行时间序列分析。分析显示,ARIMA模型可以提供比较准确的短期预测效果,可以为中国社会消费品零售总额预测提供一定的依据。

[关键词] ARIMA 时间序列 社会消费品零售总额

一、问题的提出

中国社会消费品零售总额是指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。这个指标反映通过各种商品流通渠道向居民和社会集团供应生活消费品来满足他们生活需要的情况,是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。由于目前消费需求已经成为经济增长的重要组成部分,而且今年来社会消费品零售总额呈现递增的趋势,如何利用适当的模型对其进行分析和预测,并通过预测的结果了解中国社会消费品零售总额的发展态势,为有关部门做出正确的决策提供合理的依据,已经成为一个需要我们进行探讨和解决的迫切问题。

二、研究方法

ARIMA模型的建模思想。时间序列分析方法是伯克斯・詹金斯(Box-Jenkins1)在1970年提出来的。这种建模方法不考虑以经济理论为依据的解释变量的作用,而是依据变量本身的变化规律,利用外推机制描述时间序列的变化。模型建立的前提是时间序列必须具有平稳性。如果时间序列是非平稳的,建立模型之前应先把它变换成平稳的,同时仍保持原时间序列的随机性。时间序列的基本模型主要有三种:自回归模型、移动平均模型及单整自回归移动平均模型。

单整是指将一个时间序列由非平稳性变为平稳性所要经过的差分的次数,这是对非平稳时间序列进行时间序列分析的必经步骤。假设一个随机过程含有d个单位根,其经过d次差分之后可以变换为一个平稳的自回归移动平均过程。则该随机过程称为单整自回归移动平均过程。模型中AR称为自回归分量,P为自回归分量的阶数;MA为移动平均分量,q为移动平均分量的阶数;I为差分,d为使时间序列具有平稳性所需要的差分次数。

1.自回归过程(AR(P)),是指一个过程的当前值是过去值的线性函数,如:如果当前观测值仅与上期(滞后一期)的观测值存在线性函数的关系,则我们就说这是一阶自回归过程,记作AR(1)。推而广之,如果当前值与滞后P期的观测值有线性关系则称:P阶自回归过程,记作AR(P)。其一般表达式为:

。其中,i=1,…p是自回归参数,ut是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相加而成。

2.移动平均过程(MA(q)),如果一个线性随机过程可用下式表达:xt=ut+θ1ut-1+θ2ut-2+…θqut-q=(1+θ1L+θ2L2+…θ2Lq)ut=(L)ut。

其中θ1,θ2,…θp是回归参数,ut为白噪声过程,则上式称为q阶移动平均过程,记为MA(q)。之所以称“移动平均”,是因为xt是由q+1个ut和ut滞后项的加权和构造而成,“移动”指t的变化,“平均”指加权和。

3.ARIMA(p,d,q)模型的一般表达式为:

,即

或Φ(L)=(L)ut。

ARMA(p,q)过程的平稳性只依赖于其自回归部分,即Φ(L)=0的全部根取值在单位圆之外(绝对值大于1);其可逆性则只依赖于移动平均部分,即(L)=0的根取值应在单位圆之外。

在对含有季节、趋势等成分的时间序列进行ARIMA模型预测时,就不能像对纯粹的满足可解条件的ARIMA模型那么简单了,一般的ARIMA模型有多个参数,没有季节成分可以记为ARIMA(p,d,q),如果不需要利用差分来消除趋势或循环成分时,差分的阶数d=0,模型为ARIMA(p,0,q)即ARIMA(p,q);在有已知的固定周期S时,模型多了四个参数,可计为ARIMA(p,d,q)(P,D,Q)S,这里除了周期S已知之外,还有描述季节本身的ARIMA(p,d,q)的模型识别问题,在实际建模过程之中,需要反复的比较。

ARIMA(p,d,q)(P,D,Q)S模型,它的一般表达式为:

,这里的Φ,为类似于 ARIMA(p,q)模型中的算子,,θ只是描述季节序列,它们定义为:

三、模型的应用

1.时间序列的特征分析。我们将1980年1月~2005年12月的数据作为模型中时间序列的数据,将2006年以后的数据作为预测数据,来判断模型在预测方面的准确性和有效性。

第一步:通过EVIEWS绘制如图1所示的社会消费品零售总额的折线图,可以看出序列具有明显的增长趋势,并且包含周期为12个月的季节波动。同时我们对该时间序列进行ADF检验,结果显示它的ADF=1.94735,分别大于不同检验水平的三个临界值(1%-3.4521;5%,-2.87103;10%,-2.5719),因此,该时间序列是非平稳的时间序列。

第二步:对时间序列sale首先做对数处理,得到时间序列sale01,这样就消除了原始数据中的异方差性。同时,为了使非平稳的时间序列具有平稳性,我们对时间序列sale01进行一次差分。对于经济时间序列,差分次数,即模型ARIMA(p,d,q)中的参数d通常只取0,1或2,同时通过对时间序列单位根的检验来获得它的ADF值,并判断参数d的阶数。

对时间序列sale01进行单位根的检验,其ADF的检验结果显示,ADF=-1.7651分别大于不同检验水平的三个临界值(1%,-3.4512;5%,-2.8706;10%,-2.5717),时间序列接受原假设,即存在单位根的结论。我们继续对时间序列作差分处理,并对差分后的时间序列进行ADF检验,最终经过两次差分得到时间序列sale03,其检验结果显示,ADF=-18.5949分别小于不同检验水平的三个临界值(1%,-3.4512;5%,-2.8706;10%,-2.5717),二阶差分序列在1%的显著水平下拒绝原假设,接受不存在单位根的结论,因此可以确定时间序列是2阶单整序列。

第三步:对时间序列sale01经过两次差分后,我们通过EVIEWS绘制如图2所示的折线图,可以看到序列的趋势基本消除;我们从它的自相关图可以看出,当k=12或是24时,自相关系数仍然有较大的峰,说明序列含有季节性,需要进一步作季节差分。再对时间序列作周期S=12的季节差分,差分后时间序列的自相关图和偏相关图如图3所示,序列的样本的字相关系数和偏相关系数很快落入随机区域,序列趋势基本消除,但是当k=12时取值依然很大,季节性依然很明显,对其作第二次季节差分,发现季节性仍然没有完全改善,故只做一阶季节差分。

通过以上在EVIEWS中的操作分析,可得到ARIMA模型中的参数d=2,D=1。

2.根据时间序列模型的识别规则,建立相应的模型:

(1)若平稳的时间序列自相关函数托尾,而偏相关函数是截尾的,则可断定此时间序列适合AR(P)模型。

(2)若平稳的时间序列自相关函数截尾,而偏相关函数是托尾的,则可判断时间序列适合MA(Q)模型。

(3)若平稳的时间序列的字相关函数和偏相关函数都是托尾的,则时间序列适合于ARMIA(p,d,q)模型。

3.模型的识别。通过分析,我们选用ARIMA(p,d,q)(P,D,Q)S模型,其中d和D已经得出,d=2,D=1。通过观察时间序列sale04(经过两次差分和一次季节差分后的序列)的自相关图和偏自相关图,我们得出p=1、2、3或4,q=1;由图2可以看到,当k=12时,自相关系数仍有较大的峰,表明存在季节自回归和季节移动平均,我们选择P=1,Q=1。

4.进行ARIMA(p,d,q)(P,D,Q)S模型的定阶,然后对暂定的模型进行参数的估计,检验其是否有统计意义。

经过以上的分析,我们初步确定模型为ARIMA(1,2,1)(1,1,1)12,ARIMA(2,2,1)(1,1,1)12,ARIMA(3,2,1)(1,1,1)12,ARIMA(4,2,1)(1,1,1)12或ARIMA(5,2,1)(1,1,1)12,我们运用最佳准则函数定价法,即Akaike提出的Aic准则,该准则在极大似然值的基础上对模型的阶数和参数给出一组最佳估计。Aic准则是在给出不同模型的Aic计算公式的基础上,选取使Aic值最小的那一组阶数为最佳阶数。对于模型ARIMA(1,2,1)(1,1,1)12,ARIMA(2,2,1)(1,1,1)12,ARIMA(3,2,1)(1,1,1)12,ARIMA(4,2,1)(1,1,1)12和ARIMA(5,2,1)(1,1,1)12,我们通过EVIEWS软件得出它们的Aic值分别为3.2185、3.2196、3.2218、3.2226和3.2544。根据Aic准则,ARIMA(5,2,1)(1,1,1)12的AIC值小于其他ARIMA(p,d,q)(P,D,Q)S模型的 Aic值,因此我们选择模型ARIMA(1,2,1)(1,1,1)12。

5.诊断和检验。下图4是原始数据以及由ARIMA模型得到的拟合值和对2006年12个月的预测值,以及对残差的acf图和pacf图。如果时间序列模型拟合的很好的话,它的残差的acf图和pacf图应该没有任何模式,并且数值很小,那么该序列就是有一些无关的互相独立的随机变量组成。我们观察模型ARIMA(1,2,1)(1,1,1)12的残差序列 acf图和pacf图,可以看出它们没有任何模式,说明该模型拟合的比较成功。

我们应用模型ARIMA(1,2,1)(1,1,1)12来对2006年的社会消费品零售总额进行预测,并对真实值和预测值进行比较,其中2006年1月份至12月份的预测值(以下数据单位为亿元)分别为6620.1、6087.3、5857.2、5713.2、6101.4、5983.7、5981.7、6088.9、6554.4、6916.3、6978.7、7946.5;真实值分别为6641.6、6001.9、5796.7、5774.6、6175.6、6057.8、6012.2、6077.4、6553.6、6997.7、6821.7、7499.2;预测值与真实值之间的误差率分别为-0.32%、1.42%、1.04%、-1.20%、-1.22%、-0.51%、0.19%、0.01%、

-1.16%、2.30%、5.96%。

同理,我们根据模型ARIMA(1,2,1)(1,1,1)12来对2007年的社会消费品零售总额进行预测,其中2007年1月份至12月份的预测值(以下数据单位为亿元)为7771.3、7231.56977.6、6820.7、7061.3、7087.3、7080.9、7186.8、7661.5、8030.9、8089.6、9082.7,1月份至5月份的真实值分别为7488.3、7013.7、6685.8、6672.5、7157.5;1月份至5月份的预测值与真实值之间的误差率分别为3.78%、3.10%、4.36%、2.22%、-1.34%。

四、结束语

通过以上分析,我们可以看出运用ARIMA(p,d,q)(P,D,Q)S在对中国社会消费品零售额的预测中,对于2006年每月的预测之值与真实值之间的误差率都很小,随着时间跨度的增加,该模型的预测值与真实值之间的误差率逐渐增大。

从短期来看,ARIMA模型在社会消费品零售额的预测上具有一定的可信度,政府可以根据预测结果来制定相应得政策,来调控宏观经济的整体运作,使社会消费品方面的投资比例达到一个合理的比例,促进经济的良好健康发展。

从长期来看,ARIMA模型还存在先天的缺陷,随着预测期的延长,其预测误差会逐渐增大,但是短期内的预测准确度还是比较高的,因此我们可以用该模型来进行短期的政策指导。

参考文献:

高铁梅:计量经济学分析方法与建模 Eviews应用及事例.北京:清华大学出版社,2006(1):126~168

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。