首页 > 范文大全 > 正文

基于工业增加值的预测精度测定

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于工业增加值的预测精度测定范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:我国工业发展情况能反映国家的经济水平,对研究工业的发展能很好的得出工业总产值的产量变化情况。首先绘制折线图和工业增加值自相关图进行平稳性和季节性分析得出相应的结果。从图中的分析消除趋势同时减小系列波动,对原系列做一阶自然对数逐期差分并且消除季节性。最后建立季节模型计算各模型参数估计结果和各模型检验结果。用所建立的模型预测2013年1至12月工业增加值和白噪声检验,以明确模型的可用性。

关键词:平稳性和季节性 自然对数逐期差分

一、问题的提出

加强中国统计数据的质量评估已经变得尤为重要,是提高数据质量的有效方法。研究数据质量的准确性和有效性是数据质量评估两个重要特性。对数据的可比、衔接等深层次研究都需要在数据质量精度高的条件下进行分析所得到的结论才会具有较高的可靠性,这样才能用数据去解释各种研究主题的实际意义。而本文是基于计量模型分析法对工业增加值数据的精度进行评估,通过建立季节模型并对下一年度数据进行预测,计算出预测偏差,得到在95%置信水平下的置信区间进而对数据质量进行综合评估。

二、理论与方法的介绍

(一)数据说明

由于最新的国家统计局数据只公布了工业增加值同比增长率并且最新的数据公布标准是为消除春节日期不固定因素带来的影响,增强数据的可比性,按照国家统计制度,自2013年起,1-2月份工业数据一起调查,一起,不再单独2月份当月数据。所以我们只能通过同比推算得到2000-2012各年2月至12月的工业增加值数据。所以本文决定利用工业增加值累计同比推算一月的工业增加值,这种方法保证了工业增加值的数据质量。

(二)模型识别

工业增加值是指按不变价格计算的工业企业在报告期内以货币形式表现的从事工业生产活动的最终成果。工业增加值数据是随时间变化的时间序列,不但具有随机性而且包含了趋势和季节特性,是一个非平稳的序列。

由于本文研究的工业增加值序列具有趋势及季节性,季节[ARIMA]模型是一种理论上成熟的算法,它对周期性变化的序列有较高的预测准确度。选择建立[ARIMA(p,d,q)]模型,阶数为[ARIMA(p,d,q)(P,D,Q)s]的乘积季节模型的基本形式为:

[?p(B)ΦP(Bs)?d?DsYt=θq(B)Q(Bs)ut]

LM(Lagrange multiplier)检验对[ARIMA]包含误差项的模型残差序列进行高阶自相关检验,并允许存在因变量的滞后项。检验假设为:

[H0]:残差序列不存在小(等)于[p]阶的自相关

[H1]:存在[ARMA(r,q)]形式的误差项;其中[p=maxr,q]。

在零假设下,[LM]统计量有渐进的[χ2(p)]分布,对于给定的显著水平[α]和自由度[p],如果[LM>χ2α(P)],则拒绝[H0],认为序列存在自相关,反之亦然。

是置信区间的确定。基于这个[ARMA(p,q)]模型可以计算并得出下边的式子,预测误差和方差分别为

[et(l)=yt+l-yt(l)=?0ut+l+?1ut+l-1+…+?l-1ul+1]

[D(et(l))=σ2(?20+?21+…+?2l-1)]

假设预测误差具有如下分布:[et(l)]~[N(0,D(et(l)))],由于[yt+l=yt(l)+et(l)],因此,在[yt],[yt-1],…给定的条件下,[yt+l]的分布完全由[et(l)]的分布决定,即:

[(yt+lyt,yt-1,…)]~[N(yt(l),D(et(l)))]~[N(yt(l),σ2(?20+?21+…+?2t-l))]

由此,我们可以得到[yt+l]预测的95%的置信区间为:

[yt(l)±1.96σ(?20+?21+…+?2t-l)12]

为了消除趋势特征同时减少序列的的波动,我们对工业增加值时间序列[t]作一阶自然对数逐期差分,即[ILIPt=LN(IPt)-LN(IPt-1)]。为了使差分和变换后的序列更好的趋于平稳状态,我们需要对序列进行季节差分。消除季节波动即对序列[ILIPt]作自然对数的季节差分,取周期等于12时:

[SILIPt=LN(ILIPt)-LN(ILIPt-12)]

通过季节差分得到新的序列[SILIPt],进一步对新序列进行分析。此时序列图变动的规律性已大大减弱,季节性特征得到了较好的控制。为了得到最优平稳序列,我们选择阶数[d=2]时为最优。

从序列D12DLIP的样本自相关与偏自相关系数很快的就落入了随机区间,证明系列区间已被消除,但在Correlogram of D12DLIP中,当[k=12]时取值仍然较大,季节性依然比较的明显。所以,经过试验对序列进行二阶季节差分即得到Correlogram of (D12DLIP,2),发现序列的季节性得到了较好的改善,故选择二阶季节差分。。

对序列选用扩展Dickey-Fuller检验,滞后阶数则采用AIC准则的方法进行确定。下图发现ADF值明显小于临界值,所以此时序列呈现平稳状态,即为平稳序列。

(二)[ARMA]模型建立

一般讨论的[ARMA]模型形式都存在序列均值为零的假设,否则应做必要的转换。进一步对序列进行零均值检验:

得到该序列样本的平均数是m=0.000468,均值的标准误s=0.057201,序列均值趋近于0(即与0无显著差异),表明该序列可以直接建立ARMA模型。通过了零均值检验后,最终选取以下[(p,q)]组合。

参数估计结果

在衡量预测偏差的指标中我们选择MAPE进行判定,通过筛选,[(p,q)]=(3,4)时的MAPE值最小,表示预测精度最高,(MAPE的取值范围在0-5之间精度极高,在10以内说明预测精度高)。同时我们看到Theil不等系数的取值也接近于0,所以表明了选择该模型的预测效果

由于LM统计量的取值为3.16,检验的相伴概率为0.28大于置信度0.05.所以不能拒接原假设,故残差序列不存在二阶自相关。故不会成为白噪声。即模型的建立是比较合理的。

(四)模型预测

通过取定置信水平在95%时,我们可以看到实际值处在置信区间中,这就说明了实际值是较为准确的。

四、结论与建议

(一)结论

本模型通过折线图和相关及偏自相关分析可以明显的看出该工业的增加值随时间的变化而增长,并且有明显的季节性变化通过消除平稳性和季节性并建立ARIMA模型最终预测出2013年增加值走势并且预测值也符合该工业增加值的增长趋势。预测得出的工业增加值均落在置信区间内,说明预测值较为精确。

(二)建议

一是由于数据的可靠性以及准确性,在选取的数据上存在一定的误差,但都尽量控制在合理的范围内。所以,还需要进一步的去消除误差,使得精确度更加精准。

二是模型模拟实验结果与实际情况可能不尽完全一致,而且在模型建立时,忽略了多种并未量化的影响因子,数据收集误差等因素。因此,不能完全准确的进行分析,模型仍需要修正和完善。

参考文献:

[1]易丹辉.数据分析与EViews应用[M].中国人民大学出版社.2008版

[2]姜启源.数学模型(第三版)[M].高等教育出版社.2003版

[3]庞皓.计量经济学[M].西南财经大学出版社.2010版

[4]龚曙明.宏观经济统计分析[M].中国水利水电出版社.2010版

[5]徐国祥.统计预测与决策(第三版)[M].上海财经大学出版社.2010版

[6]中国经济统计数据库 http://