首页 > 范文大全 > 正文

利用灰色模型预测长春市公路客运量

开篇:润墨网以专业的文秘视角,为您筛选了一篇利用灰色模型预测长春市公路客运量范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】 本文选取2003―2012年吉林省长春市公路客运总量数据,运用灰色预测模型对长春市的客运总量进行分析,建立灰色预测GM(1,1)模型,并进行一系列检验:残差检验、关联度检验、后验差检验及误差分析. 同时,预测未来两年长春市的客运总量.

【关键词】 残差检验;关联度检验;后验差检验;误差分析

【项目来源】 吉林省教育厅“十二五”科学技术研究项目,吉教科合字[2013]第142号.

公路客运量是一个受多层次、多因素影响的复杂关系量,为了准确预测它,必须考虑各种影响因素,需要收集大量信息,由此带来的问题是建模困难,计算量大. 有时,即使模型能够建立,往往又因缺少足够的信息不能确定模型的参数,导致无法实现预测. 灰色系统理论所提出的灰色系统模型预测方法,避开了这些复杂的相互关系,它不要求那么多的信息,而只是着眼于系统本身的灰色信息,寻找系统本身的内在规律,达到使灰色系统白化的目的.

灰色系统预测模型是基于灰色系统的理论思想,将离散变量连续化,用微分方程代替差分方程,用生成数序列代替原始时间序列,弱化原始时间序列的随机性,再通过一定的步骤建立生成数的数学模型,此模型只适用于短期和中期预测,不适于长期预测.

一、灰色GM(1,1)模型

灰色预测模型直接使用的不是原始数据,而是原始数据产生的生成数. 生成分为累加生成和累减生成,分别记为AGO和IAGO.

设原始数据为X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),由它产生的r次累加生成r - AGO为X(r)=(x(r)(1),x(r)(2),…,x(r)(n)),其中x(r)(k)=■x(r-1)(i)=x(r)(k-1)+x(r-1)(k),x0(1)=x0(2) = … = 0,k = 1,2,…,n,r = 1,2,….

令Z(1)为X(1)的紧邻均值(MEAN)生成序列Z(1) = (z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)(k) = 0.5x(1)(k) + 0.5x(1)(k - 1).

则GM(1,1)的灰微分方程模型为

x(0)(k) + az(1)(k) = b.(1)

式中a称为发展系数,b为灰色作用量. 设■为待估参数向量,即■ = (a,b)T,则灰微分方程(1)的最小二乘估计参数列满足■ = (BTB)-1BTYn,其中

B=-z(1)(2) -z(1)(3) … -z(1)(n) 1 1 … 1T,

Y=[x(0)(2) x(0)(3) … x(0)(n)]T.

称方程■+ax(1) = b为方程(1)的白化方程. 其解■(1)(t)=x(1)(0) - ■e-at + ■也称为时间响应函数,时间响应序列

■(1)(k + 1) = x(1)(1) - ■e-ak + ■,k = 1,2,…,n

即为预测方程. 还原值

■(0)(k + 1) = ■(1)(k + 1) - ■(1)(k).

二、 模型检验

GM(1,1)模型的检验分为三个方面:残差检验、关联度检验、后验差检验.

(一)残差检验

即对模型值和实际值的残差进行逐点检验. 首先按模型计算■(1)(i + 1),将■(1)(i + 1)累减生成■(0)(i),最后计算原始序列x(0)(i)与■(0)(i)的绝对残差序列

Δ(0)={Δ(0)(i),i = 1,2,…,n},Δ(0)(i) = |x(0)(i) - ■(0)(i)|

及相对残差序列

?准 = {?准i,i = 1,2,…,n},?准i = ■%

并计算平均相对残差■ = ■■?准i . 给定α,当■ < α,且?准i < α(i = 1,2,…,n)成立时,称模型为残差合格模型.

(二)关联系数与关联度检验

关联系数:设数据列

■(0)(k) = {■(0)(1),■(0)(2),…,■(0)(n)}

X(0)(k) = {X(0)(1),X(0)(2),…,X(0)(n)}

关联系数定义为:

η(k) =

其中ρ称为分辨率,0 < ρ < 1,一般取ρ = 0.5.

关联度:各类关联系数的平均值r = ■■η(k),称为■(0)(k)序列与X(0)(k)序列的关联度. 关联度检验,即通过考察模型值曲线和建模序列曲线的相似程度进行检验. 根据经验,关联度大于0.6便是满意的.

(三)后验差检验

后验差检验,即对残差分布的统计特性进行检验.

设原始序列X(0)的均方差和残差的均方差分别为:

S1 = ■,

S2 = ■.

令S0 = 0.6745S1,ei = |Δ(0)(i) - ■|,则小残差概率

p = P{|Δ(0)(i) - ■| < 0.6745S1} = P{ei < S0}.

记方差比C = S1/S2,若对于给定的C0 > 0,当C < C0时,称模型为均方差比合格模型;如对给定的P0 > 0,当P > P0时,称模型为小残差概率合格模型.

若相对残差、关联度、后验差检验在允许的范围内,则可以用所建的模型进行预测,否则应进行残差修正.

三、误差分析

评价预测方法好坏的标准用平均绝对百分误差MAPE来衡量:

MAPE ≤ 10% 高精度预测

10% < MAPE ≤ 20% 良好预测

20% < MAPE ≤ 50% 可行预测

MAPE > 50% 错误预测

四、历史数据的收集、分析与处理

收集了长春市2003―2012年各季度公路客运量,见附录1. 画出散点图(如图1). 从图中可以看出,总体来说,长春市的客运量逐年上升,2007年2月,客运量明显大于其他月份,如在预测时不作任何数据处理,会影响预测精度,但如果将异常数据剔除掉,又会因为样本数的减少而影响预测的准确度,本文对异常值做了简单的处理.

理论上,正常的序列{Xt}是平滑的,则应有■t - kSt < Xt+1 < ■t + kSt,其中

■t = ■■Xj,St2 = ■ - ■t2,■ = ■■Xj2,k ∈ [3,9],这里k = 4.

用上面的公式对异常值点的进行检验,由数据可得:(■ - 4St,■+ 4St)=(96.6763,545,7827). 易见559.07?埸(■ - 4St,■ + 4St),其他点都落在(■ - 4St,■ + 4St)中,故559.07为异常值,需要进行修正:

如果Xt+1是一个异常点,我们可以用■t = 2Xt - Xt-1来修正. 本文中,Xt为2007年1月的客流量,算得■t = 2 × 115.98 - 76.95 = 155.01,把2007年2月的客运量修正为155.01万人次. 再次画散点图(如图2):

所以,将2007年2月的客运量修正为155.01万人次,2007年第一个季度的总客运量为360.24万人次.

五、实证分析

(一)灰色模型的建立

设原始数列为:

X(0)(k) = {968.77,1082.78,1217.62,1291.02,1299.32,

1391.19,1314.23,1365.13,1373.62,1346.65}.

经软件S-PLUS计算,得

■ = ab = (BTB)-1BTYn = -0.02103791158.4025951.

得出预测模型

■(1)(k + 1)=56031.4234e0.0210379k - 55062.6534.

(二)灰色模型的检验

残差检验 根据预测公式,计算■ (1)(k):

■ (1)(k) = {968.77,2160.04,3376.638,4619.102,5887.981,

7183.838,8507.245,9858.789,11239.07,12648.69} (k = 0,1, … ,9).

累减生成序列■ (0)(k):

■ (0)(k) = {968.77,1191.27,1216.598,1242.464,1268.879,

1295.857,1323.407,1351.544,1380.281,1409.62},k = 1,2, … ,10 .

绝对残差和相对残差序列分别是:

Δ(0) = {0,108.49,1.02,48.56,30.44,95.33,9.18,13.59,6.66,

62.97},

?准 = {0,10.02%,0.08%,3.76%,2.34%,6.85%,0.70%,1.00%,0.48%,4.68%}.

可见,相对残差不超过10.02%,模型精确度高.

关联度检验 由绝对残差序列Δ(0)(k),可得

min{Δ(0)(k)} = 0,max{Δ(0)(k) } = 108.49,

算得关联系数

η(k) ={1,0.33,0.98,0.53,0.64,0.36,0.86,0.80,0.89,

0.46},

关联度ri = ■■ηi(k) = 0.685 > 0.6,满足P = 0.5时的检验准则.

后验差检验 算得序列X(0)的均方差及残差的均方差分别是:

S1= 138.2405,S2 = 39.8141,

C = ■ = 0.2880,S0 = 0.6745S1 = 93.2432,

ek = |Δ(k) - ■| = {37.624,70.866,36.604,10.936,7.184,

57.706,28.444,24.034,30.964,25.346}.

所有ei都小于S0,故小残差概率P{ei < S0} = 1 > 0.95,同时C = 0.2880 < 0.35,故模型x(1)(k + 1)= 56031.4234e0.021037912- 55062.6534预测精度优.

作出客运量实际值与预测值的对比图如下,由图3可见,两者吻合得很好.

取k = 10,11时,分别得2013年、2014年长春市公路客运总量预测值:

x(0)(11) = 1439.742(万人),x(0)(12)= 1470.355(万人).

即2013年、2014年长春市客运总量预计达1439.742万人和1470.355万人次.

(三)误差分析

平均绝对百分误差MAPE = ■■■ × 100% = ■ × 0.2991 × 100% = 2.99%,根据平均绝对百分误差MAPE对预测的衡量标准,上述结果表明用该模型进行预测,效果为高精度预测(MAPE≤10%).

【参考文献】

[1]侯文超. 经济预测――理论、方法及应用[M].北京:商务印书馆,1993.

[2]徐国祥.统计预测和决策・第三版.上海:上海财经大学出版社,2008.

[3]肖枝洪,郭明月. 时间序列分析与SAS应用[J]. 武汉:武汉大学出版社,2009.

附录

2003―2012年各季度长春市公路客运量(单位:万人)