首页 > 范文大全 > 正文

EMD―BP神经网络预测模型及应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇EMD―BP神经网络预测模型及应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要: 时间序列分析是根据客观事物的连续性和规律性推测未来发展趋势的预测方法,分析时设法过滤除去不规则变动,突出反映趋势性和周期性变动。为了提高预测精度,构建了emd-bp神经网络预测模型,利用Hilbert-Huang变换中的经验模态分解将时间序列分解为有限个本征模函数,重构后进行BP神经网络预测。通过对中国石化的股票资料进行实验仿真,表明该模型降低了被预测数据的非平稳性,其精度比直接用神经网络预测有较明显的提高。

关键词: 时间序列; BP神经网络; EMD; 本征模函数; 预测模型

中图分类号:TP311.1 文献标志码:A 文章编号:1006-8228(2014)02-01-04

0 引言

时间序列是将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列分析是一种动态的数列分析[1],出发点是承认数据的有序性和相关性,通过数据内部的相互关系来辨识系统的变化规律。常用的时间序列分析法主要是建立在回归――移动平均模型(ARMA)[2-3]之上,被用来对股价(最高价、最低价、开盘价、收盘价)及综合指数进行预测[4-5]。然而,这些经典回归分析暗含着一个重要假设:数据是平稳的。如果数据非平稳,往往导致出现“虚假回归”,严重影响预测效果。股票等金融数据是典型的非平稳时间序列,一般地说,股票价格的变化主要包括经济性因素、政治性因素、人为操纵因素、有关行业及投资者心理等多种因素的影响,各因素的影响程度、时间范围和方式也不尽相同;且股市各因素间相互关系错综复杂,主次关系变化不定,数量关系难以提取及定量分析[6]。因此,需要寻找一种好的方法来避免或减弱这些因素的影响,于是学者研究小波分析[6]和神经网络[7-8]用于时间序列分析预测。小波变换可以使非平稳数据中的有效成分和噪声呈现出各自不同的特征,但小波变换中小波基的选取会对数据去噪的效果产生很大的影响,因此利用小波变换对非平稳数据分析的方法缺乏自适应性。Zhaohua Wu[11]等人通过大量的实验,证实经验模态分解(EMD,Empirical mode decomposition)具有类似小波变换中的二进滤波器特性,通过分解、数据重组后实现了数据的去噪,汲取了小波变换优势,同时又克服了小波变换中的小波基选择难的问题。

本文将经验模态分解和BP神经网络相结合,构建了一种基于EMD-BP神经网络的预测模型,通过对中国石化股票进行预测模拟仿真,实验结果得出结论,将EMD用于时间序列的预测分析,大大降低了扰动因素的影响,提高了预测精度。

1 时间序列的BP神经网络训练

神经网络具有较强的学习能力和适应能力,在非线性系统中的预测方面得到了广泛的应用。考虑到金融数据是一类非线性较强的时间序列,本文选用BP神经网络作为预测工具。BP网络[9-10]是一种多层前馈型神经网络,其神经采用的传递函数一般都是Sigmoid(S形弯曲)型可微函数,是严格的递增函数,在线性和非线性之间显现出较好的平衡,所以可实现输入和输出间的任意非线性映射,适用于中长期的预测;逼近效果好,计算速度快,不需要建立数学模型,精度高;理论依据坚实,推导过程严谨,所得公式对称优美,具有强非线性拟合能力。目前,已经有一些比较成熟的神经网络软件包,其中MATLAB的神经网络工具箱应用最为广泛。

在网络训练中,最重要的三个参数是权值、学习率和单元数。权值可能变得很大,这会使神经元的输入变得很大,从而使得其激活函数的导函数在输入点的取值很小,这样训练的步长就会变得非常小,进而导致训练的速度下降到很小的程度,最终可能使得网络停止收敛,即网络瘫痪。因此在对网络的连接权矩阵进行初始化时,随机给定各层之间的权值与阈值的初始值比单纯地随机给定某一部分层的收敛速度更快。学习率的选择,其合理与否是网络是否稳定的关键:太高的学习率,可以减少网络训练的时间,但是容易导致网络的不稳定与训练误差的增加;太低的学习率,需要较长的训练时间。在一定的条件下,较少的单元数目往往能够提高网络的收敛速度,而较多的单元数目有可能在规定的训练长度里不能满足要求。因此,对于参数数目的选择,并没有一个固定的模型,往往根据更多的经验成分。

2.1 经验模态分解(EMD)

经验模态分解法EMD[11]是由美国NASA的黄锷博士提出的一种信号分析方法。它适合于分析非线性、非平稳信号序列,具有很高的信噪比。该方法的关键是经验模式分解,它能使复杂信号分解为有限个本征模函数(Intrinsic Mode Function,简称IMF),所分解出来的各IMF分量包含了原信号的不同时间尺度的局部特征信号。

EMD是基于以下假设条件:①数据至少有一个最大值和一个最小值两个极值点;②数据极值点间的时间尺度惟一确定局部时域特性;③如果数据没有极值点但必须有拐点,通过对数据微分一次或多次求得极值,再通过积分来获得分解结果。

2.2 数据重构

对原始数据进行EMD分解后,得到有限个IMF分量。为了降低原始数据中的非平稳性,需要对得到的各分量进行相关系数分析,筛选出有用的IMF分量,对其进行重构,以得到一个与原始数据近似的新数据进行预测实验。

数据重组的方法有多种,本文采用相关系数分析法进行数据的筛选。由于篇幅有限,关于EMD分解与重构的代码不在本文提供。

2.3 应用训练好的神经网络对合成数据预测

对于非线性系统,BP神经网络预测有着明显的优势。但是在复杂的非线性系统中,非平稳因素给预测带来了一定的困难。正是因为EMD分解降低了各个分量的平稳性[12],才得到了广泛应用[13-15]。金融数据等时间序列随着时间,以及在多种因素的影响下会随之改变,所以数据本质上是非平稳的,因此利用神经网络对该数据进行预测,数据的平稳性使得其预测结果不是很理想,为了提高预测精度,我们用EMD方法对数据进行分解,以降低其非平稳性对预测精度的影响。然后对分解后的各分量进行相关系数分析比较,选取有用的IMF分量,进行数据的合成,从而得到一个与原始数据近似的新数据。将重组后的拟合数据输入到训练好的BP神经网络进行预测。预测过程如图1所示。

3 应用实例和分析

3.1 股票数据的BP神经网络训练

将中国石化股票从2011年6月至2011年12月共130天的股票价格数据进行样本划分。用前60天的数据来预测后5天的数据,作为网络训练集。选取剩下的60天数据预测最后的5天,作为测试集。

3.3 数据合成及预测

本文对中国石化股票数据(图3)进行EMD分解后得到4个IMF分量和1个剩余分量。对4个分量分别进行与剩余分量的相关系数分析。分析结果表明,IMF3和IMF4相关性较大,并与剩余分量的相关性也较大(相关门限值选取0.3)。所以选取IMF3和IMF4两个分量与剩余分量进行重构,得到与原始数据近似的较平滑的新数据如图9所示。

经过比较可知,对于具有非平稳强烈的股票时间序列的预测,基于EMD的BP神经网络预测要比直接BP神经网络预测更为准确。

对于非平稳的时间序列,BP神经网络预测有着明显的优势,但是对于影响因素复杂的非平稳数据,多种因素的干扰给预测带来了一定的困难。EMD分解分离了各个不同因素的相互干扰,通过对各分量单独预测再合成的处理,从而提高了预测精度。从表1可以看出最终的预测误差经过EMD分解的信号要精确于直接神经网络预测。从图4中可以看出影响信号平稳性程度最大的是IMF1,如果再对其进行分解处理,整个系统的预测精度会得到更大的改善。

4 结束语

对于非平稳的时间序列,BP神经网络预测有着明显的优势,但是对于影响因素复杂的非平稳数据,多种因素的干扰给预测带来了一定的困难。EMD分解分离了各个不同因素的相互干扰,通过对各分量分析再合成的处理,提高了预测精度。目前EMD方法主要用于模拟信号和大气数据分析[13-15],用于金融数据预测还较为少见。本文将其与BP神经网络结合,构建了EMD-BP神经网络预测模型。从本文的预测过程和仿真结果可以看到,利用EMD分解的BP神经网络预测优于直接BP神经网络预测,相比其精确度有了明显的提高。

参考文献:

[1] 刘瑛慧,曹家琏.时间序列分析理论与发展趋势[J].电脑知识与技术,2010.2:257-258

[2] 刘佳,赵文慧,刘光荣.基于SAS的非平稳时间序列分析及实证研究[J].汕头大学学报.2010.2(1):48-53.

[3] 李海林,郭崇慧,时间序列数据挖掘征表示与相似性度量研究综述[J].计算机应用研究,2013.5(30):1285-1290

[4] 魏宇.中国股票市场的最优波动率预测模型研究[J].管理学报,2010.6(6):936-942

[5] 方启东,温鑫,蒋佳静等.基于时间序列的股价预测[J].宿州学院学报,2010.8(8):71-74

[6] 杜建卫,王超峰.小波分析方法在金融股票数据中的应用[J].数学的实践与认识,2008.7(38-7):68-75

[7] 刘海,白艳萍.时间序列模型和神经网络模型在股票预测中的分析[J].数学的实践与认识,2011.2(4):14-19

[8] 张媛,刘红忠.基于行为金融的神经网络模型在股票价格预测中的有效性研究[J].世界经济情况,2011.2(2):62-67

[9] 焦淑华,夏冰,徐海静,刘莹.BP神经网络预测的MATLAB实现[J].哈尔滨金融高等专科学校学报,2009.3(97):55-56

[10] 李萍,曾令可,税安泽,金雪莉,刘艳春,王慧.基于MATLAB的BP神经网络预测系统的设计[J].计算机应用与软件,2008.4(25-4):149-151

[11] Zhaohua Wu, Norden E. Huang. A study of the characteristics of white noise using the empirical mode decomposition method[J].The Royal Society,2004.3(10):1597-1611

[12] 刘慧婷,倪志伟,李建洋.经验模态分解方法及其应用[J].计算机工程及应用,2006.1(32):44-47

[13] 徐世艳.经验模态分解的时频分析方法及其应用[J].吉林大学学报,2009.9(27-5):487-492

[14] 玄兆燕,杨公训.EMD在地面气温预测中的应用[J].微计算机信息,2008.2(24-3):230-232

[15] 玄兆艳,杨公训.经验模态分解法在大气时间序列预测中的应用[J].自动化学报,2008.1(34-1):97-101