首页 > 范文大全 > 正文

基于人工神经网络的人口预测

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于人工神经网络的人口预测范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘 要】近年来我国的人口总数仍持续增高, 老龄化进程加速, 从而导致的抚养比不断提高, 对社会保障体系和公共服务体系的压力加大, 并影响到社会代际关系的和谐。对人口数量的准确预测可以为制定社会经济可持续发展计划提供重要依据。文中将BP神经网络应用于人口预测, 采用Matlab的神经网络工具箱函数建立神经网络预测模型。数值试验结果表明,基于人工神经网络人口预测模型是行之有效的。

【关键词】人口预测;人工神经网络;BP神经网络

0 引言

中国是一个人口大国, 人口问题始终是制约我国发展的关键因素之一, 但是要确定人口发展战略, 必须既着眼于人口本身的问题, 又处理好人口与经济社会资源环境之间的相互关系, 构建社会主义和谐社会, 统筹解决人口数量、素质、结构、分布等问题。已有的文献采用微分方程、灰色系统和曲线拟合等方法研究了我国人口问题[1-2]。本文根据近年来中国的人口发展所出现一些新的特点, 以及近几年中国人口抽样数据及现有全国人口普查数据, 运用人工神经网络算法[3-4]对中国人口做出了分析和预测。人工神经网络(ANN)可以通过学习来抽取和逼近输入输出之间存在的非线性关系。因此,基于人工神经网络的预测方法成为近几年研究的热点。目前,主要采用BP神经网络、局部反馈性神经网络等。BP神经网络是人工神经网络中应用最广泛的算法。

1 BP神经网络模型

BP神经网络的输入与输出之间是一种高度非线性映射关系,如果输入节点数是N,输出节点数是M,则网络是从N维欧式空间到M 维欧式空间的映射。通过调整BP神经网络的连接权值和网络的规模(包括N,M和隐层节点数),可以以任意精度逼近任何非线性函数。

BP算法的训练过程包括输入信号的正向传播和输出误差的反向传播两个过程。BP算法首先进行输入信号的正向传播。输入的样本首先进入网络的输入层,经中间隐含层的分析计算处理后,进入输出层得到样本训练输出结果。如果网络最终输出与网络期望输出值(导师信号)存在误差,那么就进行误差的反向传播。误差的反向传播首先将误差按照一定的学习算法整理成相应的形式,由隐含层传播至输入层,并将误差分配给各层的所有神经元上,从而获得各层神经元的误差信号,此误差信号即作为修正各神经元权值的依据。这种权值修正的过程,也就是网络的学习训练过程。这种过程不断迭代,最后使得误差信号达到允许的范围内。

在BP神经网络预测前,首先要训练网络,通过训练使网络有联想记忆和预测的能力。具体的步骤如下:

第一步:设置好已知参数,包括目标输出、预期平均误差、隐含层的数量与神经元个数、输出层的神经元个数、各层的权值与阀值等。

第二步:数据归一化。在设定好各种参数之后,确定每一样本的参数。每一样本的每个数据作为输入层神经元,所有样本计算做为一个学习周期,为了使网络能更快地收敛,应该将输入层神经元归一化,即将其按照式(1)转换为(0,1)之间的值,其中x是样本数据。

第三步:确定样本数据之后,通过每一个样本数据对网络进行的计算。计算时首先将输入层神经元按照式(2)计算出隐含层输入,其中h表示隐含层,k表示第k个样本,wih表示第i个输入层神经元与第h个隐含层神经元之间连接的权值,bh表示隐含层第h个神经元的阀值。计算隐含层输入之后通过可导函数(一般选择sigmond函数,如式(3)所示,其中x表示隐含层输入)处理得出隐含层输出;将第一层隐含层的输出作为下一隐含层的神经元进行下一隐含层输入计算,在通过可导函数处理得出下一层隐含层的输出如此反复计算,直至隐含层全部计算完;

2 人口预测

2.1 数据来源

为了验证神经网络模型在人口预测中的效果,本文采用的我国人口数据均来自1995 -2012年的《中国统计年鉴》,具体数值如表1所示。我们将数据分为两部分,1995-2008年作为训练样本,2009-2012年作为测试样本。

2.2 BP神经网络拓扑结构的确定

如果隐含层神经元数目过少,网络很难识别样本,难以完成训练,并且网络的容错性也会降低;如果数目过多,则会增加网络的迭代次数,从而延长网络的训练时间,同时也会降低网络的泛化能力,导致预测能力下降。在选择隐含层层数时要从网络精度和培训时间上综合考虑。在具体设计时,首先根据经验公式初步确定隐含层神经元个数,然后通过对不同神经元数的网络进行训练对比,再最终确定神经元数。通用的隐含层神经元数的确定经验公式有:

其中i为隐含层神经元的个数,n为输入层神经元的个数,m为输出层神经元的个数, a为常数且1

2.3 人口预测结果

由图2可知,神经网络很快就训练收敛了。经过多次训练和学习,得到BP网络的预测值。预测结果是2009-2012年人口预测数量分别为:133487,133985,135139,135431.(单位:万人)。

2.4 结束语

将BP 预测值与实际值做比较, 2009-2012年的相对误差为0. 01%、0. 01%、0.3%、0. 009%.

BP 网络预测结果表明, 比其他数学方法预测值更接近实际值. 这是因为我国的人口数量受多种因素的影响,人口的增长呈非线性局势, 而BP 网络的优点就在于它的非线性趋近性和泛化能力。本文采用自适应学习速率和附加动量法相结合的方法, 比应用单一的方法效果要好很多。BP 网络具有它的局限性, 隐含层的设计是人为设定的, 这样很容易造成误差。因此, 如何更好的将BP 网络与其他神经网络结合起来应用于人口预测系统, 是我们以后努力的方向。

【参考文献】

[1]王晓龙,杨广,张保华.灰色及其改进模型在人口预测中的应用[J].世界科技研究与发展,2009,31(4):757-758.

[2]蒋超,杨琳,付敏.中国人口预测的数学模型[J].内江师范学院学报,2008,3(12): 33-35.

[3]邢立远,黄东伟,曹宇.BP 神经网络在中国人口预测中的应用[J].纺织高校基础科学学报,2010,23(3):386-388.

[4]陈虹,田八林.径向基函数网络在陕西省人口预测中的应用[J].现代电子技术,2005,28(23):91-92.