首页 > 范文大全 > 正文

一种自适应停止的SOM神经网络及其应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇一种自适应停止的SOM神经网络及其应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要: RFID采集的车辆信息可以识别营运车辆的运行规律,采用这种方法能找出运行规律类似营运车辆的私家车,并判定为疑似非法营运车辆。应用SOM神经网络聚类时,初始化网络需要设置各种参数。为此,提出一种自适应确定网络训练次数的方法,利用权值导数来判断是否停止训练。利用UCI数据集对传统的和改进后的网络进行测试并对比,发现改进后的网络优于传统网络。最后,将改进后的网络用在车辆运行规律识别中,得到预期的效果。

关键词: som神经网络; 网络训练; 自适应; 聚类

中图分类号:TP391.4 文献标志码:A 文章编号:1006-8228(2014)04-09-03

Abstract: The vehicle information collected by RFID could identify laws of the commercial vehicles' operation. Using this approach can find out private cars which have similar operation laws, and judge them as suspected illegal vehicles. When using SOM neural network to cluster, various parameters need to be set when initializing the network. A self-adaptive method is introduced for determining the network training times, which uses weights derivative to determine whether to stop training. After the test and comparison of the traditional and the improved network by taking advantage of UCI datasets, it turns out that the improved network is better than the traditional network. Finally, when the improved network is used in identification of the vehicle, an expected recognition results can be reached.

Key words: SOM neural network; network training; a self-adaptive method; cluster

0 引言

RFID技术作为一种新兴的车辆监控技术,正在被广泛地应用于交通领域,重庆市目前正在建设全球最大规模的以UHF RFID技术为基础的车联网,已建设RFID数据采集点300余处,给利用RFID数据来进行非法营运车辆的识别提供了可能。项目前期已经得到了模拟城市某点的RFID对各种机动车辆仿真的数据,其中包括营运车辆和非营运车辆。营运车辆包括:公交车、长短途客运车辆和出租车;非营运车辆是私家车。识别的任务就是找到非法的营运车辆。在识别过程中采用了SOM神经网络对各种车辆进行聚类,从而识别运行规律与营运车辆类似的私家车,并将其标记为疑似非法营运车辆,提高交通行政执法人员的目的性和执法效率。

所谓自组织映射网络(SOM)是由芬兰学者Kohonen教授在1981年提出的,也称作Kohonen网络[1]。网络通过把复杂、多维的输入数据投射到一维或者二维的输出空间来进行对复杂数据的研究。SOM网络的应用和研究都非常广泛,例如利用模糊概率SOM神经网络来进行人脸识别[2],利用改进的自组织网络进行概率密度估计与分类[3],设计自生长的批处理SOM网络以及确定它的停止条件[4],这里的停止条件是指获胜者的近邻加权平均失真误差发生收敛时停止训练网络等。

项目前期得到RFID点采集到的信息包含:车辆车牌号、车辆经过时间和经过地点,再将数据导入SQL Sever数据库进行数据的预处理,处理后得到的数据包括:车辆车牌号,统计周期内的车辆平均通过时间、通过时间的方差、通过时间间隔、通过时间间隔的方差、通过频次、高峰通过占比等相关信息,而后经过PCA降维处理去掉不同维数据之间的相关性并剩下最终的六维数据,将这六维数据作为网络的输入数据。

使用MATLAB神经网络工具箱[5]对SOM网络进行聚类时发现,对SOM网络的初始参数的确定有很多局限性,这些初始参数包括:网络权值和阈值、训练次数、训练样本的顺序、学习率等[6-7],但目前暂时还没有找到一种有效的方法来解决这些初始参数的设定问题。本论文对网络的训练次数的设定方式进行一些改进。

1 论述

1.1 SOM网络的基本模型及原理

SOM网络由输入层和输出层构成,输入层是一维的神经元,神经元个数由输入向量的维数i确定,表示网络的输入信号;输出层也是竞争层,一般是一维或二维的神经元组成的网络,其中每个神经元表示不同的输出模式。其连接方式如图1所示。对于每一个输出神经元j,它和每一个输入神经元通过一个权值连接,这个权值组成的向量如式⑴:

其中i表示输入向量的维数,即输入层的神经元个数,j表示第j个输出神经元,输出层共包含M*N个输出神经元,如图1所示为4输入神经元,4*4输出神经元构成的SOM神经网络[5]。

SOM网络的运行分为训练和工作两个阶段[1]。训练阶段,对网络输入数据,输出层将有某个神经元产生最大的响应而获胜。获胜神经元周围的神经元也因此产生较大的响应,于是将获胜神经元及其领域(以某种方式定义的一个获胜神经元周围的区域)内的所有神经元以某种方式将其权值向量进行修改。网络通过自组织方式,用输入数据调整网络权值,最后使输出层各神经元的权值向量成为某类的聚类中心,确定好后训练结束。网络训练结束后,输出层各神经元与输入模式的特定关系就完全确定了,因此可以工作了,当输入一个模式时,网络输出层代表该模式的特定神经元会产生最大的响应,在所有神经元中竞争成功,从而自动将该输入归类。

在训练阶段,训练次数需要根据经验并反复对比确定一个合理的值,但对于一个陌生的问题,并不能够在短时间内很好地确定训练次数的最佳值,若训练次数设定过小,可能造成训练不充分而使得到的结果正确率不高;若训练次数过多,又会造成训练过度而使结果不准确,且会浪费大量的时间。故训练次数确定过程很繁琐,不够简便,而且确定最佳训练次数时 花费的时间较多,针对这个问题本文提出了一种解决方法。

1.2 SOM神经网络的训练过程

传统SOM神经网络的训练过程主要包括以下几步骤[6]:

⑴ 初始化网络:首先确定输出神经元的数目,二维的输出矩阵可以表示为M*N,往往要比预测的聚类数目多,初始化权值向量如式⑵:

⑵ 确定获胜神经元:对于每一个训练样本x,使用最小欧式距离准则来寻找离样本向量最近的神经元c,作为获胜神经元,并把它添加到该获胜神经元的类型VC中。决策条件如式⑶:

⑶ 更新权值:对优胜邻域内所有节点按照式⑷

来调整权值。其中学习率η(t,N)是训练时间t和邻域内第j个神经元与获胜神经元之间的拓扑距离N的函数,且η随着t和N的增加减小。

⑷ 检查结束:SOM网络的训练是以学习率η(t)是否减小到0或某个特定的值,或者训练次数t是否达到某一设定的值为条件,满足这个条件就退出训练,否则继续对网络进行训练,返回步骤⑵。

1.3 SOM网络的改进

在SOM的训练过程中,权值一开始是一系列的随机的小数,随着训练过程的进行,权值不停地改变,更加靠近每一个输出神经元的聚类中心,直到达到一个设定的训练次数或学习率衰减到一定的值。但设定的训练次数往往需要多次实验才能确定;而学习率最后衰减的阈值需要靠经验来确定,如果设定为0,会使网络陷入亚稳定状态[1],设置合适的阈值需要适应不同的实际情况。故提出一种利用权值导数来判断何时该停止训练的方法。

每个神经元都代表一个聚类中心,而在传统的聚类过程中,类中心是随着聚类的过程不断地靠近每一类数据中心,而在SOM神经网络中,聚类中心的表征形式又是各个输出神经元的权值向量[Wj1,Wj2,…,Wji](j=1,2,…,M*N),所以定义每一次训练后权值的变化,如式⑸:

来表示类中心的变化情况。其中其中Wn表示当前训练后的权值,Wn-1表示前一次训练后的权值,ΔW是一个i*j维的向量。其中i是输入神经元的个数,j是输出神经元的个数M*N。

权值变化量ΔW的一范数如式⑹:

一范数即为列模,这里符合权值的定义,每一列代表一个聚类中心,ΔW的一范数就是变化最大的类中心的变化量。最终的目的即判断在训练次数为何值时权值W收敛。采用函数值的下降量充分小[8]为收敛准则,即最大的类中心变化值ΔW1小于某一给定值ε时,即:

来判断收敛。ε为事先给定的收敛条件。

在网络的训练过程中,学习率仍采用SOM网络经典的函数,即指数函数,这里所用的是:

2 实验

为了评估训练次数自适应的SOM改进算法对网络性能的影响[10],本文对改进算法与传统算法进行了对比分析。采用UCI数据集对数据进行测试,分别采用了八个数据集,包括Wine、Breast_Cancer、Iris、Zoo、Car_Evaluation、Abalone、bupa、segment数据集的基本信息和对应的输出网络模型设置见表1,并对照MATLAB中传统的SOM网络[5]进行仿真结果如表2所示,其中在MATLAB中默认的训练次数为200次。

经过测试可以看到,改进后的SOM网络能够比matlab中传统SOM网络(默认训练200次)识别的正确率高。

把改进后的SOM神经网络用在车辆类型识别中的效果如图2所示,其中绿色的为私家车数据,黑色为非法营运车辆数据,红色为公交车数据,蓝色为长途车数据。

该网络输出矩阵设置为7*7的矩阵,经过若干次自适应的迭代,得到的聚类结果如图3所示。

可以看到营运车辆被聚到一类,绿色的合法私家车均匀的散布在输出矩阵中,非法营运的私家车被聚到营运车一类。将这些疑似营运车辆的私家车提供给执法部门,能够给执法人员提供一些线索和依据。

3 结束语

本文提出了一种运用在SOM网络中利用导数判断收敛的算法,该算法能够自适应确定SOM网络无监督训练时的迭代次数,缩短确定训练次数所花费的时间,减小算法复杂度。经过实验验证,在不降低正确率的情况下通过该算法可以减少手动确定训练次数的过程;并与MATLAB中传统的SOM神经网络工具箱相对比,其中默认的训练次数是200次,从表2中可以看到改进后的网络比默认参数的神经网络识别正确率高。利用改进后的网络对经过特征数据提取之后的RFID数据进行聚类,能够达到预期结果。

参考文献:

[1] Samarasinghe.s. Neural Networks for Appeied Sciences and Engineering:From Fundamentals to Complex Pattern Recognition[M].Beijing:Mechanical industry press,2009.7.

[2] Laura Lanzarini, Franco Ronchetti, Cesar Estrebou, Luciana Lens Aurelio Fern' andez Bariviera,Face recognition based on fuzzy probabilistic SOM[J]. IFSA World Congress and NAFIPS Annual Meeting (IFSA/NAFIPS),2013.

[3] Lin Chang, Yu Chong-xiu, Modified Self-Organizing Mixture Network for Probability Density Estimation and Classification[J].Neural Networks (IJCNN), The 2013 International Joint Conference on,2013.

[4] Se Won Kim, Tang Van To. A Self-Growing and Self-Organizing Batch Map with Automatic Stopping Condition[J].2013 5th International Conference on Knowledge and Smart Technology (KST),2013.

[5] 张德丰等.MATLAB神经网络应用设计[M].机械工业出版社,2011.

[6] 周开利,康耀红.神经网络模型及其MATLAB仿真程序设计[M].清华大学出版社,2005.

[7] 任军号,吉沛琦,耿跃.SOM神经网络改进及在遥感图像分类中的应用[J].计算机应用研究,2011.3.

[8] 陈宝林.最优化理论与算法[M].清华大学出版社,2005.

[9] Apirak Jirayusakul. Improve the SOM Classifier with the Fuzzy Integral Technique[J].Ninth International Conference on ICT and Knowledge Engineering,2011.

[10] Juha Vesanto, Johan Himberg, Esa Alhoniemi and Juha Parhankangas, Self-organizing map in Matlab: the SOM Toolbox[J].Proceedings of the Matlab DSP Conference,1999.

[11] Chen Weijun,Li Xiao. An Improved Solution of SOM Network Anomaly Detection Based on T-Distribution[J].International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery,2011.