首页 > 范文大全 > 正文

自适应学习的多特征元素协同表示分类算法

开篇:润墨网以专业的文秘视角,为您筛选了一篇自适应学习的多特征元素协同表示分类算法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:针对基于传统的稀疏表示分类算法的单特征鉴别性较弱这一不足,提出一种基于自适应学习的多特征元素协同表示分类算法SLMCE_CRC。该算法结合多特征子字典的思想,对样本提出特征元素的双重分解,并分别从特征和元素角度分别进行相应的协同表示,自适应地学习出各个特征的稀疏权重和元素的残差权重,并进行线性加权,从而实现目标的分类。实验结果表明,使用该方法能显著提高识别率,尤其对含有较多特征细节的图像数据,具有一定的实用价值。

关键词:自适应权重;协同表示;稀疏表示;特征提取;元素分解

0 引言

近年来稀疏表示理论已经成为各领域的研究热点,广泛应用于图像处理和模式识别中,特别是在人脸识别、图像分类、字符识别等分类问题中具有突出表现,主要是源于l0范数和l1范数正规化的发展。在模式分类领域,Wright等[1]提出了Sparse Representation Classifier (SRC)分类器,主要思想是:在一个训练样本空间充足的条件下,任一类别向量的数据都可以由训练样本中同类的样本数据子空间进行线性表示,即通过完备字典的训练样本来将目标向量数据线性组合,目标类别向量能够被表示或者逼近成同类的样本数据的线性组合。

SRC在人脸识别领域的成功促进了基于稀疏表示的模式分类的研究,例如Li等[2]提出了局部稀疏表示的分类算法,其利用测试样本的k个最近邻居来计算测试样本的稀疏表示,降低SRC算法计算复杂度。

Huang等[3]提出了一种快速稀疏表示算法,基于同一类的训练图像可建模为一个小的样本集的理论,借助于K均值奇异值分解(Kmeans Singular Value Decomposition,KSVD)求出超完备字典,从而将稀疏表示问题转化为最小化l1范数问题,并将字典进一步压缩为更小的集合,很大程度上缩短了运算时间;但该方法造成了识别精度较明显的下降。

Yang等[4]提出了鲁棒的人脸识别稀疏编码,该方法在具有稀疏性的同时还具有鲁棒性很强的重构性,进而有效地实现了对有损信号的分类。

Yang等[5]通过学习Gabor字典,提取人脸的Gabor特征降维和l0范数相结合快速稀疏分类进行识别。

Zhang等[6]则将字典减少为测试图像固定数量的近邻进行稀疏表示,并达到较好的识别效果;但缺乏测试样本的不同分布特性及训练样本类别的选择。

段刚龙等[7]提出基于自适应权重的多重稀疏表示分类算法(adaptive weighted Multiple Sparse Representation Classification approach, MSRC),从特征角度构建SRC的特征子字典,分别进行相应的稀疏表示求解,实现了SRC的识别效率提升和适用范围的扩大。

虽然大量相关研究都促进了SRC算法的发展,揭示了SRC算法稀疏性在模式分类中的重要性,但是其机理始终没有得到有效的解释。Wright等[8]过分强调了l1范数的稀疏性在人脸识别中的重要性,而近年来的研究开始质疑l1范数的准确性,发现大多数研究忽略了协同表示(Collaborative Representation,CR)的作用,因为任意测试样本都是使用所有类别训练样本表示的[9]。Shi等[10]也对稀疏表示的l1范数的有效性产生质疑。Zhang等[11]解释了稀疏性为什么可以进行特征鉴别,通过实验证明了稀疏表示模式分类的有效性不是因为l1范数的作用,而是l2范数正规化的稀疏表示系数直接影响人脸识别的效果,提出了协同表示分类(Collaborative Representation Classification, CRC)算法。

CRC算法是一种比较有效的分类算法,样本和字典的质量对于稀疏表示分类算法的性能有着非常重要的影响,但是在构建完备字典时,首先大量的随机数据仅一次特征选取,并不能捕捉信号内在本质特征,重构具有不确定性,并且对噪声的影响比较敏感[10],忽略了训练样本数据的特征,具有单特征鉴别性较弱的不足之处,并不能满足实际分类中的需求。

MSRC算法[7]针对SRC的单特征鉴别性较弱这一不足,对样本从多个不同外部特征训练字典出发,分别进行相应的稀疏表示;同时根据SRC算法计算外部特征子字典的鉴别性,自适应地学习出稀疏权重。该算法改进了SRC,同时证明了SRC表示具有多重特征。但是MSRC也存在一定的不足:

首先SRC分类算法的识别效力主要是受到稀疏系数的l2范数正规化影响,并且反映出多重特征的重点不是SRC,而是CRC;与此同时,CRC算法作为SRC算法的机理性阐述,一样具有多重外部特征。CRC算法同时具有内部特征和多重的可分解性,并且其内部特征同时发挥着不同的作用,影响分类识别率[9]。因此,本文认为需要根据MSRC算法从协同表示的角度出发,进行不同层次的划分,从外部、内部两个特征层次分别进行改进,发挥不同层次特征的鉴别作用,针对CRC分类效力进一步提升,提高算法分类效力。

基于此本文提出了一种改进的协同表示分类器,以及自适应学习的多特征元素协同表示分类算法(SLMCE_CRC),针对CRC样本提出从特征角度构建特征子字典,并对特征内部子字典进行多重元素分解,算法内部通过不同特征和不同元素分别进行相应的协同表示,通过自适应学习的方式计算不同特征和元素的权重线性加权。与基于自适应权重的多重稀疏表示分类算法不同,首先是从协同表示的角度出发,因为真正反映多重特点的是CRC,并非SRC,所以为了有效提升识别率需要以协同表示分类为基础;其次多重特征并非来自于WSRC所提的外部训练字典,当缺乏有效的特征训练字典时,WSRC算法就无法进行分类,效果比SRC差,为了提升算法的外部适应性,需要从内部多重特征和元素两层分解;并且WSRC算法特征的差异化区分采用简单的平均权重,虽然平衡了不同元素的区分效率,但是忽略了内部特征在分类识别中的贡献率。

因此,本文所提的自适应学习的多特征元素协同表示分类算法

通过单一特征和多特征的多元素分解,从两个层次上划分特征和元素,通过自适应学习的稀疏特征权重和残差元素权重,实现不同特征元素分类效力的区分,以提高算法识别性能。

3 实验与分析

3.1 参数设置

为了验证自适应学习的多特征元素协同表示分类算法的有效性,本文选取FERET Database和AR数据集。FERET Database是由14051张多姿态、光照的灰度人脸图像,是用来验证测试人脸识别算法的标准数据库之一,实验中选取部分人脸数据集,每个人有7张具有不同面部表情、姿态和光照的图像。选取主要人脸面部配准剪裁到大小为80×80。AR Face Database为实验对象。AR Face Database由两个阶段组成,分别代表不同表情和光照变化的人脸数据,包含100不同类每个类14个样本,主要人脸面部配准剪裁到大小为60×43。

针对各数据集,这些样本随机分成两个部分:训练样本和测试样本,两个实验的数据库均含有350个测试样本和350个训练样本,对于所有数据利用主成分分析(Principal Component Analysis, PCA)算法对测试集进行特征抽取,然后通过自适应学习的多特征元素协同表示分类算法(SLMCE_CRC)对测试样本进行分类测试。实验中,将该算法与SRC、CRC、MSRC和SVM进行对比测试算法识别率。对于SRC采用sparselab工具箱求解测试样本的稀疏表示,对于MSRC采取改进的sparselab工具箱进行求解,对于CRC采取CRC_RLS进行解决,并设置λ=0.001,通过不同维度下的识别率对比验证该算法的有效性。

3.2 不同维度下的识别率对比

为了查看自适应学习的多特征元素协同表示分类算法(SLMCE_CRC)在不同目标维度下的鉴别性,在FERET Database和AR Face Database数据集上执行一组实验,目标为对比算法在两个数据库中,相同特征数的约束下,在不同维度d下的识别率。

选取两个实验数据集中700幅不同训练样本图像,先配准剪裁,因而样本集人脸图像可以转化为相应维度的向量,选择特征维数为25、50、75、100、125、150、175、200时,比较SLMCE_CRC、SRC、CRC、MSRC和SVM算法的识别率,实验结果如图1、2所示。

根据识别率结果可知算法识别率均随着维度的增加呈现上升的趋势。当维度较小时,五种算法识别率都较低,相互接近,因为训练样本集中图像具有相似性,不足以实现不同类别的精确区分;但维度不断增加,SLMCE_CRC比SRC、CRC、MSRC和SVM的识别率明显提升,维度>50,识别率明显上升,当识别维度>75时,识别率已经超过0.8,证明了算法的有效性,并且随着维度的增加,SLMCE_CRC识别效果提升显著。由于MSRC算法仅受到训练字典的影响,在相同条件下SLMCE_CRC的高识别率是多元素字典和残差权重的综合作用,使该算法具有较好的分类效果。

3.3 不同元素下的识别率对比

为了查看自适应学习的多特征元素协同表示分类算法(AWMCE_CRC)在不同目标元素下的鉴别性,FERET Database和AR Face Database数据集上执行一组实验,目标为对比算法在两个数据库中,针对不同元素数下的图像识别率。先配准剪裁到大小为20×20的图像,因而样本集人脸图像可以转化为400维的向量,分别选取700个样本数据。选取面部部分元素(眼睛、鼻子、嘴等元素),目标为对比算法在相同维度约束下不同元素个数对识别率的影响。

由图3、4结果可以看出:SLMCE_CRC算法分类识别率超过SRC、CRC、MSRC和SVM算法;并且元素个数的增加,对其他算法的运行和识别率影响并不大,而该算法的识别率出现明显提升。选取人脸元素的识别率也是随着元素增加而提升;同时,选取局部人脸元素时,SLMCE_CRC算法的识别率比原始SRC、MSRC和CRC算法算法效果更好,这是因为受到元素内部残差加权的作用。

图片

3.4 计算时间对比

为了对比自适应学习的多特征元素协同表示分类算法的运行效率,比较了SRC、CRC、MSRC和SVM算法的计算时间,其中训练样本个数为200,经PCA预处理后数据的维度为300。相应的运行结果如表1所示。可以看出:由于算法中求特征元素权重的步骤比较耗时,计算代价要大于CRC、MSRC和SVM算法。然而,相比于SRC,本文算法仅用同类特征样本构造字典来进行协同表示,能够在保证识别率的前提下大大降低计算复杂度。

4 结语

本文提出了一种将多元素特征应用于稀疏表示理论的分类算法。该算法从训练字典的角度出发,对样本提出多个不同特征元素并分别进行相应的协同表示。同时针对各个特征元素的鉴别性,自适应地学习出特征元素权重并进行线性加权,较一般意义下稀疏表示理论使用全局数据进行稀疏分解有一定的改进。实验结果表明改进算法能够有效提高识别率,当然本文方法也有一定的不足,特征元素的分解不可避免地导致了运算复杂度增加和运算效率的降低。对运算速度和精度方面进一步改进是今后努力的方向。

参考文献:

[1]WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.

[2]LI C G, GUO J, ZHANG H G. Local sparse representation based classification [C]// ICPR 2010: Proceedings of the 20th International Conference on Pattern Recognition. Piscataway: IEEE, 2010: 649-652.

[3]HUANG J B, YANG M H. Fast sparse representation with prototypes [C]// CVPR 2010: Proceedings of the 2010 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2010: 3618-3625.

[4]YANG M, ZHANG L, YANG J, et al. Robust sparse coding for face recognition [C]// CVPR 2011: Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2011: 625-632.