首页 > 范文大全 > 正文

基于DT-CWT和SVM的人脸图像集成分类方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于DT-CWT和SVM的人脸图像集成分类方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要: 利用二元树复小波变换对人脸图像进行5尺度小波分解,并提取每一尺度下6个方向高频子图小波系数模的均值和标准方差组成60维的特征向量表征人脸,然后采用支持向量机的一对一分类算法对ORL人脸图像库进行分类实验,结果表明二元树复小波变换和支持向量机的集成方法能有效提高人脸图像的分类精度.

关键词: 人脸识别; 二元树复小波变换; Gabor小波变换; 支持向量机; 特征提取

中图分类号:TP391.41

文献标识码:A文章编号:1672-8513(2010)05-0313-04

Integration Classification Method of Face Images Based on DT-CWT and SVM

XIE Hongsheng1, WANG Lianguo2

(1. Information Technology School, Shandong Womens University, Jinan 250300, China; 2. College of Sciences, China University of Mining & Technology, Xuzhou 221008, China)

Abstract: The dual-tree complex wavelets transform was used to decompose face images with 5 scales, then 60-dimensional feature vector was generated by computing the mean and standard deviations from wavelet coefficients of six-direction high-frequency subbands of each scale, and the classification experiment was done by using one vs one algorithm of the support vector machine based on ORL face image database. The tests results show that the method of integrating the dual-tree complex wavelets transform with the support vector machine can effectively improve the classification accuracy of face images.

Key words: face recognition; dual-tree complex wavelets transform; Gabor Wavelet Transform; support vector machine; feature extraction

人脸识别是非常实用的一种生物特征识别技术,一直是计算机视觉和模式识别领域的重要研究课题,在身份识别、证件验证、安全防范等领域有着广泛的应用.1988年Galton[1]在《Nature》上发表利用人脸进行身份识别的文章并首次提出了正式的人脸识别方法,随着技术进步和应用需求的增加,涌现了许多有效的特征提取和识别方法,其中经典的Eigenfaces和Fisherfaces方法无疑是人脸识别中里程碑式的工作,但存在计算量大的不足[2-3].

在人脸特征表示方面,由于Gabor特征对人类图像优异的表征能力,Gabor小波变换特征提取方法得到了广泛研究和应用[4].Liu等[5]证明了Gabor小波表示和线性判别方法相结合的识别方法能有效表示人脸特征,但实验发现选择合适的频带需依赖于图像本身的频率特性,实现完整的Gabor小波变换展开需要的滤子数目很大而不切实际,计算和存储开销巨大.Kingsbury[6]提出的二元树复小波变换(Dual-Tree Complex Wavelets Transform,DT-CWT)具有近似平移不变性、良好方向选择性、有限数据冗余和高效计算效率等优点,与Gabor小波相比,DT-CWT借助实数离散小波变换的可并行处理和快速算法,显著降低了运算复杂度,其完备重构特性保证了图像信息的完整性,研究证明DT-CWT在表示人脸图像时要优于Gabor小波[7].支持向量机(Support Vector Machine,SVM)是建立在统计学习理论的VC维理论和结构风险最小化准则基础上的一种机器学习方法,在处理高维度、小样本、非线性问题时具有独特优势[8].根据人脸识别的应用特性,本文将集成DT-CWT和SVM方法进行人脸识别的研究和分类验证.

1 二元树复小波变换

DT-CWT是基于实数小波变换实现复数小波变换,通过2个并行的实数滤波器组得到实部和虚部系数,即基于对偶树的dt-cwt中由2棵平行的小波树组成,每棵树对应的滤波器是传统小波变换的双正交滤波器,其中一棵小波树是奇数长的高通滤波器,其采样序列的中点偶对称;另一棵小波树是偶数长的高通滤波器,其采样序列的中点奇对称,它们交替奇偶滤波得到的输出分别对应的是复小波变换的实部和虚部[9].

相对于传统的实离散小波变换,DT-CWT具有近似平移不变性、良好的方向选择性、有限的数据冗余、完备重构及计算复杂度低等优点,DT-CWT可以区分频率空间的不同部分,兼具了平移不变性和方向选择性.DT-CWT在每一个尺度分解下生成6个复系数高频带子图,它们分别代表±15°,±45°和±75°方向的脉冲响应.图1为DT-CWT滤波器的脉冲响应图示,从中可看出DT-CWT具有很好的空间频率局部特性,适合用来提取图像各个方向上的空间局部特性.

2 支持向量机

svm是从线性可分情况下的最优分类超平面发展而来的,图2所示两类二维线性可分情况,图中实心圆点和实心方框分别代表2类样本点,由图2(a)可见,存在无数的直线可以正确分开2类样本.而支持向量机的目的是寻找图2(b)中的最优分类线H,图中H1,H2分别代表2类样本中离H最近且平行于H的直线,H1与H2之间的距离称为2类的分类间隔(margin).所谓的最优分类线,就是要求该直线不但能够将2类样本正确分开(即训练错误率为0),而且使2类样本中离分类线最近的点到最优分类线的距离最大,即使分类间隔最大.将其推广到高维空间,最优分类线就成为最优分类面[8].

设线性可分样本集为(xi,yi),i=1,…,n,x∈Rd,y∈+1,-1是类别标记.d维空间中线性判别函数的一般形式为g(x)=w・x+b,分类线方程为[w・x]+b=0,可以对判别函数进行归一化,使得对线性可分的样本集合(xi,yi),满足yi[(w・xi)+b]≥1,i=1,2,…,n的约束条件,此时分类间隔等于2w,当w最小时,间隔2w取得最大值.满足上述条件并且使12w2最小的分类面叫做最优分类面,H1,H2上的训练样本点称作支持向量.从而将最优分类面的求取问题转化为下面的约束优化问题:

[JP3]minφ(w)=12w2=12wT・w,s.t.yi(w・xi+b)≥1,i=1,2,…,n.[JP][JY](1)

这是二次规划问题,其最优解就是如下定义的Lagrange函数的鞍点:

[JP5]L(w,b,α)=12w2-∑ni=1αi(yi(w・xi+b)-1) .[JP][JY](2)

上式分别对w 和b 求偏导,并令它们等于0,原来的求解问题转化为它的对偶问题, 根据Kuhn-Tucker条件,可知这个最优解还必须满足以下约束条件: [JP3]αi(yi(w・xi+b))-1=0,i=1,2,…,n.[JP][JY](3)

最终可得到判别函数为:

f(x,a′,b′)=sgn(∑ni=1yiα′ixi・x+b′). [JY] (4)

对于线性不可分的情况,可以引入松弛变量,在求解最优解的限制条件中加入对松弛变量的惩罚函数,目标函数(1)中的φ(w)改写为:

minφ(w)=12wT・w+C(∑Ni=1ξi) .[JY](5)

[HJ1.9mm]在学习样本是线性不可分情况下,SVM通过非线性映射φ将其转化成另一个高维空间的线性分类问题,求出最优分类面.[JP+2]根据线性可分情况下目标函数只包括样本支持向量内积的特性,可利用核函数K(x,y)代替原最优分类函数中的点积(x,y),常用的核函数有线性、多项式、径向基和Sigmoid核函数,选定一个核函数后,最优分类函数成为:[JP]

f(x,a′,b′)=sgn(∑[DD(]ni=1[DD)]yia′iK(xi,x)+b′).[JY](6)

3 算法实现

为了验证算法的有效性,本文实验使用了ORL人脸图像库(the Olivetti and Oracle Research Lab’s Face Database)进行计算机仿真.该人脸库有40个人共400幅(每人10幅112×92像素的灰度图像)图像,分别具有不同的光照、表情和姿态,并且有一定的侧转角度,图3给出了10幅图像示例.算法实现步骤如下:

1)选择样本:根据人脸表情、视角及光照条件的不同,从ORL中每人选择其中5幅图像作为训练样本,另5幅为测试样本,这样训练集和测试集分别由200幅人脸图像组成.

2)特征提取:利用Matlab 7.0实现了DT-CWT人脸特征提取,利用DT-CWT对1)中样本集的每幅图像块进行5尺度小波分解,然后对每一尺度下的高频带子图计算6个方向小波系数模的均值μi,j和标准方差σi,j,i=1,2,3,4,5,j=1,2,3,4,5,6,由此生成60维的特征向量来表示1幅人脸图像,由此分别生成200×60的训练和测试特征向量集.其中,均值和标准方差的计算公式分别为:

均值: μ[KG-*4]=1N2∑Ni,j=1coef(i,j),(7)

标准方差: [JP3]σ=1N2-1∑Ni,j=1(coef(i,j)-μ)2.(8)

3)训练分类器:SVM分类器采用台湾大学林智仁等开发的分类软件BSVM2.06[10],它支持one-vs-one的多类分类算法.首先利用2)中的训练特征向量集对SVM支持的线性核函数、多项式核函数、径向基核函数进行了测试,测试结果发现径向基核函数的平均分类准确度最高为96%,阶多项式核函数在95%左右,线性核函数为965%.本文采用了线性核函数训练SVM分类器.

4)图像分类:利用3)中训练生成的SVM分类器对测试特征向量集进行分类实验.

4 实验结果与分析

从以上实验中可以看出,不同核函数及其参数选择对SVM的分类精度有一定的影响.基于以上测试,本文采用了线性核函数对人脸图像进行分类实验,然后对每类图像的分类准确率和全部图像的平均准确率进行了统计分析,结果如表1所示.

本文方法的平均正确率为96.5%,与文献[7]中同等条件下(每类人脸图像为5个训练样本和5个测试样本)9种方法的分类识别率相比,比DCF的99%和GF的98%略低而高于其他7种方法,但是DCF和GF方法中均利用了计算复杂度较高的Fisherface算法,GF方法中基于Gabor变换的特征提取算法的速度也低于DT-CWT;DCF虽然采用了DT-CWT方法,但是它利用所有尺度和方向的幅值系数构造一个大矩阵,之后进行归一化操作,同样需要较大的资源开销和较长的运算时间.而本文方法只计算各个高频子图小波系数模的均值和标准方差,运算简单且所需资源开销和计算复杂度较低,运算速度快而更具实用性.

5 结语

本文采用SVM和DT-CWT提取了人脸图像局部特征并利用ORL人脸图像库进行了一定的理论分析和分类实验,表明结合DT-CWT和SVM优良特性的集成方法适合人脸图像特征提取和分类,其较低的计算复杂度和较高的分类正确率值得深入研究和推广.

下一步将对DT-CWT与隐马尔可夫模型[11]的结合方法用于人脸识别进行深入研究,同时对SVM参数的合理选择进行分析验证.

参考文献:

[1]GALTON F. Personal identification and description[J]. Nature, 1888, 21: 173-177.

[2]TURK M, PENTLAND A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience, 1991, 3(1): 71-86.

[3]BELHUMEUR P, HESPANHA P, KRIEGMAN D. Eigenfaces vs Fisherfaces: Recognition using class specific linear projection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711-720.

[4]SHEN L, BAI L, FAIRHURST M. Gabor wavelets and general discriminant analysis for face identification and verification[J]. Image and Vision Computing, 2007, 25(5): 553-556.

[5]LIU C, WECHSLER H. Gabor feature based classification using the enhanced Fisher linear discriminant model for face recognition[J]. IEEE Transactional Conference on Image Processing, 2002, 11(4):467-476.

[6]KINGSBURY N G. The dual-tree complex wavelet transform: a new efficient tool for image restoration and enhancement[C]//Proceedings of the EUSIPCO’98. Rhodes, 1998, 319-322.

[7]黄中美, 张小洪, 杨丹.基于二元树复小波特征表示的人脸识别方法[J]. 计算机应用, 2007, 27(5): 1135-1137.

[8]VAPNIK V N. 统计学习理论的本质[M]. 张学工,译.北京: 清华大学出版社, 2000.

[9]尚赵伟, 张明新, 赵平,等. 基于不同复小波变换方法的纹理检索和相似计算[J]. 计算机研究与发展, 2005, 42(10) : 1746-1751.[ZK)]

[10][ZK(#]CHANG C C, LIN C J. LIBSVM: A library for support vector machines[EB/OL]. [2001-01-01]www.csie.ntu.edu.tw/~cjlin/libsvm.

[11]谈昌彬, 李一民. 基于EHMM的人脸识别[J]. 云南民族大学学报:自然科学版, 2006, 15(4): 285-288.