首页 > 范文大全 > 正文

基于自适应肤色模型与运动特征的动态手势检测

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于自适应肤色模型与运动特征的动态手势检测范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:提出一种基于自适应的皮肤颜色模型与手的运动特征的改进的动态手势检测方法。其中自适应皮肤颜色模型的建立结合基于YCbCr限定肤色区间模型与基于HSI自适应颜色直方图法,主要解决多种光照,复杂背景,不同用户条件下的皮肤分割问题。通过帧间差分法和面部排除法相结合,得到帧间手的运动,进而在分割的皮肤区域中提取手,有效解决头部运动情况下手的定位问题。

关键词:动态手势检测 皮肤分割 自适应肤色模型 运动特征

中图分类号:TP391.41 文献标识码:A 文章编号:1007-3973(2013)004-098-02

手势在人类的非语言交流中扮演着非常重要的角色,它能表达命令(如“停止”,“过来”),情绪状态(如“胜利”手势),或者是基本的数字信息(如“1”,“2”)。除此以外,在一些特定情况它也是唯一的交流方式,如聋哑人的手语和警察指挥交通的手语。如果能将这些简单的手语引入到人机交互中,能够极大增强用户的体验,因此基于手势的交互系统的研究引起业界的广泛兴趣。

手势检测是手势交互式系统的基础,其实质是确定特定手势在视频流中出现的时间与空间位置。目前精确手的检测仍是一个重要而且困难的问题,本文采用基于肤色的手的检测方式和运动特征相结合的方式检测手势。在进行皮肤区域分割时,本文采用了文献[1]的皮肤分割方法。当从皮肤区域中提取出手部区域的信息,文献[2]和[3]分别用手的运动特征和头部排除的方法提取手,实现简单,而且具有比较高的提取精度,结合本文的研究的是动态手势检测,所以可以借助运动特征来进行分割。

1 自适应皮肤分割与检测

本文选用了两种皮肤颜色模型进行皮肤区域与非皮肤区域的分割。一种是在YCbCr颜色空间下的皮肤颜色区间模型,这种模型只是简单地限定了皮肤像素的颜色值范围,其优点是对皮肤区域分割简单快速。但是,这种模型的皮肤颜色值范围是预先设定,如果范围过大,会检测到颜色相近(比如红色或者棕色)的对象;范围过小,又会导致检测失败。为了解决这个问题,本文引入了一种颜色信息自适应模型,即基于颜色直方图分类的方法,可以在系统运行时实时检测人脸获得人脸皮肤像素,自适应修改颜色直方图,有效克服了背景中的红色或者棕色对象的影响,同时能够适应在不同的光照条件和不同的用户下系统的正常使用。

1.1 基于YCbCr的皮肤颜色区间模型

一般来说,为了减少光照的影响,本文使用非线性的YCbCr颜色空间,YCbCr中光照分量被集中在Y分量中,而Cb和Cr分别被定义为蓝度分量和红度分量,代表颜色信息。由RGB颜色空间转化为YCbCr颜色空间的计算公式如下:

(1)

为了能够获得较好的皮肤分割效果,本文忽略了Y分量,从而减少光照多样性的影响,只使用Cb和Cr两个色度分量代表肤色信息。大量的研究表明皮肤颜色可以被聚集在一个很小的CbCr颜色空间内,通过设定CbCr的范围能够得到比较好的皮肤分割效果。本文实验设定的CbCr值如下所示:

1.2基于HSI的颜色直方图分类模型

颜色信息自适应模型的核心思想是通过人脸检测获得脸部区域的像素建立特定的皮肤模型。为了使该皮肤模型得到更好的检测效果,需要选择合适的颜色空间和建模方法。本文选择HSI(Hue,Saturation,Intensity)颜色空间与基于直方图的分类器相结合提供最高的皮肤检测性能。模型建立时首先将RGB图像转换为HSI图像,然后建立基于HSI颜色空间的统计直方图。为了更精确地分类一个像素颜色为皮肤类或者非皮肤类,本文为皮肤区域和非皮肤区域分别建立颜色直方图。皮肤颜色直方图定义为 s,非皮肤颜色直方图定义为 ns。通过一个可靠的人脸检测器,将训练数据中面部区域以内的像素假设为皮肤像素,分配到 s的相应区间中;在面部区域以外的像素假设为非皮肤像素,分配到 ns的相应区间中,由此本文可以得到每种颜色值像素在 s和 ns分布情况。然后就可以通过公式(2)(3)计算一个给定像素的颜色值属于皮肤类和非皮肤类的概率:

(2)

(3)

其中, s[h's'i']表示皮肤颜色直方图中颜色值为hsi的像素的个数, ns[h's'i']是等价的来自于非皮肤颜色直方图,Cskin和Cnon-skin分别表示在皮肤颜色和非皮肤颜色直方图中总的像素数。通过公式(2)和(3)可以得到颜色值hsi类条件概率,至此一个使用贝叶斯最大化相似度方法的皮肤分类器被建立,一个图像像素如果满足公式(4),则被分类为皮肤。

(4)

通过实验,当T=0.3时,可以得到比较高的皮肤分割效果。

第一个模型由于所设定的CbCr值范围过大,当背景中有红色对象时,会被错判为皮肤像素,背景中的红色条幅被错判为皮肤区域。第二个模型能够在多种光照条件下检测皮肤像素,但是产生比较多的噪声。因此本文可以通过将两幅图像逐点相与的方式来降低错分率,得到比较精确的皮肤区域。

2 手部区域提取

本文选用了两种解决方法:其一,面部排除法,假设现有皮肤区域只有脸部和手,可以将人脸从现有的皮肤区域中排除,手部区域被保留;其二,帧间差分法,利用手的运动特征提取手,假设头部不运动或者只有轻微运动,通过当前帧图像减去前一帧图像就将头部区域排除。方法一的优点是无论头部区域是静止还是运动,背景有无运动对象,都可以在当前帧图像中提取手部区域。缺点是因为需要在每帧图像中检测人脸,所以计算量很大。方法二的优点是在视频帧中利用手的运动特征提取手,而且通过帧间差分法能够移除边缘噪声,比如说面部区域和其他接近肤色的对象,实现简单;缺点是限制了头部运动,需要保证背景中没有运动的对象。

综合以上的两种方法的优缺点,本文提出了将方法一和二结合。为了保证算法的实时性,当图像中手部的候选区域多于一个时,才使用人脸检测器排除头部区域,然后通过帧间差分法提取手。通过结合帧间差分法和面部排除法,能够适应复杂背景下的头部运动时手的提取和定位。

3 结论

本文引入了一种基于自适应的皮肤颜色检测与手的运动特征的改进的动态手势检测方法。通过实时地人脸检测获得皮肤的颜色模型,结合YCbCr空间下的肤色范围,有效地解决了在多种光照,相似颜色背景,不同用户条件下的皮肤分割问题。通过帧间差分法和面部排除法相结合,得到帧间手的运动,从而在分割的皮肤区域中提取出手,解决了头部运动情况下手的定位问题。

参考文献:

[1] Van Den Bergh,M,Koller-Meier,E.,BoschF.,Van Gool,L.Haarlet-based Hand Gesture Recognition for 3D Interaction[J].2009 Workshop on Applications of Computer Vision,WACV 2009:190-198.

[2] Chia-Hung Yeh,Shu-Jhen Fan Jiang,Jia-Chi Bai,Jia-Sian Liou,Ruey-Nan Yeh, Sun-Chen Wang,Po-Yi Sung.Vision-Based Virtual Control Mechanism via Hand Gesture Recognition[J].Journal of Computers,2010:55-66.

[3] Xu Wenkai, Eung-Joo Lee.Continuous Gesture Trajectory Recognition System Based on Computer Vision[J].Applied Mathematics & Information Sciences,2012:339-364.