计算机视觉——行人检测方法改进(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇计算机视觉——行人检测方法改进范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要：该文在阐述行人检测方法改进的主要思路、范围和方法的基础上，进一步对行人检测所使用的统计方法和特征进行了分析比较，提出了基于融合分类器的行人检测算法，并在检测前先进行前景标注，然后再在带标注的图像上进行行人检测。

中图分类号：TP391.41文献标识码：A文章编号：1009-3044(2012)22-5341-03

Computer Vision—Improvement in Pedestrian Detection

DU Wen-lu

(Colledge of Japanese & Software Engineering, Dalian Jiaotong University, Dalian 116052, China)

Abstract: This passage is about pedestrian detection and its improvement concerning its main idea, scope and method. The pedestrian detection based on statistical methods are analyzed and combined with the characteristics. The method of merged classifiers which can improve the detection rate on the condition that the performance will not decrease is used in this experiment. A marking foreground method is proposed that the foreground is extracted and marked, so that only the foreground pixels are detected instead of all of the image at the detection stage, which can improve the accuracy of detection, and make the detection speed more faster.

Key words: computer vision; pedestrian detection; improvement; merged classifiers

计算机视觉对于人类的影响是重大的，它伴随着计算机的蓬勃发展成为了一个不可或缺的分支。毫无疑问视觉信息在我们的日常生活中具有重要的地位。如果计算机能够像人类那样理解摄像机捕捉到的视觉信息，则会给我们的生活带来巨大的影响和帮助。然而目前对于计算机视觉的研究还不是很成熟的，比如小孩到了4、5岁的时候就能在轻易地分辨出图像卡片中的树、人、车等不同类别的物体，还能区别不同的树，如杨树、柳树、果树等，在这方面，计算机明显还存在着巨大的不足之处。

该文针对计算机视觉中的行人检测部分做了深入的研究，力求能让计算机能够高速高质量的辨别一段视频中的人。下面详细的对所做的实验的方法以及结果做以介绍。

1行人检测方法改进的主要思路

实验的主要思路为在行人检测研究时，根据现有的级联分类器的不足之处，提出了融合两个级联分类器来进行行人检测的方法。具体采用了表观特征向量来描述人体，并结合统计学习的分类方法来检测视频中的行人。为了保证融合分类器的检测性能和实时性，融合的两个分器分别选取了类Haar特征分类器和Shapelet特征分器，前者作为第一级分类器，后者作为第二级分类器。提出了使用Haar-like结合人体头肩的特征和Shapelet结合人体头肩的特征来描述人体；在分类器训练时，采用的是Gentle-Adaboost机器学习算法；并且为提高分类器检测速度，首先对视频序列进行了前景标注，采用背景差分将前景点标注出来，这样在检测时只需检测前景点即可，减少了大量背景上的检测时间。该文检测方法的具体流程如图所示。

图1行人检测具体流程图

2研究的范围与方法

2.1本实验主要研究的是静态背景下的行人检测

根据拍摄的摄像头的情况，可以将运动目标检测的研究主要分为两大类：动态背景情况下的目标检测与静态背景下的目标检测。前者主要是在拍摄的过程中，摄像头是跟着目标前进，后退等方式移动的，背景环境因此也是不断变化的；后者情况下，摄像头是固定的，相对于目标场景来说是静止的，因此背景环境是相对不变的。而视频监控系统中使用的大多数方式便是固定摄像头，所以本实验主要研究的是静态背景下的目标检测。

另外此实验是基于统计方法的行人目标检测。采用统计分类学习来研究目标检测问题。该方法通过统计学习获得的分类器某个类别目标的检测器（例如人脸、汽车和行人等），然后根据得到的检测器来进行目标检测。基于统计方法的目标检测方法一般被分为两个阶段：离线检测模型的训练和在线目标检测阶段，在离线训练阶段，首先要收集大量的样本，包括与正样本和负样本，正样本指包含着目标类别的图像，负样本指不包含目标类别的图像；接着对收集好的正负样本做标记（用y表示），与正样本标为+1，负样本标为-1；然后对样本进行配准、对齐和大小归一化；再接着在归一化后的正负样本上提取出特征向量x (x∈Rd)，和对应的标签 y一起组成最终用以统计训练学习的特征向量集合S={(x1,y1),…(xN,yN)}；最后使用选定的统计学习方法根据训练数据集S训练分类器的参数以供检测阶段使用。

在线检测阶段首先需要在待检测图像上提取得到与训练阶段使用的相同的特征向量，然后与离线阶段的分类器对该特征向量进行分类差别。由于不知道目标在图像中的大小和位置，因此在检测时需要在不同的尺度和位置对目标进行检测，即需要在不同的尺度位置空间中逐窗口进行遍历判断。。尺度空间通过对图像逐级缩放做金字塔分解（Pyramid decomposition）实现；位置空间通过遍历每个尺度下图像中的每个空间位置实现。因此检测目标时某个尺度下对于目标大小为w×h，图像尺寸为W×H时，需要分类判断的窗口数目约是WH个，数量巨大。在不同的尺度与位置空间进行窗口遍历时，如果该窗口被判别为目标类别，则记录其位置和当前的尺度，否则丢弃，最后将不同尺度和位置上得到的检测结果进行聚类或者最大化抑制输出最终的检测结果。

2.2本实验采用的是基于部件的行人检测方法

行人统计学习算法根据检测方式的不同基本可以分为两类：基于人体整体的统计学习方法和基于人体部件的统计学习方法。前者将整个人体作为特征进行分类器训练，对于待检测图像，其进行整个人体的特征提取，然后再用分类器进行分类即可，而后者则将人体的各个部件均看作是人体的一个特征，然后分别进行分类器训练，得到各自的分类器，在检测时，先检测各个部件，然后根据分析各个部件的相互约束关系来最终做出判决。

本采用的便是第二种方式，基于部件的行人检测方法，但区别于以上的方法，该文采用的是用两种不同的特征分别训练相同的一个部件的方法，最后综合两个分类器的结果做出决策

人体检测中的特征是对目标的描述，是用来有效的区分目标与非目标的，是目标检测的基础，在检测目标的过程中，如果能够提取出有效区分目标类与非目标类的特征，那么检测的性能就会有巨大的提升，相反，如果一个特征不能区分目标类与非目标类，那么有检测时，便不能与待检测的目标很好的匹配，或是与其他物体相似，便可能造成误检。所以，提取什么样的特征来描述目标是目标检测中和首要问题。接下来介绍的是该文主要使用的是类Haar特征和Shapelet特征。

Shapelet特征是通过先局部，后整体的思想，先在局部提取小特征集作为最基本的低层特征，然后通过统计学习算法得出中层特征，最后再由中层特征构成分类器，层层进行筛选，把分类能力较弱的特征一层层筛掉，最后得到包含更多有用信息的特征用来分类，特征的维数相对来说是非常低的，计算也简单；而且特征是由低层特征训练而来，类间的区别能力更强，在基于行人的检测方面，性能尤其卓越，比Dalel的HOG特征算法的误检测率降低了整整10倍。实验已经证明，通过自适应学习而来的Shapelet特征相比其他的固定特征来说，能捕捉到更多有用的用于判别的信息，因而训练出的检测器性能可以达到非常优秀的水平。类Haar特征可以快速的进行行人检测，但是在检测的过程中，由于该特征主要描述的是行人与背景之间的差异性，对于人体内部的差异性描述的精度不够，所以该文采用融合分类器进行行人检测时，先使用类Haar特征训练人体头肩生成的分类器进行检测，可以快速的对非人体目标进行排除。

对于级联分类器来说，级联分类器在检测率，漏检率，虚警率，和时间等性能上的变化，通过一系列实验我们可得知随着分类器级数的增加，在分类器的后面几级中被过滤掉的样本中正样本所占的比率呈直线上升的方式增加。

3行人检测方法改进具体步骤

该文的设计方法均是在OpenCV的基础上，采用Visual Studio 2010实现的。本实验的参数设置如下：正样本和负样本在级联Adaboost分类器中的单级通过率分别为99%和50%。分类器在尺度空间上对检测窗口搜索的步长设定为1.05（经验值）。在实验过程中，Haar特征级联分类器和Shapelet特征级联分类器分别采用了900张正样本和2000张负样本，并对人体的头肩部分做了人工标注，作为训练数据集，训练数据集的归一化大小为20*20。为了增加训练数据集，该文对标准数据库中的正样本进了竖直方向的镜像对称，使正样本的数量增倍。Haar特征级联分类器由20级Adaboost分类器构成，Shapelet特征分类器由10级Adaboost分类器构成。

3.1本实验采用一种新的级联分类器的融合方式

笔者提出一种新的级联分类器的融合方式，以期随着分类器级数的增加，检测率不断提升的前提下，能有效的遏制正样本被过滤掉的概率的增加，以此来增强分类器的性能，使分类器的检测率更加提升。

根据之前的分析类Haar特征运算简单，快速，采用它训练的分类器可以在分类器的前几级快速的排除掉大量的背景区域，但是类Haar特征描述的主要是人体与背景之间的差异性，因此在分类器随着性能的增加，分类器复杂度提高的情况下，在分类器的后几级，类Haar特征对区别与行人轮廓类似的物体时，非常不敏感，很容易将这二者混淆，将行人误判为非行人，或将非行人误判为行人，导致分类器的虚警率和漏检率的增加；而Shapelet特征在基于行人的检测方面，性能则尤其卓越，通过自适应学习而来的Shapelet特征相比其他的固定特征来说，能捕捉到更多有用的用于判别的信息，特别是人体的头肩部分，Shapelet的描述更加的精确，对于区分与行人非常类似的物体，具有很高的性能。

为此，我们采用基于人体头肩部件的类Haar特征和Shaplet特征来训练分类器，根据二者各自的性能，该文先用类Haar特征级联分类器对检测窗口进行分类，在分类器的前面就快速的排除掉大量的背景区域，然后，在分类器的后面几级，对于分类器的排除掉的样本，再用Shapelet分类器来进行分类，将在Haar特征分类器中被漏掉的目标区域检测出来。最后根据两个分类器的结果进行决策。这样就对那些在Haar特征分类器中被错误过滤掉的目标样本进行了二次分类，降低了分类器漏检率的增加。

3.2本实验采用前景标注的方法为了提高分类器的检测速度

我们会在待检测的视频图像上对前景进行标注，在检测的过程中根据标注只需要在前景部分进行行人检测即可，不必在全局图像中进行搜索匹配，这样既可以减少检测的数量，又可以节约检测计算时占用的空间，对于视频分析中时间和空间进行了双重的优化。该文的前景标注的过程主要是：采用背景差分法得到图像的前景，然后对于得到的前景建立一张标注表，与原图像进行对应，在检测时，标注为前景的像素点则在原图像上进行目标检测，若标注为背景，则不进行检测。

图2低分辨率监控视频下的部分实验结果：上层为行走的行人，下层为骑车的行人

4结论

该文通过对行人检测所使用的统计方法和特征进行了分析比较，并分析了级联分类器的特点，得出级联分类器级数越高，在最后几级中被排除掉的样本中正样本的比率上升很快，会引起分类器漏检率的急剧增高，因此，该文提出了基于融合分类器的行人检测算法，该融合方法选择两个级联分类器（分别为类Haar特征分类器和Shapelet特征分类器）进行级联融合；根据监控视频领域中一般情况下都是静态背景，而且为了提高检测的速度与避免背景的干扰，该文提出了在检测前先进行前景标注的方法，然后再在带标注的图像上进行行人检测。

参考文献：

[1]贾慧星,章毓晋.车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J].自动化学报, 33(1):84-90, 2007.

[2] Xu Fengliang,Fujimura K. Pedestrian detection and tracking with night vision. Proceeding of IEEE Intelligent Vehicles Symposium[M]. Versailles, France: IEEE Press, 2002: 21-30.

[3] Munder S, Gavrila D M. An experimental study on pedestrian classification[J].IEEE Trans. Pattern Analysis and Machine Intelligence, 2006,28 (11):1863-1868.

计算机视觉——行人检测方法改进

常用范文

优秀范文

精选范文