基于三阶帧差的运动特征选取方案(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇基于三阶帧差的运动特征选取方案范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

摘要:为解决行为识别中运动特征提取的问题,该文提出了一种基于三阶帧差的运动特征提取方案,用于提取运动特征中的变化大小、运动变化的一致性、运动方向的一致性等。实验证明,新方法速度快,准确度高。

关键词: 三阶帧差;运动特征;行为识别

中图分类号:TP311文献标识码:A文章编号:1009-3044(2009)25-7073-02

Motion Feature Extraction Based on Three Order Frame Difference

ZUO Xu-hui

(College of Computer Science & Technology, SouthWest University of Science & Technology, Mianyang 621010, China)

Abstract: To solve the problem ofmotion feature extraction in behavior recognition, a new method based on Three Order Frame Difference. The new method can extract the degree of vary motion features, such as size, coherence of motion size, coherence of motion. Experiment shows thatthenew method has a high speed, and veracity.

Key words:Tree Frame Difference; Motion feature; Behavior Recognition

运动特征的提取是智能视频分析的关键步骤,只有快速、正确地提取到视频中的运动特征信息,才可能获得对视频行为模式的正确识别。近年来,人们对视频运动特征的提取日渐关注。利用旋转目标高分辨一维距离像的长度变化特性, 文献[1]提出了提取目标旋转半径和旋转速度等微运动特征的新方法. 通过对运动特征提取算法进行研究,文献[2]设计并实现了一个实用的全局运动特征和局部运动特征提取模块。文献[3] 根据导弹目标运动方式及其回波特点,提出了一种基于一维距离像的运动目标特征提取方法。在对回波进行全去斜率处理后获得目标一维像。文献[4] 采用基于特征的光流法,由单面冠状动脉造影图像序列估计二维血管的运动。类似研究还有很多,这些方法的特点是针对某一个特定的场景或问题有效,缺乏通用性,并且算法复杂性较高,影响行为识别的整体效率,为解决这些问题,本文提出基于三阶帧差的运动特征提出方案。

1 帧差与运动

从理想状态来说,视频中没有帧差即没有运动,即当场景中所有物体静止时,视频帧差为0。设相邻两帧为F1、F2,运动强度为Q,他们的帧差为U则有:

U=0,若Q=0。

即:U=0,则有F1=F2,U随Q增大而增大。

一阶帧差直接反映了视频中运动的像素,所不足的是,一阶帧差不能体现运动的变化,即物体本身的受力情况。实际上,我们在考虑运动时通常更关心它的变化,没有状态变化的匀速运动没有太大实用价值。为获得运动的变化情况,可以使用二阶帧差提取信息,若对象运动为均速运动,则二阶帧差保持不变,若对象运动加速,则二阶帧差较大,相反,则二阶帧差会减小。

物体运动速度变化体现的是物体的受力情况。若一个物体受力情况不变,则其运动变化也不值得关注,更值得关注的是物体受力的变化,在视频中则是说二阶帧差的变化,也就是三阶帧差。若相邻三帧为F1、F2、F3,则它们的三阶帧差D(F1,F2,F3)可以使用以下公式表达:

D(F1,F2,F3)=abs(D(F1,F2)-D(F2,F3))=abs(abs(F1-F2)-abs(F2,F3))

2 运动特征的选取

如上所述,视频的三阶帧差体现的是运动变化的趋势,因此,基于三阶帧差进行运动特征提取比较方便。本文分别使用积分、值分布直方图、位置分布直方图来提取运动特征中的变化大小、运动变化的一致性、运动方向的一致性等特征。

显然,三阶差分的积分越大,说明了视频对象的受力变化越快,视频对象的运动稳定性越差。

三阶差分的值分布体现了物体间运动变化的分布情况,分布范围越广,物体间的受力情况越多,从而可知视频的运动一致性更差。

物体受力的位置越多,则其运动越复杂,方向越多,因此三阶差分的位置分布情况直接反映视频方向运动的一致性。

3 运动特征的表达

如何选择特征来充分表达运动成为行为理解的关键问题之一。一般是尽可能选择较多的特征或者是在连续特征的典型匹配过程中引入人运动模型的简化约束条件来减少、消除歧义性。但如果选取的特征过多、特征向量维数过大,则会增加计算的复杂度;而选择特征过少,又可能不足以识别与理解人行为,而引入人运动模型的简化约束条件与一般的图像条件却又是不吻合的。因此,能否借鉴人类的学习、识别与理解机理,定义一个动态特征模型,首先提取有关行为的主要特征,当这些特征不足以完成识别与理解时,系统逐步提取候选的细节特征;另外一种更好的办法是使用行为的二维表达捕捉行为的视觉不变特征,那样对行为理解不会引起歧义。但是如何选择视觉不变特征却又是一项很困难的任务。此外,提取特征的不稳定性也为行为理解带来很大的困难,但多模特征融合将为行为理解提供一种很好的解决办法。例如在某些环境中,可视信息受干扰,变得敏感不可靠时,声音特征将为基于视频的行为理解提供一个很好的补充;在遮挡的情况下,基于多摄像机信息融合方法由于能够很好地解决遮挡问题,在行为理解研究也将会得到快速的发展。

对于运动特征表征来说,不同复杂程度的运动通常会采用不同的运动表达方法,即使是同一种动作在不同的场合,由于快慢速度不一致等都会产生不同的时空关系。如何表征这些细微的时空变化并没有一个很好的办法。一个可行的办法是采用多分辨率的方法来表征和分析运动,但计算量较大。采用基于特征的光流法,由单面冠状动脉造影图像序列估计二维血管的运动.从连续的两帧图像中提取出动脉主要分支的中心线,沿中心线采用光流法计算出血管以及相关心外膜的运动参数.

4 实验结果

为验证三阶帧差提出运动特征的有效性,本文利用三阶帧差法进行了视频行为分类实验。实验设备为Intel 2.8 G CPU,512M内存的个人笔记本电脑。实验结果表明,新方法不公实验识别率高,而且速度快。

对akiyo, football, carphone, foreman, news等视频进行分类实验发现,当视频帧在50帧以上的时候,基于三阶差分的行为分类可以达到10%的准确率。

而且各视频的测试速度均很快,平均处理时间小于秒/25帧,也就是说,新系统完全可以适应适时计算的要求。

5 结论

根据理论推导与实验证明,本文提出的三阶帧差法提取特征速度快,效果好。若能将三阶帧差进一步分解,则可以提取其它运动特征。三阶帧差法提取运动特征可以提高基于视频的行为识别的精度与速度。

参考文献:

[1] 马梁, 王涛, 冯德军, 等. 旋转目标距离像长度特性及微运动特征提取[J]. 电子学报, 2008, 36(12): 2273-2279.

[2] 张培珍,沈玉利,江华俊. 视频运动特征提取模块的实现[J].计算机工程与设计, 2006, 27(10): 1780-1781.

[3] 冯德军, 陈志杰, 王雪松,等. 基于一维距离像的导弹目标运动特征提取方法[J]. 国防科技大学学报, 2005, 27(6): 43-46.

[4] 孙正, 郁道银, 陈晓冬,等. 冠状动脉造影图像序列中血管运动特征的提取[J]. 天津大学学报, 36(6): 739-742.

基于三阶帧差的运动特征选取方案

优秀范文

精选范文