首页 > 范文大全 > 正文

基于残差值的视频压缩运动估计策略

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于残差值的视频压缩运动估计策略范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:运动估计技术作为影响整体压缩速度的关键过程,一直是视频研究的重点。文章通过相邻宏块间运动向量的相关性与残差值的相似性,采用不同的搜索模板,在大幅度减少运算时间的情况下保持了与高精度搜索算法相同的搜索精度。关键词:视频压缩;运动估计;搜索模板;残差值

0引言

评价视频压缩技术的最关键指标就是清晰度、压缩率和计算的复杂度。对于新一代的数字电视,也称作高清数字电视,图像的质量是第一重要的。另外,现在电视频道和电视节目的数量都大幅度地增长,自然大大加重广播网络的负载,如何提高压缩率减少带宽就成了另一个需要重点考虑的问题。此外,为了节省电视节目的制作成本,视频的压缩设备都会尽量采用低廉的硬件,所以压缩算法也要尽量简单。

在视频压缩中,采用运动估计的方法提取时域上的冗余度对压缩率的贡献最为重要,但同时运动估计也是计算量需求最大的部分,因此出现了许多优秀的快速运动估计算法,也叫运动搜索算法。它们大致可以分为两类:一类是简单预测点方法。因为这类算法实现比较简单,需要的硬件配置要求不高,所以都应用在视频会议,可视电话等领域。另一类是高精度的搜索方法。主要适用于高码率和高清晰的广播领域,如高清电视,DVD等。这类应用对图像的质量要求十分严格,因此相应的算法在简单预测点方法的基础上增加了许多不同的搜索模板,用以减少搜索中止在局部最优位置的可能性。

1基于差值的运动估计策略

简单的快速算法属于基于预测点的搜索算法。这类算法是在搜索区域中,有条件地选定几个位置作为初始的搜索位置,这些被选中的初始搜索位置也叫作预测点,然后在这些预测点上应用一些简单的搜索模板,如钻石型,方型和六角型进行搜索。图1就是这类算法的一个示例。

这类算法搜索成败的关键就是预测点的选择。当前最常使用的预测点分两类。一类利用运动向量空间相邻性,把左、左上、上和右上宏块的运动向量以及它们的中值运动向量作为预测点。另一类利用了运动向量的时间相邻性,把前后相邻帧的运动向量作为预测点。这种基于预测点的搜索方法执行速度是十分快的,可以把每个运动向量的搜索位置控制在10左右。

但有三种情况大大地影响这种简单搜索方法的精度。首先,如果当前的运动向量与相邻的运动向量都没有关联,而预测点与实际的运动向量相差甚远,简单的搜索方法很容易就会中止在某一个局部最优的位置上。这种情况经常发生在视频场景切换的时候。其次,采用基于预测点的搜索方法,位于图像边缘的运动向量在极大程度上会影响所有运动向量的搜索。因为视频编码通常是采用光栅扫描的顺序,由上自下逐行扫描,顶行的运动向量和最左列的运动向量都直接或间接地成为其余运动向量的预测点,这些基本预测点的精度同时也影响了其余运动向量的精度。第三,对特征不明显的宏块进行搜索,例如一堵墙或一块布,不同位置所得到的残差值都是十分接近的,所以在这些位置上搜索出来的运动向量有一定的混乱性,利用它们作为其他运动向量的预测点是非常不适当的。

为了解决上述三个问题,本文提出一种自适应搜索模板的运动估计算法。虽然简单快速算法利用了时间和空间上相邻运动向量之间的相关性,但通过实验发现,相邻宏块之间的残差值也有很强的相关性,同时,宏块间的运动向量越接近,宏块与宏块间的残差值也会越相近。根据这个特性,在运动估计的过程中,可以通过比较当前位置的残差值与相邻宏块的残差值来判断当前运动向量是否是最终的运动向量。另外,通过残差值的相关性还可以决定当前使用的搜索模板,当残差相关性低的时候,就采用复杂的搜索模板,反之,当残差相关性高的时候就采用较为简单的搜索模板。这样就可以防止在使用小模板搜索时最终的运动向量落在局部最优的位置上。

2实验结果

本文使用的测试平台是H.264的参考模型(JM)10.2,其中除了第一帧为I帧外,余下的都作为P帧。帧内的运动预测使用了JM中提供的快速算法。运动预测范围是±8像素,不使用哈达玛变换,并且应用了快速的率失真优化的快速选项。参考帧的数目为JM中可以选择的最大数目――5帧,帧间的运动预测只使用16×16的模式。编码方式采用上下文自适应算术编码方式,运动向量的精度为1/4像素。表l提供了本文算法与H.264 JM中三种运动估计算法:Full Search,UMHexagonS,EPZS比较的结果。

从表l的数据可以看出,本文的算法在信噪比和码率基本不变的情况下,速度比JM提供的标准算法有很大的提高。

3结束语

本文通过分析简单搜索算法的不足之处,提出了一种自适应搜索模板的运动估计策略。这种方法通过结合运动向量与残差值之间的相关性,根据视频的内容自动调整搜索所需要模板的复杂度,克服了单一采用固定方式进行运动估计的缺点,在准确度上接近于高精度算法,而在运算速度上接近于简单算法。实验表明,本文提出的基于残差值的运动估计方法,在相同码率和相同质量的情况下,能比其它算法大大节省搜索时间。

(注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。)