首页 > 范文大全 > 正文

像素域Wyner―Ziv视频编码系统性能优化方法

开篇:润墨网以专业的文秘视角,为您筛选了一篇像素域Wyner―Ziv视频编码系统性能优化方法范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘 要:以分布式视频编码理论为基础,对WynerZiv编码方案开展了深入研究。在对典型的边信息生成方法进行分析与比较的基础上,提出了一种改进的多路径边信息生成策略,并提出用错误隐藏技术来对传输出错的关键帧进行处理。实验结果表明,多路径边信息生成策略与运动补偿外推法相比可以生成质量更好的边信息;使用错误隐藏技术可以保证关键帧的传输质量,提高系统的鲁棒性;对错误恢复过的解码帧用多路径边信息生成策略进行边信息生成,使边信息精确度进一步得以提高,实现了对WynerZiv系统进行优化的目的。

关键词:分布式视频编码;WynerZiv;多路径边信息;错误隐藏技术

中图分类号:TP317.4 文献标识码:A 文章编号:16727800(2013)003016003

0 引言

近年来,随着无线通信技术的迅速发展,出现了许多新的视频应用,如移动可视电话、无线PC摄像机、无线视频传感器网络等。同时,在野外军事通信、灾后紧急救援等特定场合的视频传输需求已越来越迫切。这些视频终端有如下特点:需要实时编码传输;编码端计算力、存储容量有限;从客户端的无线化、便携式及电池容量等角度考虑,要求编码端视频压缩算法必须是低复杂度、低功耗的;由于采用无线接入与传输,要求视频信号传输具有强健壮性。这些特点与传统的视频编码系统相比明显不同,传统的视频编码技术面临挑战。

针对上述情况,分布式视频编码(Distributed Video Coding,DVC)被提出并得到快速发展。分布式视频编码是指对两个或多个独立同分布的信源进行独立编码,然后由单一解码器利用信源之间的相关性对所有编码的信源进行联合解码,它使得低复杂度编码成为可能,从而很好地解决了视频编码终端受限的情况。DVC基于Slepian和Wolf(1973)提出的无损分布式编码理论以及Wyner和Ziv(1976)提出的使用译码端辅助信息的有损分布式编码理论。基于这两个理论,对两个统计相关的视频序列进行分布式编码成为可能。其中,编码端对源信号进行独立编码,不进行或只进行非常简单的的运动估计;解码端利用视频序列的时域、空域等相关性进行联合解码,将复杂的运动预测、补偿技术从编码端移到了解码端,即将编码器运算复杂度转移到解码器。分布式视频编码可以取得与传统的预测编码机制(联合编解码)非常接近的编码效率。因此,DVC具有编码简单、解码较复杂、能够实现较为高效的压缩,且抗误码特性好等特点。

1 像素域wynerziv分布式视频编码

本文采用基于像素域的WynerZiv分布式编码方案,采用LDPC信道编码,其编解码框架如图1所示。

该编码系统的主要工作流程是:首先将输入视频序列分为两组,奇数帧为关键帧K,偶数帧对应WZ帧X。对关键帧K使用传统的信源编码技术H.264来进行编解码,对WZ帧X使用WynerZiv编解码器来进行编解码。WZ帧先进行均匀量化,按照量化系数从高到低提取位平面X,送入WynerZiv编码器进行LDPC编码,并将生成的校验位存于缓存器中,根据解码需要依次发送给解码器,解码器根据边信息和接收到的校验位从最高位平面开始进行迭代解码。若根据当前已收到的校验信息仍不能达到预期的解码效果,则通过反馈信道请求编码端传送更多的校验位,解码端再重新进行解码,直至将解码误比特率降低至预定要求。当解码所有的位平面后,再对解码符号流进行重构,得到WZ帧X的重构值。

2 像素域WynerZiv分布式视频编码系统优化

本文对系统性能优化主要体现在两个方面:①提出一种多路径边信息生成策略;②针对实际应用中分布式视频编码关键帧传输可能出错这一现实,提出用错误隐藏技术来对已解码关键帧进行处理,然后再对错误恢复过的解码帧用改进的边信息生成策略进行边信息生成。

2.1 多路径边信息生成策略

边信息就是对当前待解码WZ帧的一个预测估计,目前,国内外使用最多的边信息生成方法主要有运动补偿内插法和运动补偿外推法。运动补偿内插法参考了前后相邻帧之间的运动轨迹,可以生成更为精确的边信息,但会导致一定的时延。外推法主要是使用之前已经解码好的帧来作为参考帧,降低了时延,同时边信息精确度也降低了。

考虑到运动补偿内插法会产生时延、运动补偿外推法产生的边信息质量不高的特点,本文提出一种多路径边信息生成方法,算法详细描述如下:

(1)输入生成边信息的两个参考帧:WZ帧和关键帧的已解码帧X2i-1和X2i+1。

(2)判断生成边信息的序号数。

(3)如果序号数为偶数,则转至第4步;如果序号数为奇数,则转至第5步。

(4)先对X2i-1和X2i+1使用块匹配算法进行前向运动估计,在X2i-1中搜索X2i+1每个子块的最优匹配块,得到运动向量MVX2i-1,X2i+1,计算出内插边信息帧Y2i内子块的运动向量MVY2i;然后对Y2i中的每个不重叠子块,在MVY2i附近进行双向运动估计,得到一个更准确的运动向量MVY2i′;计算与每个子块相邻的全部子块的运动向量的加权平均值,把它作为当前子块的运动向量MVY2i″;根据运动向量MVY2i″,在X2i-1和X2i+1内确定对应的子块,进行双向运动补偿,得到Y2i的像素值。

(5)利用X2i-1、X2i+1,使用块匹配算法进行前向运动估计;对于每一个子块对应的运动向量,可以通过计算其所有相邻子块运动向量的加权平均值得到;将X2i-2的子块投影到X2i-1,并继续从X2i-1投影到外推帧;对于块重叠区域的像素,可以使用前面已解码帧的多个像素来进行估计,将这些像素的平均值作为对应像素的估计值;对于未覆盖区域的像素,可以利用其相邻区域的像素值进行空间内插,预测得到相应像素值。

(6)边信息生成。

(7)边信息序号数加1。

2.2 对已解码关键帧的错误恢复

分布式视频编码的实际应用中,编码终端多数采用无线传输技术,视频传输过程中会出现丢包现象,解码出的关键帧也会出现差错,进而影响到边信息的质量。本文使用一种基于张量投票的空域错误隐藏算法来对分布式视频编码中的已解码关键帧K′进行错误恢复。

首先对已解码关键帧K′的丢失宏块进行分类,对K′的边缘纹理特征和统计特性进行分析,同时根据丢失宏块与邻近宏块的相关性,把丢失宏块分为3类:平坦块、边缘块和细节成分较丰富的纹理块,然后根据丢失宏块的类型选择合适的隐藏算法。

(1)对平坦块的恢复。对于平坦块使用双线性内插法来处理,该算法利用受损宏块周围4个相邻的正确边界像素做双线性加权内插来估计受损宏块内部每个像素点的值。

(2)对边缘块的恢复。对于边缘块采用方向性内插法,先进行边缘方向估计,然后选择内插方向,再进行内插,计算丢失宏块的像素。

(3)对纹理块的恢复。首先将丢失宏块与邻块用张量进行表示,其中张量可以表示图像的多种信息,如图像的方向、显著性、曲率等,然后进行张量投票,获取丢失块的显著性,再估计出丢失宏块的结构信息,然后依据结构信息对纹理块进一步划分,对更小的子块采用方向性内插法来进行错误恢复。

经过上述算法对已解码关键帧K′进行错误恢复处理,得到更高质量的视频帧K″,然后再对错误恢复帧K″进行边信息生成。这样不仅可以改善关键帧的传输质量,还可提高视频的鲁棒传输。另外,由于DVC利用解码帧进行运动估计产生边信息,所以用错误恢复过的解码帧生成边信息,边信息的质量可以进一步得到提高。

3 实验结果与分析

本节进行仿真实验,并对实验结果进行分析。实验环境为CPU/P4 3.0GHz,内存为2G的PC机,实验软件平台为Microsoft Visual Studio 2005,开发语言为ANSI C++,并调用了Matlab R2010b库函数。选用标准视频序列Carphone进行实验,其格式为QCIF(176×144),Y:U:V为4:2:0,帧率为30fps。

3.1 错误恢复的实验结果

对该序列的第16帧当作关键帧来传输并进行模拟差错受损,如图2(b)所示,解码帧如图2(c)所示,对解码帧进行错误隐藏后的效果,如图2(d)所示。

实验结果表明,关键帧的解码帧脸部运动部分失真较大,而利用错误隐藏技术对解码帧进行错误恢复后解码帧质量可以得到明显改善。这主要是由于本文对解码帧中出现的丢失块采取了后处理技术,根据丢失块周围的像素或像素块对丢失块进行了错误恢复。这种处理方案的优势在于编码端和解码端之间无需进行交互,同时也不需要在编码端加入冗余信息,因而避免了编码效率的下降和额外的传输延时,只需在解码端加入错误隐藏模块就能有效改善关键帧的解码质量,无需重传和增加传输带宽,也没有增加编码端的复杂度,只是增加了解码端的复杂度,这完全符合分布式视频编码的宗旨。

3.2 边信息优化实验

生成边信息Y45,对应的原始关键帧为K90,图3(b)表示用运动补偿外推法生成边信息的结果,图3(c)表示采用本文提出的多路径边信息策略生成的结果。

实验结果表明,通过运动补偿外推生成的边信息脸部失真较大,而本文提出的多路径边信息生成策略生成的边信息视觉效果有较明显改善。这主要是由于用来生成边信息的参考帧中有一个是通过前后相邻帧进行运动补偿内插生成的,使用了时域相关性,参考了相邻帧之间的运动轨迹,估计的运动信息比较精确,可以更好地估计出边信息。

3.3 与DISCOVER系统比较

本节对优化后的系统进行仿真实现,实验中对Foreman序列的前50帧使用RTP_LOSS进行模拟随机丢包,丢包率为16%;然后对丢包后的序列进行分布式视频编码,并将实验结果与原系统和DISCOVER分布式编码系统进行比较,实验结果如图4所示。DISCOVER是由欧洲多个国家联合组成的DISCOVER研究小组研发(http://),是迄今为止性能最优异的分布式视频编码器之一。

从实验结果中可以看出,改进后的系统性能比原系统提高了1.5~2.3dB,与DISCOVER系统相比,可以提高0.9~1.4dB,表明系统总体性能得到明显改善。这主要是

由于在解码端对关键帧的解码帧使用了错误隐藏技术,使得解码帧的质量得以提高;然后再对错误恢复过的解码帧使用本文提出的多路径边信息生成方法来生成边信息,利用了时域相关性,边信息质量得到改善,从而达到了系统优化的目的。

4 结语

本文提出了一种改进的多路径边信息生成策略,与运动补偿外推法相比,边信息质量得以提高,从而减少了编码端校验位传输,提高了系统的编码性能和效率。另外,提出用错误隐藏技术来对已解码关键帧进行错误恢复处理,从而保证了关键帧的传输质量,提高了系统的鲁棒性;然后再对错误恢复过的解码帧用改进的边信息生成策略进行边信息生成,提高了边信息的质量,从而提高分布式视频编码的效率及重构质量,达到了对WynerZiv系统优化的目的。

参考文献:

\[1\] A AARON, R ZHANG, B GIROD. WynerZiv coding of motion video\[C\]. The Asilomar Conference on Signals, Systems and Computers,2002.

\[2\] A AARON, S RANE, E SETTON, et al. Transformdomain WynerZiv codec for video\[C\]. Visual Communications and Image Processing,2004.

\[3\] ANTONIO TOME, FERNANDO PEREIRA. Low delay distributed video coding with refined side information\[J\]. Signal Processing: Image Communication,2011(4).

\[4\] T MAUGEY, C YAACOUB, J FARAH. Side Information Enhancement using an Adaptive Hashbashed Genetic Algorithm in a WynerZiv contex\[J\]. Proceedings of MMSP,2010(10).

\[5\] 万里晴,李学明.H.264的差错控制与错误隐藏技术研究\[J\].计算机工程与应用,2007(16).

\[6\] 干楠,龚声蓉,王朝晖,等.基于张量投票的空域错误隐藏算法\[J\].通信学报,2011(10).