首页 > 范文大全 > 正文

浅析动态图像采集压缩技术

开篇:润墨网以专业的文秘视角,为您筛选了一篇浅析动态图像采集压缩技术范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘要】在互联网飞速发展和广泛普及的今天,在实战中的具体功能、实际威力以及真实效果,使决策者和科技人员获得动态和感性的认识,有身临其境之感。在工业上,需要对一些多变的、有毒的、人类不宜久留的场合进行监测。在医疗上,则需要一些高级专家对异地的病人进行诊断和治疗,这些都是基于高保真实时准动态图像采集压缩和远程传输技术的综合实现。

1 系统设计思想

本系统的设计目标是基于互联网实现远程站点之间的高保真准动态图像的实时传输。整个系统贯彻如下设计思想:发送站点和接收站点都具有对图像质量的控制功能,以适应互联网传输率不稳定的情况;对图像采用多种类型的压缩技术,以适应不同的图像分辨率和环境要求;在互联网信道传输率较差时,能够启动自适应功能。

2 系统设计中的关键技术和优化策略

2.1 视频采集技术分析和选择

为了实时视频采集,需要安装相应的视频采集设备。即视频采集卡和摄像头等。并需要安装相应的驱动软件来支持这些设备的运行。

实际运行过程表明,上述分析是正确的。本系统设计中采用了overlay模式。这一选择对稳定性起到了较好的优化作用。

2.2 视频压缩、解压缩技术的优选和优化

针对视频应用中可能遇到的各种情况,本系统的压缩、解压缩模块设计采用三种压缩方案,使用时可以从中选择一种,以适应不同环境和不同需求。

一是国际通用的高压缩比方案H.263,该方案压缩比高,但图像质量较差,适用于网络传输性能较差的情况,该方案大体符合现场图像的处理要求。二是图像压缩质量最好、算法最先进的MPEG-4方案,该方案图像质量好,但压缩比较低,适用于网络传输性能良好的情况。三是在H.263的基础上作了较大幅度修改和优化的TH.263方案,该方案在压缩比与H.263相近的情况下,图像质量有明显改善。TH.263方案是在对H.263深入分析基础上实施的。通过分析H.263的整个系统程序,得到其设计思想如下:首先将采集到的原始图像划分成8×8的宏块,然后判断此帧是不是关键帧。如果是关键帧,则对每个宏块作DCT(Discrete Cosine Transform)变换,对变换后的视频数据采用视觉能够接受的量化比量化,量化后许多高频分量将变成零,为了最大限度提高压缩编码效果,采用Z形扫描技术将其重新组合,然后对组合串做行程编码,最后对得到的结果进行哈夫曼编码;如果是非关键帧,则对每个宏块先进行运动矢量的计算,然后与上一幅图像作差,再象关键帧那样经过DCT变换、量化和行程编码、哈夫曼编码得到压缩的图像。图像解压缩与压缩过程正好相反,即先将压缩的图像数据作行程解码和哈夫曼解码,然后进行反量化,并据此进行IDCT变换。如果此帧是关键帧,则直接将这个宏块重组即得出还原后的图像;否则,根据运动矢量将各宏块的数据与上一帧进行组合才得出还原后的图像。由于解压缩不需要分析图像和网络的情况,也不需要考虑压缩比和压缩质量,只是简单地将图像还原,所以程序比较简单。通过分析和测试表明,格式转换、对关键帧和非关键帧离散余弦变换DCT、对非关键帧的帧间压缩是最重要最耗时的环节。为此,在设计中对这些环节进行了优化。

具体讲,在格式转换、DCT变换中,一是在采集到的RGB色彩空间图像到压缩算法视频输入格式CIF变换中,用整型算法和移位相结合的优化转换函数代替速度较慢的浮点运算;二是在关键帧和非关键帧的DCT变换中,采用零系数预测策略对DCT变换的输入数据分类,节省了大量无效运算;三是采用多媒体处理指令集MMX实现DCT变换,大幅度提高了运算速度。此外,为了实现良好的帧间压缩,比较了两种不同的压缩方式。

第一种方式是以象素为基础,首先将其与上一帧作差,得到一个稀疏矩阵。在作差的过程中,采用小范围匹配的方法去掉一部分噪声,然后采用优化的行程编码得到最后结果,并把当前帧保存在指定的内存区,作为下一帧作差的参考帧。

第二种方式是以宏块为基础的运动补偿方式,首先计算运动矢量,然后采用行程编码和哈夫曼编码。用运动补偿技术既可以达到较高的压缩比又有相当好的图像质量。

对于第一种以象素为基础的编码方式,在保证较高的帧频和压缩比的情况下,图像质量好。而对于第二种以宏块为基础的运动补偿编码方式,图像质量稍差,但压缩比较高,适用于数据传输率较低的情况。为吸收二者的长处,笔者在对H.263源程序分析的基础上进行了优化,采用混合压缩编码方案。此方案将上述两种方式结合起来,从而使系统有效地适用于互联网传输。因为远程站点之间通过互联网进行传输时,信道的数据传输率不是固定的。所以,系统中通过信道测试反馈信息改变量化时的步长,从而调节视频信息的数码率,以便更好地适应信道传输率的变化。

2.3 用UDP和 RTP实现图像传输并进行实时优化

视频图像的实时传输有如下特征:

・数据量大,尤其是高保真活动图像的数据量更大,从而带宽要求高;

・实时性要求高。

上述特点使视频图像传输对传输环境提出很高的要求。但另一方面,图像数据包在少量丢失情况下不影响还原质量。为此,采用建立在UDP基础上的实时传输协议RTP。用UDP协议进行数据传输的优点是不需要建立连接,传输速度快。缺点是容易丢失数据包,而且数据包的顺序容易混乱。

RTP是基于UDP的网络传输协议,编程时通过时间标签(Time-temping)机制、信息序列编号(Sequence Numbering)机制和有效数据类型标识(Payload Type Identifier)机制的联合使用,在允许的延迟范围中保证数据的实时传输质量,对于少量信息包的丢失,则采用补偿方法解决。时间标签用来标明实时数据块生成时间,接收方可据此正确排列数据接收顺序,并保证实时数据传输同步,一帧图像数据组成的RTP信息包有相同的时间标签。序列编号通过配合时间标签设置,同一帧图像的RTP信息包有相同的时间标签,但有不同的序列编号。有效数据类型标识用来定义各种数据压缩方法,并可通过手动或自动方式动态调整,在信息拥挤时可提高压缩比。

2.4 视频传输中的自适应技术

由于网络带宽有限且随机变化,因此视频传输的实时性会受到严重影响,甚至会使接收到的视频出现不连续或停顿现象。为此,在系统设计中,引入了视频传输的自适应机制。具体实现时,系统一边传输一边检测网络状态,并据此调整发送策略以适应网络变化。

2.5 发送和接收的同步技术

本系统采用Client/Server结构。在这种结构中,只有Client端才能发连接请求建立连接,而且一个Client端可与多个Server建立连接。因此,将接收站点作为Client,发送站点作为Server。当接收站点需要得到远端的视频图像时,便发出连接请求。这种方式适用于系统视频采集站点处于恶劣环境中无人看管的情况。

server端采集视频数据并进行压缩后,发送给client,Client将数据解压缩后显示视频图像。系统设计中,为了适应不同的网络环境和图像要求,对视频质量配置了双向调节功能。即一方面,视频采集站点可直接调节图像质量,另一方面接收站点也可以调节采集站点的图像采集和压缩参数,从而调节图像质量。