首页 > 范文大全 > 正文

数字音视频的采样及常见格式

开篇:润墨网以专业的文秘视角,为您筛选了一篇数字音视频的采样及常见格式范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

随着当前计算机技术日新月异的发展趋势,不断有新的音视频编码格式与标准出现。本文结合目前流行的音视频编码格式与码率计算做一些简介,希望对读者了解计算机上的音视频码率显示信息与设置有所帮助。

音频部分

1、音高、音色

音高:国际通用的标准音高(第一国际高度)是440Hz的a音,即将c调的6(啦)作为标准音。为了确定乐音体系中各音的绝对准确高度,人们创造了各种定律法,如十二平均律―――将一个纯八度(如c1~c2)分成十二个均等的部分(即半音)。现代的钢琴、吉他、提琴都是根据十二平均律定音的。升八度则声音频率加倍,如高音6的音高为440×2=880Hz,其它各音则依比率分之, 每半音升高=1.06倍。位于乐音体系总音列中央的c1叫做中央C,其音高为220×1.06×1.06× 1.06=261Hz(式中220为c调6的音高440的一半,即低音6的音高)。

如果你懒得计算, 这里有个现成的计算结果:

C 调 do,re,me,fa,so,la,te,do'

音高262,294,330,349,392,440,494,523

高八度只要乘以2,低八度只要除以2就可以了。知道了这些声音的物理原理,就可以按公式去制作一些乐器,如二胡、笛子、电子琴等。

音色:音色的不同取决于不同的泛音。每一种乐器、每一个人以及所有能发声的物体发出的声音,除了一个基音外,还有许多不同频率的泛音伴随,正是这些泛音决定了其不同的音色,使人能辨别出是不同的乐器或者不同的人发出的声音。举个例子,从频谱上看电子琴只有一个基音,而钢琴除了一个基音外,还有许多不同基音的倍频的泛音伴随,这就是钢琴的音色为什么比电子琴好听的原因。

2、声音的采样

听觉范围:人耳的听觉范围通常是20Hz~20kHz。根据奈魁斯特(NYQUIST)采样定理,用两倍于一个正弦波的频率进行采样就能完全真实地还原该波形,因此一个数码录音波的采样频率直接关系到它的最高还原频率指标。例如用44.1kHz的采样频率进行采样,则可还原最高为22.05kHz的频率(这个值略高于人耳的听觉极限)。

动态范围:动态范围是指声音从最弱到最强的变化范围。采样大小为16bit的声音能够表达65536种状态,对应动态范围为96db;而20bit的可以表达1048576种状态,对应120db的动态范围;24bit的则可以表达多达16777216种状态,对应144db的动态范围。采样精度越高,声波的还原就越细腻。

3、电脑上常见的音频格式

(1)PCM编码格式(WAV格式):PCM脉冲编码调制是Pulse Code Modulation的缩写,要算一个PCM音频流的码率是一件很轻松的事情,采样率值采样大小值等于声道数与采样率与采样大小的乘积。一个采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1×16×2=1411.2 kbps。我们常说128K的MP3,对应的WAV参数,就是这个1411.2kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M。 由此可知,一个小时的CD格式的音乐需要635MB的存贮空间,一张普通CD片最长的播放时间为74分钟。

(2)MP1、MP2、MP3格式:MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1。在128kbps的采样频率下编码一首时长1分钟的歌曲,可以得到960KB的MP3文件。采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样频率以获取更高的音质,不过产生的MP3文件在某些播放器上可能无法播放。我们把VBR的音质级别设定成与前面的CBR文件基本一样,生成的VBRMP3文件为990KB。目前网上的MP3大多采用128kbps的采样频率,所以我们可以按MP3文件大小来判断一首歌的长短,如MP3文件大小是3M,那么在采样频率为128kbps情况时,歌曲的时间约为3分钟;或MP3文件大小是4.5M,歌曲的时间约为3分钟,那么我们可以知道这首歌的采样频率为192kbps。一首歌文件越大,采样频率越高,音质就会越好。

(3)WMA格式:WMA就是Windows Media Audio的缩写,使用微软自己开发的Windows Media Audio技术,这是一种音频压缩格式。WMA是Microsoft Windows Media技术中的一部分,它包含了对音频格式的一个完整的定义,包括编码规范和加密格式。它的加密格式异常强大,甚至可以限制播放机器、播放次数以及播放时间,有着比MP3更好的版权保护性能。还有就是WMA的“流”性能要比MP3好,在音质不高的情况下,相同质量的WMA的流量要比MP3低,微软声称,在只有64kbps码率的情况下,WMA可以达到接近CD的音质。根据相关测评,WMA的最佳码率为64~192kbps,如不在此范围内其音质反而不如相同码率的MP3。

(4)MIDI格式:MIDI即电子琴声音,它并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。这样,一个MIDI文件每存1分钟的音乐只用大约5~10KB存贮空间。由于文件小,所以适用于在存储空间不大的手机上做和弦铃声。

(5)DTS、AC-3格式:家庭影院一共有六个音箱,分别是前置左右音箱、后置左右环绕音箱,用来营造身临其景的环绕声场;一个中置音箱,用来强化影片中的对白;还必须配置一个超重低音箱,以感受排山倒海的气势。与音响组合不同的是,家庭影院可以营造出一种身临其境的感觉,这是因为家庭影院具有环绕处理效果。我们下面介绍一下环绕声场5.1多声道系统的两个代表DTS、AC-3的数据情况。采用PCM编码的两声道的CD数据率为2RFs,即1.411Mb/s。使用多声道系统时,左、右、后置左右环绕、及中置音箱各占一个声道的数据,超重低音由于只要表现低音部分而不需要太高的采样所以只占0.1声道的数据,此时的数据率为 5.1×R×Fs=3.598Mb/s。

DTS跟AC-3的差异在于资料流量的大小,DTS在DVD上拥有1536kbps的资料流量,最大编码流量与LPCM相同,也就是每秒48000×16×2=1536000bit,与 AC-3的码率64kbps~448kbps相比较,足足多了3倍多的资料流量。即使将AC-3拉到极限的640kbps,DTS跟AC-3的流量相比还是强过2倍有余,这使得DTS能较AC-3听到更多的细节,整个空间感及移动感也更加优良、更加清楚。

视频部分

1、颜色采样

自然界中绝大多数色彩都可以由三基色―――红绿蓝按比例混合而得。计算机彩色显示器显示色彩的原理与彩色电视机一样,都是采用R(Red)、G(Green)、B(Blue)相加混色的原理。计算机用RGB表示,彩色电视用YUV表示,两者可互相转换。

YUV与RGB相互转换的公式如下(RGB取值范围均为0-255):

Y=0.299R+0.587G+0.114B

U=-0.147R-0.289G+0.436B

V=0.615R-0.515G-0.100B

R=Y+1.14V

G=Y-0.39U-0.58V

B=Y+2.03U

在计算机操作系统中如选择24位真彩显示,那么就会使用24位来表示一个像素,RGB的分量都用8位表示,取值范围为0~255。例如某个像素RGB为(255,255,255),我们就可以判定该像素是一个白点;RGB为(0,0,0),我们就可以判定该像素是一个黑点。

了解了视频采样的原理,我们就可以根据RGB的采样特点来做些视频特效。大家对照片的底片一定都很熟悉了,底片上的颜色与色彩鲜艳的照片的颜色是正好相反的,即反色,这也就是我们制作反色图像的技术核心。我们只需取得图像上各个点的RGB值,然后用255减去这个值,并将所得的值重新赋值给各个点,就会达到我们想要的底片效果了。

下面是计算机Windows操作系统中显示属性中的颜色属性的几种常见的设置:

MEDIASUBTYPE_RGB8256色,每个像素用8位表示,需要调色板

MEDIASUBTYPE_RGB565 每个像素用16位表示,RGB分量分别使用5位、6位、5位

MEDIASUBTYPE_RGB24每个像素用24位表示,RGB分量各使用8位

MEDIASUBTYPE_ARGB32 每个像素用32位表示,RGB分量各使用8位(剩下的8位用于表示Alpha信道值)

当我们首次接触到WindowsXP操作系统时,不少人感到其界面和图标比以往的操作系统更漂亮了,就是因为它支持了RGB32位的颜色。

2、 电脑上常见的视频格式

图像的大小:假设存储一幅256种颜色的图像,图像尺寸为1024×768个象素点,则图像的大小为:1024×768×8bit=768KB。

视频的大小:一帧全屏幕、全运动、全彩(640×480×24,30fps)的数字影像(包括同步声音)约有27.7MB,十分钟非压缩的数字视频影像约有16. 62GB。

(1)MPEG-1\2\3\4\7格式:MPEG-1即将VCD格式的MPEG数据码率固定在1.15 MBits/s,其视频压缩率为26∶1。使用MPEG-1的压缩算法,可以把一部120分钟长的多媒体流压缩到1.2GB左右大小;MPEG-2(标准代号IOS/IEC13818)于1994年国际标准草案(DIS),在视频编码算法上基本和MPEG-1相同,只是有了一些小小的改良;MPEG-3最初为HDTV制定,由于MPEG-2的快速发展,MPEG-3还未彻底完成便宣告淘汰;MPEG-4于1998年公布,和MPEG-2所针对的不同,MPEG-4追求的不是高品质而是高压缩率以及适用于网络的交互能力。MPEG-4提供了非常惊人的压缩率,如果以VCD画质为标准,MPEG-4可以把120分钟的多媒体流压缩至300M;MPEG7适用于图书馆档案查询,压缩比非常高,码率很低。现在常用的声音压缩标准有杜比和AC3两种。

(2)流媒体格式:宽带高速接入互联网将越来越普及,其中最热门的应用大概就是在网上实时看电影、电视及收听广播了。只能在网络上实时收看的节目,我们一般称其为“流媒体”。目前网上使用的流媒体格式以 RM 和 ASF(MWV)为代表,其中 ASF(MWV)编码格式也是基于MPEG-4的。