首页 > 技术文章 > 多媒体 > 影音光碟之视讯压缩规格比较

影音光碟之视讯压缩规格比较

52RD.com 2006年7月25日 吴国瑞            评论:0条 我来说两句
  

现在是一个资讯爆炸的时代,因为科技日新月异,通信越来越发达,透过视频与声音的传递使人与人间的距离越来越近,声音与视频将穿透每一个人之生活圈。但声音与视频的资料量相当庞大,比如说标准NTSC视频解析度为720×480、24bits True Color 16777216色之画面所佔之记忆容量为:

720×480×24×8 = 8294400 Bits
= 1013 KBytes

如果按目前视频播放的标准,每秒播放30个画面的计算,每秒钟所播放的资料为:1013K×30×8=242.4Mbps。面对如此庞大的资料量之储存与传输问题,压缩的技术就显得相当的重要了,各种压缩技术就由此发展出来。

各种影音光碟之物理容量皆有其上限,例如单面单层之DVD容量为4.7GB,单面单层之CD-ROM容量为650MB;只有透过视频压缩技术才能将视频资料量降低,才有办法使有限之碟片容量容纳135分钟之影片资料。因此,DVD与VCD採用了MPEG1&2压缩标准做为其视频资料之储存格式。本文将就各种视频压缩技术之压缩原理与效能做一简单介绍 。

影音光碟规格与视频压缩规格之演变
过去十余年间,如(图一)所示,有微软、ITU与ISO/MPEG-Committee等两个国际组织推出不同之视频压缩标准。ITU先后制定了H.261、H.263与H.263++等规格,ISO/MPEG-Committee也曾推出MPEG-1/4等技术,西元1994年ITU与ISO/MPEG-Committee合作推出MPEG-2/H.262规格,成为DVD影音光碟与ATSC广播系统所採用之压缩标准。公元2002年,ITU与ISO/MPEG-Committee再度合作推出H.264/MPEG-4-Part10规格,其压缩效能可达MPEG-2之三倍,是目前学界与工业界竞相研究使用之先进影音压缩标准。在ITU与ISO/MPEG-Committee推出H.264/MPEG-4-Part10规格时,微软也将其所研发之WMV-9压缩技术搭配Window Media player播放软件,在个人电脑平台大量使用。

在1993年MPEG-1规格制定完成时,使用MPEG-1压缩标准之VCD影音光碟规格也同时推出;1994年MPEG-2压缩标准推出,1996年使用MPEG-2压缩标准之DVD-Video规格诞生,而延用至今。2002年H.264与WMV-9压缩规格推出后,FVD-Video、HD-DVD-Video与BD-Video等高画质影音光碟规格相继採用此两种压缩标准。由此可见,视频压缩标准与影音光碟规格之发展有高度之相关;今日之趋势已进入以H.264与WMV-9为主流之时代;本文接着也将针对MPEG-2、H.264与WMV-9之技术效能差异进行比较。
 



(图一) 视频压缩标准之演变
 

 
MPEG-2、WMV-9与H.264压缩规格所使用之基本技术比较
视讯压缩方法是用于去除空间轴与时间轴上的多余资讯,以达成资料量缩减之目的。不同的压缩规格,使用不同的技术以去除多余资讯,而MPEG-2、WMV-9与H.264等规格之差异在于使用不同之基本压缩技术。兹就不同压缩规格所使用之基本压缩技术比较如(表一)所示。
 

基本技术 规格 运动估测技术 编码方法 空间轴编码方法
MPEG-2 (1) Fixed block size (2) 1/2 Pixel motion vector 2D-VLC 8x8 DCT Transform
WMV -9 (1) Variable block size (2) 1/4 pixel motion vector a)3D-VLC b)Two layer Huffman Coding 8x8 、 4x8 、 8x4 、 4x4 Integer Tansform
H.264 (1) Variable block size (2) 1/8 pixel motion vector a) UVLC b) CABAC 4x4 Integer Transform


表一 各种压缩规格所使用之基本压缩技术比较
 

■运动估测技术之比较
运动估测技术上之主要差异有下列两点:

(1)运算方块大小之不同;
(2)运动向量之精度差异。

在MPEG-2之视频压缩规格中,运动估测所用之运算方块大小是固定的16×16像素,而运动向量之最大精度达1/2像素。在WMV-9之视频压缩规格中,其运动向量之最大精度由1/2像素提升至1/4像素,其运动估测所用之运算方块大小之选择可为16×16像素或8×8像素。H.264规格再将运动向量之最大精度提升至1/8像素,且运动估测所用之运算方块大小可为16×16、8×16、16×8、8×8、8×4、4×8与4×4等七种模式。高精度之运动向量与多选择性之运动估测运算方块尺寸可使压缩效能提高,但也增加了编码过程之运算量。WMV-9与H.264规格之压缩效能可达MPEG-2之三倍,但其解码运算量也达MPEG-2之三至五倍。主要的差异皆来自运动估测方法之不同。

■编码方法的比较
视频压缩规格皆使用可变长度编码(Variable length Coding)方法对各种数值做编码,所谓可变长度编码就是将不同的符号(symbol)以不同长度之Binary code作代表。如(图二)所示之DCT系数,在一个数之后跟随几个零,构成一组(Run,Level),即以不同的VLC码对应之,称为2D-VLC。而其中的Run是指在每一个非零系数之前的连续0的个数,Level指的是该非零系数的位阶值(及大小值),最后还会跟着一个位元用以编码该非零系数的符号,最后再以查表的方式将符号(symbol)转换成二元码(Binary Codes)。

MPEG-2规格即使用图二之2D-VLC编码技巧。在WMV-9的VLC编码规格中捨去图二中间之「End of Block」编码,增设Last Flag将2D-VLC扩大成如图二最右边所示之3D-VLC。3D-VLC对每一个符号(symbol)编码出一组(Last,Run,Level),与2D-VLC最主要的差异就是多出了Last栏位,该栏位用一个位元来标示在该非零系数之后是否还有其他的非零系数(0代表后头还有非零系数,1代表之后没有其他的非零系数)。在H.264的编码方法上有两种编码方法供编码器做选择:可变长度编码(UVLC)及前文参考之适应性二元算术编码(CABAC),其中UVLC对于发生机率比较高的符号以较短的码加以编码,这些码都是以查表的方式运作,所以在编码端及解码端的编码表要一致。

而CABAC与UVLC最大的不同点,在于其编码方法是具有适应性(adaptive),所谓的适应性是指对于编码过程中各个符号(symbol)出现的机率会一直动态地去统计并更新,以(图三)来说明CABAC的运作流程:输入讯号经过Context Modeling后会先产生内文(Context),之后将其二元化,接下来就是整个算术编码的核心,Probability Estimation负责动态地去估算机率,此机率值将会是算术编码最重要的输入参数,有此机率值Coding Engine就会将所有的符号(symbol)加以编码。分析两者的优缺点,CABAC由于一直动态地计算更新符号出现的机率,可以将资讯作适应性的调整并达到最佳的资料压缩率,然而如此也付出了运算量增加的代价,及执行效率上不如UVLC来得快速的缺点。
 



(图二) 可变长度编码示意图
 

■空间轴编码方法的比较
在空间轴编码方面,MPEG-2、WMV-9与H.264皆使用频域之DCT系数编码,所不同者在于MPEG-2使用浮点运算之DCT转换,H.264与WMV-9使用整数点运算之DCT转换,MPEG-2之转换运算方块为8×8,而H.264/AVC则使用4×4的转换,用来消除区块边缘的ringing artifact以及discontinuity,但是影像中的趋势(trend)和结构(texture),尤其是週期性的结构(periodic texture)使用较大的Block size会有较好的保存效果,因此在WMV-9允许多种的Block size可供选择(包含8×8、4×8、8×4以及4×4的尺寸),其中针对Intra picture的frame level是固定使用8×8的尺寸,而Inter picture则可以选择4×8、8×4或4×4的尺寸。另外,WMV-9可选择在不同的level(frame、macroblock、block)做标记,例如在frame-level中标记使用8×8的尺寸做转换后,在同一frame中就都使用同样的尺寸来做转换,而在macroblock及block level中也是一样的规则。此特点使在同样压缩比之下,WMV-9之解压缩视频画质优于H.264。
 



(图三) H.264 CABAC编码架构示意图
 

 
编码效能比较
在后述的实验结果中,分别将WMV-9、MPEG-2与H.264编码效果做比较,以说明其编码性能:

■WMV-9与MPEG-2之编码性能比较
WMV-9只需要使用MPEG-2所使用资料量之50%,即可达到比MPEG-2更优良视频效果之压缩视频节目。(图四)与(图五)分别比较在快动作与慢动作节目中,解压缩视频节目之PSNR值之差异。在相同PSNR的条件下,WMV-9使用的资料量是MPEG-2之30%~45%。
 



(图四) 使用WMV-9与MPEG-2压缩方法对慢动作节目编码之Rate-distortion效能比较
 



(图五) 使用WMV-9与MPEG-2压缩方法对慢动作节目编码之Rate-distortion效能比较
 

■WMV-9与H264之编码效能比较
若是以rate-distration之性能来评比WMV-9与H.264,WMV-9与H.264的特性是非常相近的。在(图六)与(图七)的实验结果中,图六中H.264较好,图七则是WMV-9胜出。然而,若以视觉效果来比较,WMV-9在几次公开实验评比中(如C’T Magazine之公开评比),WMV-9皆比H.264优胜。
 



(图六) WMV-9与H.264压缩方法之Rate-distortion效能比较
 



(图七) WMV-9与H.264压缩方法之Rate-distortion效能比较
 

以建置解码器的运算复杂度来比较如(表二),WMV-9所需之运算量不及H.264所需运算量之50%。
 

Sequence

Millions of ARM cycles/second

WMV9

H.264/AVC

Foreman

27

70.0

News

17

45.9

Container

19

45.5

Silent

18

50.8

Glasgow

25

48.5

Average

21.2

52.14


表二 WMV-9与H.264压缩方法之运算复杂度比较
 

 
结论
新一代的压缩规格WMV-9与H.264之压缩效能远高于DVD-Video规格所用之MPEG-2规格。WMV-9视讯编码技术具有优于H.264等级规格之压缩编码效能,却没有H.264之高运算复杂性,目前已在PC平台广泛使用。编码器与播放器软件皆易于取得,播放晶片也已经开始普及,使用WMV-9编解码技术之FVD播放机也开始大量销售,它可望在未来与FVD共同成为下世代影音光碟之主流技术。(作者为工研院光电所资讯存取技术组经理)

(52RD.com)
读取...
相关报道
评 论
文章导航 Navigation
精彩评论 Commentmore...
赞助商链接 Support
特别推荐 Recommend