本文从技术角度对MPEG-2的视频标准、MPEG-4 AVC/H.264和AVS视频(GB/T200090.2) 三个视频标准进行对比,包括技术方案、主观测试、客观测试、复杂度等四个方面。
一、技术对比
AVS视频与MPEG标准都采用混合编码框架(见图1),包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块,这是当前主流的技术路线。AVS的主要创新在于提出了一批具体的优化技术,在较低的复杂度下实现了与国际标准相当的技术性能,但并未使用国际标准背后的大量复杂的专利。AVS-视频当中具有特征性的核心技术包括:8x8整数变换、量化、帧内预测、1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。
AVS视频编码器框图如下图所示。
AVS视频标准定义了I帧、P帧和B帧三种不同类型的图像,I帧中的宏块只进行帧内预测,P帧和B帧的宏块则需要进行帧内预测或帧间预测,图中S0是预测模式选择开关。预测残差进行8×8整数变换(ICT)和量化,然后对量化系数进行zig-zag扫描(隔行编码块使用另一种扫描方式),得到一维排列的量化系数,最后对量化系数进行熵编码。AVS视频标准的变换和量化只需要加减法和移位操作,用16位精度即可完成。
AVS视频标准使用环路滤波器对重建图像滤波,一方面可以消除方块效应,改善重建图像的主观质量;另一方面能够提高编码效率。滤波强度可以自适应调整。
AVS标准支持多种视频业务,考虑到不同业务之间的互操作性,AVS标准定义了档次(profile)和级别(level)。档次是AVS定义的语法、语义及算法的子集;级别是在某一档次下对语法元素和语法元素参数值的限定集合。为了满足高清晰度/标准清晰度数字电视广播、数字存储媒体等业务的需要,AVS视频标准定义了基准档次(Jizhun profile)和4个级别(4.0、4.2、6.0和6.2),支持的最大图像分辨率从720×576到1920×1080,最大比特率从10 Mbit/s到30 Mbit/s。
DCT(Discrete Cosine Transform):离散余弦变换
VLC(Variable Length Coding):变长编码
CAVLC(Context-based Adaptive Variable Length Coding):基于上下文的自适应变长码
CABAC(Context-based Adaptive Binary Arithmetic Coding):基于上下文的自适应二进制算术编码
FMO(Flexible Macroblock Ordering):灵活的宏块排序
ASO(Arbitrary Slice Ordering):任意条带排列
二、主观评价和客观测试
压缩效果的评价标准有主观评价和客观评价两种,各有优缺点。主观评判是聘请专门的评价人员来比较压缩之后再恢复的视听效果和原始效果的差异,通常是在专门的视听环境中按照一定的规则进行主观评分。客观评判则是通过一种具体的算法来统计多媒体数据压缩结果的损失,例如信噪比SNR(即信号与噪声之比的对数)。主观评判和客观评判有时相差很大,因此衡量一个算法的好坏就需要在这二者之间找到一个平衡点。对一套标准的评价,通常开发过程中采用客观评价的方法,但最终要得到主观评价的确认。
1.MPEG-4 AVC视频标准主观测试
2002年10-12月,MPEG 组织了专题组对AVC (ISO/IEC 14496-10 | ITU-T Rec. H.264) 与MPEG-4 Visual (ISO/IEC 14496-2)和MPEG-2 Video (ISO/IEC 13818-2)标准进行了测试。测试在FUB/ISCTI (意大利)、NIST (美国)和TUM (德国)进行,测试结果表明AVC的编码性能有显著提高。