文档文库

手机版

投诉建议

首页 > 多媒体

多媒体

发布时间：2015-04-27 20:20:30 来源：文档文库

小中大

字号：

手机查看

1. MPEG声音压缩编码算法中的三个特性：响度、音高和掩蔽效应。

2.掩蔽效应: 一种频率的声音阻碍听觉系统感受另一种频率的声音的现象分类：频域掩蔽时域掩蔽

3. MPEG声音主要采纳两种感知编码算法感知子带编码(perceptual sub-band coding)• 杜比实验室(Dolby Laboratories)开发的杜比数字(Dolby Digital)

4 MPEG声音的压缩依据 • 低于阈值电平的信号听不到，因此可把这部分信号去掉低于阈值电平的信号听不到，因此可把这部分信号去掉• 听觉阈值的大小随声音频率的改变而改变• 大多数人的听觉系统对2～5 kHz之间的声音最敏感

– 2.听觉掩饰特性

• 听觉阈值电平会随听到的不同频率的声音而发生变化

5 2.MPEG-1 Audio定义了三个独立压缩层次

– 第1层—MP1(MPEG Audio Layer 1)• 仅利用频域掩蔽特性，典型的压缩比为1:4，相应的数据率为384 kbp • 算法复杂度最低

– 第2层—MP2(MPEG Audio Layer 2)• 利用频域掩蔽特性和时间掩蔽特性，典型的压缩比为1:6～1:8，数据率为256～192 kbps• 算法复杂度中等

– 第3层—MP3(MPEGAudio Layer 3)• 利用频域掩蔽特性、时间掩蔽特性和临界频带特性，典型的压缩比为1:10～1:12，相应的数据率为128～112 kbps，声音质量接近CD-DA• 算法复杂度最高

6 .MPEG-2标准委员会定义了两种声音数据压缩标准

•MPEG-2 Audio (ISO/IEC 13818-3)[12]–也称MPEG-2 MultichannelAudio (多通道声音)–因为它与MPEG-1 Audio是兼容的，所以又称为MPEG-2 BC (Backward Compatible)标准

•MPEG-2 AAC (ISO/IEC 13818-7)[22]–因为它与MPEG-1 Audio格式不兼容，因此通常把它称为非后向兼容MPEG-2 NBC(Non-Backward-Compatible)标准

7 MPEG-2声音标准做了如下扩充

1)增加了16 kHz, 22.05 kHz和24 kHz采样频率

–扩展了输出速率范围，由32～384 kbps扩展到8～640 kbps

–增加了声道数，支持5.1声道和7.1声道的环绕声

–支持Linear PCM(线性PCM)和Dolby AC-3(Audio Code Number 3)编码

1 列出你所知道的听觉系统的特性。 •响度感知, 音高感知, 掩蔽效应

•2 什么叫做听阈？什么叫做痛阈？ •(1) 当声音弱到人的耳朵刚刚可以听见时，称此时的声音强度为“听阈 •(2) 当声音强到人的耳朵刚刚感到疼痛时，称此时的声音强度为“痛阈”。实验表明，如果频率为1 kHz的纯音的声强级达到120 dB左右时，人的耳朵就感到疼痛，这个阈值称为“痛阈”。

3.什么叫做频域掩蔽？什么叫做时域掩蔽? •(1)强纯音掩蔽在其附近同时发声的弱纯音，这种特性称为频域掩蔽。•(2) 在时间方向上相邻声音之间的掩蔽，这种特性称为时域掩蔽。

4 MPEG-1的层1、2和3编码分别使用了听觉系统的什么特性？ •层1：频域掩蔽特性；•层2：频域掩蔽特性+ 时间掩蔽特性；•层3：频域掩蔽特性+ 时间掩蔽特性+ 临界频带特性(声音频率与掩蔽曲线不是线性关系)；

•5 MPEG-1的层1、2和3编码器的声音输出速率范围分别是多少？

•层1：384 kbps •层2：256～192 kbps •层3：128～112 kbps

1.视像数据存在的冗余

1.)时间冗余(temporal redundancy)

•与时间相关的冗余：在某个时间间隔上出现场景相同或基本相同的连续帧时，帧与帧之间存在大量的冗余数据

–2.)空间冗余(spatial redundancy)

•与空间位置有关的冗余：在单帧图像中，相邻像素的值常有相同或变化不大的情况，可用较少数据表达

3).结构冗余(structural redundancy)

•图像自身构造的冗余：若从宏观上来看一帧图像，有些图像存在相同或类似的结构，如用地板图案构成的图像

–4.)视觉冗余(vision redundancy)

•与视觉系统有关的冗余：对图像的亮度变化敏感而对颜色变化不敏感，对剧烈变化区域敏感而对缓慢变化区域不敏感，对图像的亮度和颜色的分辨率都存在极限

2.VCD盘要求的压缩比

•使用Video-CD存储器早期的数据传输率为1.4112 Mb/s，

•分配给电视信号的数据传输率为1.15 Mb/s，

•MPEG视像编码器输出的数据速率要达到1.15 Mb/s

•如果存储166 Mb/s的数字电视信号就需要对它进行高度压缩，压缩比高达166/1.15 ≈144:1。

1.DVD盘要求的压缩比•DVD-Video存储器的数据传输率可达到10.08 Mb/s以上，•一张4.7 GB的单面单层DVD盘要存放133分钟的电视节目，•按照视像数据的平均数据传输率为4.1 Mb/s来计算，•压缩比就要求达到166/4.10 ≈40:1

3. BT.601视像数据速率–使用4:2:2采样格式，亮度信号Y的采样频率为13.5 MHz，色差信号Cr和Cb的采样频率为6.75 MHz，每个样本的精度为10位，视像数据速率为

(1) 亮度(Y) 858样本/行×525行/帧×30帧/秒×10位/样本≈135兆位/秒(NTSC) 864样本/行×625行/帧×25帧/秒×10位/样本≈135兆位/秒(PAL)

(2) Cr (R-Y) 429样本/行×525行/帧×30帧/秒×10位/样本≈68兆位/秒(NTSC)432样本/行×625行/帧×25帧/秒×10位/样本≈68兆位/秒(PAL)

(3) Cb (B-Y) 429样本/行×525行/帧×30帧/秒×10位/样本≈68兆位/秒(NTSC) 432样本/行×625行/帧×25帧/秒×10位/样本≈68兆位/秒(PAL) 总计：27兆样本/秒×10位/样本= 270兆位/秒

4. VCD视像的压缩比 1.压缩比的概念• 压缩比是数据压缩程度的一种度量方法，其值等于压

缩前的数据大小与压缩后的数据大小之比。• 例如，把一幅原来为1 MB的图像压缩成128 KB，• 其压缩比就是1024×1024/128×1024 = 8∶1。

5. VCD视像的压缩比 •把这种彩色数字电视信号存储到CD盘上所需要的压缩比为30/1.15 ≈26:1。•这是MPEG-1技术能够获得的压缩比

6. DVD视像的压缩比• 使用DVD-Video来存储720×480×30或720×576×25的数字视像• 所需要的压缩比为124/4.1 ≈30:1^

7. 视像数据的压缩算法–1.MPEG-1视像(MPEG-1 Video)压缩视像数据的基本方法可以归纳成两个要点

• 在空间方向上，采用与JPEG类似的算法来去掉空间冗余数据• 在时间方向上，采用移动补偿(motion compensation)算法来去掉时间冗余数据

8.帧内图像I的压缩编码算法–不参照过去的帧和将来的帧，采用与JPEG类似的压缩算法以减少空间的冗余数据，1.如果视像是用RGB空间表示的视像，则首先把它转换成YCrCb空间表示的视像• 2.每个图像平面分成8×8像素的图块，对每个图块进行离散余弦变换(DCT)，变换后产生的交流分量系数经过量化之后按照Zig-zag的形状排序。• 3.DCT得到的直流分量系数经过量化之后用差分脉冲编码(DPCM)，交流分量系数用行程长度编码RLE，然后再用霍夫曼(Huffman)编码或者用算术编码

9.在求两个宏块差值之前，需要找出预测编码图像中的编码宏块相对于参考图像中的参考宏块所移动的距离和方向，即移动矢量

10. 移动矢量的算法：最佳匹配

11. 双向预测图像B的压缩编码算法–对在它前后帧的像素值之差进行编码，具体计算方法与预测图像P的算法类似–双向预测图像B不传播编码误差

12. 一个视像序列(video sequence)分成6层，(1) 序列层(sequence)(2) 像组层(group of pictures，GOP)(3) 图像层(picture)(4) 像片层(slice)(5) 宏块层(macroblock，MB)(6) 图块(block)层

13视像数据位流的结构–1.结构与MPEG-1视像数据位流的结构类似–2.以子采样4:2:0为例的结构•一个视像序列分成G个视像组(GOP)•每个组包含P帧图像(picture)•每帧图像分成S条像片(slice)•每条像片分成M个宏块(macroblock)•每个宏块包括4个8×8的亮度(Y)图块和2个8×8的色度(Cb, Cr)图块

14. 视像质量可变编码–1.优点：可提供不同等级的视像服务质量，以适应不同应用2.缺点：增加了编码和解码的复杂性，降低了压缩效率–3.视像可变编码采用分层编码技术(layered coding)，通常分成• 基层编(base-layer coding)或称低层编码(lowerlevel coding)：编码、传输和解码可单独进行• 增强层编(enhancement-layer coding)或称高层编码(upper-level coding)：编码、传输和解码要依赖基层或先前的增强层才能完成

15. .MPEG-2视像标准支持的可变编码方式–主要包括：• 信噪比可变(SNR Scalability)编码：针对需要多种视像质量的应用，使用增强层编码提供比较高的信噪比• 空间分辨率可变(Spatial Scalability)编码：针对需要同时广播多种空间分辨率视像的应用，用增强层编码提供比较高的空间分辨率• 时间分辨率可变(Temporal Scalability)编码：针对从远程通信到HDTV以及需要有立体感视像的应用• 数据分割(Data Partitioning)编码：针对有两个信道传输视像数据位流的应用，它将量化的DCT系数进行分割，编码后分别送到不同的信道• 混合可变(Hybrid Scalability)编码：组合以上三种增强层编码中的任何两种编码，可获得不同性能的视像

16. MPEG-4 AVC / H.264是ITU-T和ISO/IEC联合推荐的视像编码工业标准
17.MPEG-4 Visual与传统视像编码的最大差别是引入了“对象编码”的思想

18. 提高编码效率的主要技术（1）编码效率明显提高（2）.应用范围得到进一步扩大：

2 在MPEG视像数据压缩技术中，目前利用了视觉系统的哪两种特性？• 人的视觉系统具有的两种特性可以用来压缩电视图像数据。一是人眼对色度信号的敏感程度比对亮度信号的敏感程度低，利用这个特性可以把图像中表达颜色的信号去掉一些而使人不易察觉；二是人眼对图像细节的分辨能力有一定的限度，利用这个特性可以把图像中的高频信号去掉而使人不易察觉。• 3 MPEG-1编码器输出的电视图像的数据率大约是多少？ • 1.15 Mbps• 4 MPEG专家组在制定MPEG-1/-2 Video标准时定义了哪几种图像？哪种图像的压缩率最高？哪种图像的压缩率最低？• (1) MPEG专家组定义了三种图像：帧内图像I(intra)，预测图像P(predicted )和双向预测图像B (bi-directionally interpolated )。• (2) 双向预测图的压缩率最高，帧内图像的压缩率最低。

• 7 视像的空间分辨率和时间分辨率是什么意思？ • 空间分辨率：图像的尺寸。例如，PAL制图像尺寸：

720×576，360×288。• 时间分辨率：图像的帧数每秒。• 例如，PAL制电视图像的时间分辨率为30帧/秒，NTSC电视图像的时间分辨率为25帧/秒，电影图像的时间分辨率为24帧/秒。

• 8 在MPEG-1和MPEG-2中，典型的宏块由多少个像素组成；子采样为4:2:0的宏块分成多少个亮度图块、红色差图块和蓝色差图块，每个图块由多少个像素组成。• 在MPEG-1, MPEG-2中，典型的宏块为16×16像素。• 在子采样为4:2:0的宏块分成4个亮度图块、1个红色差图块和1个蓝色差图块，每个图块由8×8个像素组成。

• 9 什么叫做移动估算？• 移动估算(motion estimation)是计算移动矢量的过程，也就是在参考图像中查找与当前编码图块匹配最佳的图块的过程。

10 什么叫做移动补偿？• 计算当前编码图块与参考帧中的图块的像素值之差的过程。• 在编码时，使用移动矢量表示当前帧的图块相对于过去或将来帧的图块的偏移量，使用当前帧的与过去或将来帧的像素值的差值表示图像的变化程度，这个差值在重构当前帧的图块时作为“补偿量”；在解码时，利用移动矢量确定当前帧的图块相对于过去或将来帧的图块位置，使用过去或将来帧的像素值和编码时得到的补偿量重构当前帧的图块。

• 12 MPEG-4 AVC/H.264提高编码效率的主要技术是什么？• MPEG-4 AVC/H.264提高编码效率的主要改进技术包括：• (1) 采用可变图块大小的帧间预测和移动补偿，预测图块的大小不再局限于16×16像素，可小到4×4像素，这样就提高了预测精度，如将移动矢量精度提高到1/4个像素。• (2) 采用空间的帧内预测，预测图块的大小可以是16×16的宏块，也可以是4×4像素的图块，而且定义了多种预测方式，目的是找到相关性最大的预测。• (3) 采用从DCT演变来的称为“整数变换编码”的方法，提高了编码的运算速度。• (4) 熵编码采用编码效率更高的前后文自适应可变长度编码(context-based adaptive variable length coding, CAVLC)和前后文自适应二元算术编码(Context-based Adaptive Binary Arithmetic Coding，CABAC)。• 此外，标准还采用了多参考帧(multiple reference frame)和消除“块状失真(因压缩率过高导致重构图像呈现的块状外观)”滤波等技术。
1. 从CD-DA过渡到CD-ROM需要解决两个重要问题（1）地址问题（2）误码率问题

2、CD盘的结构组成部分：保护层；反射层；刻槽；聚碳酸酯衬垫

3、激光唱盘分为3个区：导入、导出和声音数据记录区

4. 数据记录原理• 磁光盘(magneto optical disc，MOD)–利用磁的记忆特性，借助激光来写入和读出数据

• 相变光盘(phase change disc，PCD) –利用激光特殊材料在加热前后的反射率不同记忆1和0• 只读CD光盘–在盘上压制凹坑的机械办法记录数据，凹坑的边缘记录的是1 凹坑和非凹坑的平坦部分记录的是0

5. .在激光唱盘上1秒钟的声音需要占据的存储空间为–计算过程：•1秒×44 100样本/秒×2字节/样本×2(左右两个通道)•=176.4 千字节

6. 声音数据的通道编码将用户数据转换成适合存储或传输媒体的代码的过程（1）从信号本身提取自同步信号（2）使读出信号的频带变窄

7. 激光唱盘(CD-DA)、数字激光视盘(VCD)和CD-ROM的制作过程都相同，大致分成三个阶段

1. 原版盘预制作(premastering)或称母盘预制作2. 原版盘制作(Mastering)或称为母盘制作3. 大批量复制

DVD的存储容量是怎样提高的减小激光波长 635/650 nm 780 nm加大N.A.(数值孔径) 0.6 0.45

减小光道间距 0.74 µm 1.6 µm减小最小凹凸坑长度 0.4 µm 0.83 µm

8VCD播放机的基本结构 VCD播放机主要由3个核心部件组成1CD盘驱动器或称CD加载器2.MPEG解码器3微控制器

9.DVD播放系统的主要功能部件1）DVD加载器2）数字信号处理器(DVD-DSP) 3）数字声音和电视图像解码器4）微控制器

10.HD DVD (High Definition DVD) –由Toshiba、Hitachi和NEC等公司在2003年11月联合发布的大容量光盘存储器标准2.BD(Blu-ray Disc) –由Sony，Philips和Panasonic等公司在2002年2月联合发布的大容量光盘存储器标准

1 只读光盘是如何记录“0”和“1”的？

• 只读光盘通常是指CD/DVD系列只读光盘。用在盘上压制凹坑的机械办法来记录“0”和“1”。凹坑的边缘代表“1”，凹坑和非凹坑的平坦部分代表“0”，凹坑的长度和非凹坑的长度都代表有多少个“0”。

• 2 CD-DA的音乐信号的采样频率为什么选择44.1 kHz？• 人耳朵(因人而异)能听到的声音信号频率范围是20～20 000 Hz，为了避免高于20 000 Hz的高频信号干扰采样，在进行采样之前，需要对输入的声音信号进行滤波。考虑到滤波器在20 000 Hz的地方大约有10%的衰减，所以可以用22 000 Hz的2倍频率作为声音信号的采样频率。但是，为了能够与电视信号同步，PAL电视的场扫描为50 Hz，NTSC电视的场扫描为60 Hz，所以取50和60的整数倍，选用了44 100 Hz作为激光唱盘声音的采样标准。

• 3 激光唱盘音乐信号的样本位数是16，它的信噪比是多

少？如果样本位数提高到20，它的信噪比是多少？• (1) 96分贝• (2) 120分贝

• 4 为什么物理线路上传输的数字信号都需要采用通道编码？• 主要原因有两个，一是为了改善读出信号的质量，二是为了在记录信号中提取同步信号。• (例如，有连续多个字节的全“0”信号或者全“1”信号要记录到盘上，如果不作通道编码就把它们记录到盘上，读出时的输出信号就是一条直线，电子线路就很难区分有多少个“0”或者多少个“1”信号。而对于没有规律的数字信号，读出时的信号幅度和频率的变化范围都很大，电子线路很难把“0”和“1”区分开，读出的信息就很不可靠。因此通俗说来，通道编码实际上就是要在连续的“0”之间插入若干个“1”，而在连续的“1”之间插入若干个“0”，并对“0”和“1”的连续长度数目即“行[游]程长度”加以限制。)

• 5 CD盘中的EFM是什么意思？

• EFM (eight-to-fourteen modulation)是指由8比特的代码调制成14比特的代码。• (解释：它是一种物理通道编码技术，使用这种技术可增加CD盘上信息凹坑和非凹坑的长度，降低读出信号的频率带宽。CD使用脉冲调宽技术，把8比特的用户数据变换成14比特的通道码。在红皮书和IEC 908标准中，在14比特的码之间增加3比特的合并位，构成8比特到17比特调制编码。在物理存储器上存储数据或者在物理线路上传输数字信号都需要对用户数据进行通道编码。物理盘上记录的数据和真的用户数据之间需要做变换处理，这种处理统称为通道编码。采用通道编码的目的主要是两个，第一是为了改善信号质量，使得读出信号的频带变窄；第二是为了在接收端能够从信号本身提取自同步信号。)