您的当前位置：首页多媒体基本知识概述

多媒体基本知识概述

来源：意榕旅游网

多媒体基本知识概述

1、多媒体知识： 1.1多媒体知识概述

 基本概念

多媒体信息通常指用文本、图形、图像、动画、音频与视频影像等形式表示的信息。多媒体计算机技术是指利用计算机交互地综合处理相互之间有联系的文本、图形、图像、动画、音频、视频等多种信息。多媒体的要紧特性表现在信息载体的多样性、交互性与集成性。

多媒体技术是指能对多种载体上的信息与多种存储体上的信息进行处理的技术；而媒体是指承载信息的载体；

多媒体具有交互性而媒体不具备交互性；屏幕更新频率：显示器每秒更新的次数；

彩数：显示画面的色彩数；(bpp是指表示每个像素所需的2进制位数) 分辨率：显示画面的细腻程度；  关键技术

在多媒体的研究与开放中，利用了许多关键技术，这些技术是支持多媒体研究与开发的核心。  数据压缩技术

数字化的声音与图像包含了大量的数据。假如不进行数据压缩，实时处理数字化的声音与图像信息所需要的存储容量、传输率与计算速度都是目前计算机难以承受的。因此数据压缩技术一直是多媒体各项研究的重点。  大规模集成电路（VLSI）制造技术

进行声音与图像信息的压缩处理要求进行大量的计算。VLSI技术的进展让我们能够生产低廉的数字信号处理器（DSP）芯片用硬件来完成复杂的计算处理。  大容量的光盘存储器（CD-ROM）

多媒体信息尽管通过了压缩处理，但还是含有大量的数据，因此需要有大容量的存储设备来储存这些信息。  实时多任务操作系统

多媒体技术需要同时处理声音、文字、图像等多种媒体信息，其中声音与视频图像还要求实时处理，需要有能支持对多媒体信息进行实时处理的操作系统。  构成

通常，多媒体系统由下列4个部分构成。  硬件系统

最重要是根据多媒体技术标准而研制生产的多媒体信息处理芯片、板卡与光盘驱动器等。  多媒体操作系统

这是多媒体的核心，具有实时任务调度、多媒体数据转换与同步操纵、对多媒体设备的驱动与操纵，与图形用户界面管理等。

 媒体处理系统工具

它是多媒体重要的构成部分，也称之多媒体系统开发工具软件。

 用户应用软件

1.2图形与图像

 基本原理

◆亮度、色调与饱与度

亮度：表示光的明亮程度，它与被观察物体的发光强度与人类视觉系统的视敏功能有关。色调：反映的是颜色的种类，是决定颜色的基本特性。

饱与度：指颜色的纯度，即掺入白光的程度，或者者说是颜色的深浅程度。色调与饱与度通称之色度。 ◆彩色空间

在多媒体技术中，用得最多的是RGB彩色空间表示。而通常在彩色电视系统中，使用的是YUV彩色空间。

另外，还有CIE XYZ、CIE LAB、CCIR601-2YCbCr彩色空间等。 ◆图形图像文件

图形是指用计算机绘制工具绘制的画面，包含直线、曲线，圆/圆弧，方框等成分。图形通常按各个成分的参数形式存储，能够对各个成分进行移动、缩放、旋转与扭曲等变换，能够在绘图仪上将各个成分输出。

图像是由输入设备捕捉的实际场景或者以数字化形式存储的任意画面。图像能够用位图或者矢量图形式存储。

●位图

也叫黑白图象，它是按图像点阵形式存储各像素的颜色编码或者灰度级。位图适于表现含有大量细节的画面，并可直接、快速地显示或者印出。其存储量大，通常需要压缩存储。 ●矢量图

它用一组指令或者参数来描述其中的各个成分，易于对各个成分进行移动、缩放、旋转与扭曲等变换。矢量图适于描述由多种比较规则的图形元素构成的图形，但输出图像画面时将转换成位图形式。

图形图像的要紧指标有分辨率、色彩数、图形灰度。分辨率有屏幕分辨率与输出分辨率。前者用每英寸行数与列数表示，后者是以每英寸的像点数表示。图形图像的色彩数与灰度级则是用位来表示。真彩：24位图形与图像文件格式很多，下列要紧介绍几种常见的格式。

 BMP：PC机上最常见的位图格式，特别在Windows系统中使用特别广泛。

 GIF：要紧用于在不一致平台上进行图像交换，是通过压缩的图形格式。GIF文件最大MB，颜色数最多

256色。

 JPEG：文件压缩比较高，文件比较小。尽管它使用的是有损压缩算法，但对图形图像的缺失影响并非很大。

其色彩数最高可达到24位。

 TIF：有压缩与非压缩两大类，是许多图像应用软件所支持的要紧文件格式之一，其最高支持的色彩数可

达16M。

 PSD：Photoshop中的标准文件格式，专门为Photoshop而优化。  CDR：CorelDraw的文件格式。

注：Photoshop与CorelDraw都是目前最流行的图形图像处理软件。 1.3音频

 基本概念

模拟录音方式直接记录音频信号的波形，重放时用磁头拾取信号。目前模拟录音动态范围可达到80db（分贝，信噪比的单位），为进一步提高音质，使用数字音频技术。

计算机内的音频务必是数字形式的。数字声音是一个数据序列，是一种采样的声音，它是由模拟声音经抽样、量化与编码后得到的。

在对音频数据进行压缩时，需要从语音质量、数据率与计算量3个方面来加以考虑。语音压缩编码从压缩方法来看，可分为3类。

➢ 波形编码：使用这种编码可获得高质量语音，但数据率不易降低。 ➢ 参数编码：该方法的数据率低，但质量又不高。 ➢ 混合编码：综合前面两种方法的编码方法。语音、语言与音乐合成

语音合成从合成使用的技术来讲可分为：

➢ 发音参数合成 ➢ 声道模型参数合成 ➢ 波形编辑合成假如从合成策略上又可分为：

➢ 频谱逼近 ➢ 波形逼近

实现计算机语音输出有两种方法：一.录音/重放；二.文-与转换；

语言合成目前与仅处于文字到语音转换的层次上。文-语转换（TTS）是一种智能型的语音合成，需要建立语音参数数据库、发音规则库等。音乐合成技术有两种。 ◆调频（FM）合成

FM合成方式是将多个频率的简单声音合成复合音来模拟各类乐器的声音。FM合成方式是早期使用的方法，用这种方法产生的声音音色少、音质差。 ◆波形表（Wave Table）合成

这种方法是先把各类真正乐器的声音录下来，再进行数字化处理形成波形数据，然后将各类波形数据存储在只读存储器中。发音时通过查表找到所选乐器的波形数据，再通过调制、滤波、再合成等处理形成立体声送去发音。存储声音样本的ROM容量的大小对波表合成效果影响很大。 MIDI:

MIDI（musical instrument digital interface）是数字乐器接口的国际标准，它定义了电子音乐设备与计算机的通讯接口，规定了使用数字编码来描述音乐乐谱的规范。

常见的MIDI设备有电子琴等。计算机中以MID为扩展名的文件称之MIDI文件，其中存放的是对MIDI设备的命令，即每个音符的频率、音量、通道号等指示信息。最后播出的声音是由MIDI设备根据这些信息产生的。 MIDI声音能够用于配音，它的缺点是对回放设备的依靠太强，还有就是不能记录人声；常见音频格式：

名称 WAVE MOD 扩展名 WAV MOD、ST3、XT、S3M、FAR与669等 MPEG-3 MP3 特点完整记录声音的波形，不使用压缩文件中不仅存放了乐谱，还存放了乐曲使用的各类音色样本。回放效果明确，音色种类永无止境。目前最流行的格式，压缩较大。有损压缩，音质不完美 Real Audio RA 压缩比高，失真度小有损压缩，音质并不好 Create Musical CMF Format CD Audio CDA 唱片使用格式，记录的是波形流无法编辑、文件太大 MIDI 1.4视频

动画（视频）

动态图像，包含动画与视频信息，是连续渐变的静态图像或者图形序列，沿时间轴顺次更换显示，从而构成运动视感的媒体。

当序列中每帧图像是由人工或者计算机产生的图像时，称之动画。

当序列中每帧图像是通过实时摄取自然景象或者活动对象时，称之视频。

动画是以每秒15~20帧的速度顺序的播放静止图像帧来产生运动的错觉。比较流行的格式有两种。

➢ 苹果公司的Quicktime：软件压缩与解压缩（注意几个数字参数）； ➢ 微软的AVI：特点是可伸缩性， 1.5数据压缩与编码技术标准

◆H.261

H.261是用于音频视频服务的视频编码解码器，也称之P×标准。由CCITT（ITU-T）制定。其应用目标是可视电话与视频会议系统。含有此标准的系统务必能实时的按标准进行编码与解码。

H.261于JPEG、MPEG标准的区别在于它是为动态使用而设计的，并提供完全包含的组织的高水平的交互操纵。 ◆JPEG

JPEG是静止图像压缩与解压缩算法的标准，它是基于DCT的有损算法，是ISO的国际标准。 MPEG在三方面优于其他的压缩/解压方案：开始就是一个国际化的标准，兼容性很好；

比其他算法有更高的压缩比，最高可达到200：1；在提供高压缩比的同时，对数据的缺失很小； ◆MPEG

MPEG-X是一组由ITU与ISO制定公布的视频、音频与数据的压缩标准。 ◆MPEG-1

制定于1992年，传输率最高可达4Mbps~5Mbps，质量级别与VHS相当。可用于记录媒体或者是在Internet上传输音频。 ◆MPEG-2

MID 音乐工业的数据标准不能记录语音 Creative公司专用音乐格式。兼容性差缺点文件太大低音效果差制定于1994年，传输率在3Mbps~10Mbps之间，DVD指定标准。 ◆MPEG-4

传输率要求在4800bps~000bps之间。其要紧特点是交互性与综合性。更适合交互AV服务经历即远程监控，，是第一个使观众由被动变主动的动态图象标准。 ◆DVI

DVI视频图像压缩算法的性能与MPEG相当，图像质量可达到VHS的水平。压缩以后的图像传输率约为1.5Mbps。 1.6 多媒体应用开发过程

多媒体创作系统是多媒体电脑技术的严格重要构成部分，它介于多媒体工作平台于应用软件之间，是支持应用开发人员进行多媒体应用软件创作的工具，因此也称之多媒体创作工具。

多媒体创作工具的初衷是非计算机领域的专家对计算机技术的不熟悉，因此就需要一种工具，使应用开发人员不用编程也能做出很优秀的多媒体软件产品，这种工具称之为多媒体创作工具，用这种工具做出来的产品称之——节目。

多媒体创作工具是能够用来集成各类媒体、并可设计阅读信息内容方式的软件。其功能日趋完善，总结起来，下列几个方向与功能是多媒体创作工具应具备的：

1．编辑能力及环境

编辑能力要紧是支持用户对节目所需要的外部媒体资料的生成、增删、修改于管理能力。这些功能不是通过用户编程来实现，而是在系统中通过可视化的界面，帮助用户使用简便操作来达到相同的效果。

2. 媒体数据输入能力

即处理静态与动态的多媒体的能力，支持的格式越多越好。 3. 交互能力

从最简单的设置按钮来连接事件，道后来的超链接功能，再道现在的菜单交互、可视媒体对象交互、文字输入交互等，随着多媒体创作工具对系统硬件的操纵能力的加强，语音交互、触控交互、三维立体触控交互与未来的智能推断交互都是交互能力的新技术。

4. 功能扩充能力

为了满足高层次节目的需求，媒体创作工具提供外部接口，能够连入其他的高级对象与组件，这样就实现了三级用户开发环境，这三级用户是不懂编程的普通用户、稍懂编程的用户与富有丰富编程经验的用户。

5. 调试能力

目前还制停留再放映节目的范围，未来的调试工具应该是多断点、逆向回放等功能，再调试过程中显示调试信息。 6.动态数据交换能力

使用变量给某些媒体构件给予属性，同时能够通过程序改变变量，从而达到动态改变媒体属性的目的。 7.数据库功能

应具有数据库的查询、排序、更新、删除与增加等功能。 8.网络组件及模板套用能力

能有效支持一组人通力制作一个节目的创作工具称之组件版本，支持异构电脑系统之间的互连与资料传递，。模板功能是提高拥护编辑效率的一个重要手段，方便用户大量制作某一类型的节目。

9.其他能力 2．多媒体重点与难点

1．图形与图象的各类格式、几个要紧的概念：

2．音频采集计算：声音文件的存储量=采样频率×采样位数×声道数

3．视频图象的容量计算与国家标准：图像文件的存储量=分辨率×色彩数（位）。 4．视频的几种集中压缩格式：例题1：

MPEG-I编码器输出视频的数据率大约为__C__。PAL制式下其图像亮度信号的分辨率为_A__，帧速为__B__。（多媒体）

(44)A．128Kb/s (45)A．352×288 (46)A．16帧/秒

B．320Kb/s B．576×352 B．25帧/秒

C．1.5Mb/s C．720×576 C．30帧/秒

D．15Mb/s D．1024×720 D．50帧/秒

例题2：

在多媒体的音频处理中，由于人所敏感的声频最高为A赫兹（Hz），因此数字音频文件对音频的采样频率为B赫兹（Hz）。对一个双声道的立体声，保持1秒钟声音，其波形文件所需的字节数为C，这里假设每个采样点的量化位数为8位。 MIDI文件是最常用的数字音频文件之一，MIDI是一种D，它是该领域国际上的一个E。

A： ①50 ②10k ③22k ④44k

B： ①44.1k ②20.05k ③10k ④88k

C： ①22050 ②88200 ③

1700 ④44100

D： ①语音数字接口 ②乐器数字接口

③语音模拟接口 ④乐器模拟接口 E： ①操纵方式 ②管理规范 ③通信标准 ④输入格式

在音频处理中，采样频率是决定音频质量的一个重要因素，它决定了频率响应范围。对声音进行采样的三种标准与采样频率分别为：语音效果（11 kHz）、音乐效果（22 kHz）、高保真效果（44.1 kHz），目前声卡的最高采样率为44.1KHz。

另外，通常人的听觉带宽为20Hz~20kHz，人敏感的声频最高为22kHz。

信号编码的位数是决定音频质量的另一个重要因素，它决定数字采样的可用动态范围与信噪比。16位声卡的采样位数就是16。

声音文件的存储量等于采样频率×采样位数×声道数。如本题所求波形文件的字节数计算公式如下： 44.1kHz×8bit×2×1秒=705.6Mbit/8=88.2MB=88200Byte [答案]

A：③ B：① C：② D：② E：③

例题3：

多媒体应用需要对庞大的数据进行压缩，常见的压缩编码方法可分为两大类，一类是无损压缩法，另一类是有损压缩法，也称__(47)__。__(48)__属于无损压缩法。

(47) A. 熵编码 (48) A. MPEG压缩

B. 熵压缩法 D.子带编码

C. MPEG压缩法 C. Huffman编码

D. JPEG压缩法 D. 模型编码

● 若每个像素具有 8 位的颜色深度，则可表示__(49)__种不一致的颜色，若某个图像具有 0X480 个像素点，其未压缩的原始数据需占用__(50)__字节的存储空间。

(49) A. 8 (50) A. 1024

B. 128 B. 19200

C. 256 C. 38400

D. 512 D. 307200

● 声音的三要素为音调、音强与音色，其中音色是由混入基音的__(51)__决定的。

若对声音以 22.05kHZ 的采样频率、8 位采样深度进行采样，则 10 分钟双声道立体声的存储量为__(52)__字节。

(51) A. 响度 (52) A. 260000

B. 泛音 B. 441000

C. 高音 C. 216000000

D. 波形声音 D. 108000000

●在数据压缩编码的应用中，哈夫曼（Huffman）算法能够用来构造具有__(13)__的二叉树，这是一种使用了__(14)__的算法。

(13) A. 前缀码 (14) A. 贪心

B. 最优前缀码 D. 分治

C. 后缀码 C. 递推

D. 最优后缀码 D. 回溯

2022年10月11日星期二03:19:07

10.11.202203:1903:19:0722.10.113时19分3时19分7秒Oct. 11, 2211 October 20223:19:07 AM03:19:07

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文