多媒体的知识:软件设计师-1.多媒体基础知识

0.1媒体概念和分类

▶媒体:

  • 传播信息的载体,如语言、文字、图形、视频、音频等。
  • 存贮信息的载体,如ROM、RAM、磁带、磁盘、光盘等。

▶媒体的分类:

  • 感觉媒体:直接用于人的感觉器官,使人产生直接感觉的媒体。
  • 表示媒体:传播感觉媒体的中介媒体,用于数据交换的编码。
  • 表现媒体:进行信息输入输出的媒体。
  • 存储媒体:用于存储表示媒体的物理介质。
  • 传输媒体:传输表示媒体的物理介质。
  • 交换媒体包括存储媒体和传输媒体。

▶媒体的特征:

  • 多样性:信息媒体的多样化
  • 集成性:实现人对信息的集成、操作这些媒体信息的软件和设备的集成
  • 交互性:实现了人对信息的主动选择、使用、加工和控制
  • 非线性:多媒体技术借助超文本链接的方法,把内容以一种灵活的方式呈现给读者
  • 实时性:在人的感觉系统允许的情况下进行多媒体处理和交互
  • 方便性:用户可以按照自己的需求很方便的使用信息
  • 动态性:信息结构的动态性,可以按照自身目的和认知重新组织信息

0.2音频

▶基本参数:

  • 幅度:声波的振幅,以分贝(dB)为单位
  • 频率:
    • 说话频率范围是 300~3400 Hz
    • 人耳能听见频率范围是 20~20 KHz
    • 乐器频率范围 20~20 KHz
    • 次声波频率 < 20
    • 超声波频率 > 20 KHz

▶声音信号的数字化

  • 采样:
    • 采样频率(采样周期:每隔相同时间采样一次)
    • 采样频率应为声音最高频率2倍。
  • 量化:
    • AVD转换(模数转换)
    • 量化精度(量化分辨率):样本用二进制表示,位数多少反映精度
  • 编码:
    • 按照一定的格式进行数据编码及组织文件
    • 可选择数据压缩编码存储,减少存储量

数据传输率(bps) = 采样频率(Hz)* 量化位数 * 声道数

数字声音有两种:

  • 波形声音:对实际声音的波形信号进行数字化(采样、量化)而获得
  • 非波形声音:使用符号、脚本及模型对声音进行描述,用合成的方法重构声音。

▶音频文件格式

  • .wav:微软公司发布的音频文件格式,Windows系统使用的标准音频文件格式。记录音乐的模拟信号的采样数值。为波形文件,质量高、数据量大。
  • .mod:乐谱和乐曲使用的各种音色样本。
  • .mp3:最流行的音频文件格式。
  • .ra:网络上的音频格式,流媒体技术,强大的压缩比和极小失真
  • .mid:非波形采样点的音乐格式,工业标准,文件非常小
  • .voc:Create公司发布的波形音频文件格式
  • .snd:数字声音文件格式,支持压缩
  • .aif:Apple计算机上的音频格式
  • .au:Unix系统中的数字文件格式
  • 常见音频格式:wav、sound、vocice、mod、mp3、Real Audio、CD Audio、MIDI 等

0.3 图形和图像

▶图形和图像

  • 图形(矢量图):基本元素为图元,用数学的方式来描述一幅图,放大、缩小、扭曲等变换后不会损失画面细节。存储空间小。(适用于线框型画图、工程制图和美术字等)

  • 图像(位图):基本元素为像素,用若干二进制位来指定像素的颜色、亮度和树形。放大后会失真。存储空间大,需要进行压缩。主要参数有分辨率、色彩模式、颜色深度。

    • 黑白图像
    • 灰度图像
    • 彩色图像
      • 真彩色:有R、G、B三个基色分量,每个基色分量直接决定显示器设备的基色强度
      • 伪彩色:把像素值当做彩色查找表的表项入口地址,去查找一个显示图像时使用的R、G、B强度值
      • 直接色:每个像素分成R、G、B分量,每个分量作为单独的索引值对它做变换。

▶图像的基本参数

  • 图像分辨率
    • 一幅图像的像素密度,每英寸多少点(dpi)表示图像大小
    • 200dpi 扫描一副2.5英寸的照片,则可以得到400*500像素点的图像
  • 像素深度
    • 存储每个像素所用的二进制数,度量图像的色彩分辨率
    • 图像深度为 b 位,则该图像最多的颜色数或灰度级为 2ᵇ 种
    • 对于 8 为的单色图素,灰度为 2⁸ = 256

▶显示器的基本参数

  • 刷新频率
    • 图像在显示器上的更新速度。
    • 刷新频率越高,屏幕的闪烁感就越小,图像越稳定,视觉效果也越好
  • 对比度
    • 显示器全白画面亮度与全黑皇马亮度的比值
  • 显示分辨率
    • 显示器上能够显示的像素数目。
    • 分别率越高,项目越清楚,屏幕上的项目越小

▶图像文件格式

  • bmp :Windows标准位图文件格式,与设备无关的位图格式,无压缩,存储空间大。
  • gif:图像文件格式,用于网络传输,数据块为单位传输信息,采用无损压缩算法。
  • tif:图像文件格式,扫描仪和桌面出版系统中较为普及
  • pcx:图像文件格式,pc画笔的图像文件格式
  • png:作为 gif 替代品,支持无损数据压缩
  • jpg:有损压缩的静态图像文件格式,压缩比高,适合于处理大量图像的场合。
  • wmf:只在 Windows 中使用,保存函数调用信息。

常见图像图形文件格式:bpm、dib、pcx、dif、gif、jpeg、png、tif、psd。

0.3 动画和视频

▶视频文件格式

  • gif :用于网络传输(GIF文件)
  • fli / flc :Autodesk公司出品的彩色动画文件格式,无损压缩(Flic文件)
  • avi :微软公司发布的视频文件格式(avi 文件)
  • mov / qt :apple 公司发布的视频文件格式,较小存储空间,开放性(Quick Time 文件)
  • rm / rmvb : 流式视频文件格式,实现影像实时传输与播放(RealVideo文件)
  • .mpeg / mpg / dat / mp4:运动图像压缩标准,质量好,兼容性好(mpeg文件)
  • wmv : 微软开发的视频编码解码和其相关的视频编码格式的统称

0.4 多媒体相关计算内容

▶容量计算

  • 图像容量计算
    • 知道像素、位数:每个像素为16位,图像为640x480像素,求容量 : 640x480x16/8 = 614 400 B
    • 知道像素、色彩数:图像为640x480像素,256色图像,求容量: 640x480xlog₂(256) = 307 200 B
  • 音频容量计算
    • 每秒容量 = 采用频率(Hz) x 量化/采用位数 x 声道数 ÷ 8
  • 视频容量计算
    • 容量 = 每帧图像容量(Byte) x 每秒帧数 x 时间 + 音频容量 x 时间
  • ▶压缩

    • 压缩:压缩是一种通过特定的算法来减小计算机文件大小的机制。可以减小文件的字节总数,使文件能够它通过较慢的互联网是实现更快的传输,此外还可以减少文件的磁盘占用空间。

      压缩不属于加密技术,不能增加信息的安全。

    • 无损压缩:冗余压缩,可以将数据压缩到原来的 1/2 到 1/4,哈夫曼算法和LZW算法,利用数据的统计冗余进行压缩,可以保证在数据压缩和还原过程中,图像信息没有所耗或失真。

    • 有损压缩:压缩比可以达到 10:1 甚至 100:1,压缩是不可逆的,用于重构信号。

      不一定非要与原始信号完全相同的场合,压缩比高。(DVD、VCD、MP3、JPEG、MPEG、RMVB、WMA、WMV等)

    0.5习题

    题1

    人眼看到任一彩色光都是亮度、色调和饱和度3个特性的综合效果,其中()反映颜色的纯度。

    A.色调

    B.饱和度

    C.灰度

    D.亮度

    答案 B

    视觉上的彩色可用亮度、色调和饱和度来描述。

    • 亮度:光作用与人言时所刺激的明亮程度的感觉,与被观察物体的发光强度有关;由于其强度不同,看起来可能亮一些或暗一些。对于同一物体照射光越强,反射光也越强,感觉越亮。对于不同物体在相同照射情况下,反射性越强者看起来越亮。显然,如果彩色光的强度降至使人看不清了,在亮度等级上它应与黑色对应;同样,如果其强度变得很大,那么亮度等级应与白色对应。此外,亮度感还与人类视觉系统的视敏功能有关,即使强度相同,颜色不同的光进入视觉系统,也可能会产生不同的亮度。
    • 色调:色调是人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、绿色等都是指色调。不透明物体的色调是指该物体在日光照射下,所反射的各光谱成分作用于人眼的综合效果;透明物体的色调则是透过该物体的光谱综合作用的效果。
    • 饱和度:指颜色的纯度,即参入白光的程度,或者说是指颜色的深浅程度。对于同一色调的彩色光,饱和度越深,颜色越鲜明,或者说越纯。例如,当红色加进白光之后,冲淡为粉色,其基本色调还是红色,但是饱和度降低;换句话说,单色的饱和度比深色的饱和度要低一些。饱和度还和亮度有关,因为若在饱和的彩色光中增加白光的成分,由于增加了光能,会引起色调的变化,参入白光时仅引起饱和度的变化。

    题3

    位图与矢量图相比,位图()。

    A.占用空间较大,处理侧重于获取和复制,显示速度快

    B.占用空间较小,处理侧重于绘制和创建,显示速度慢

    C.占用空间较大,处理侧重于获取和复制,显示速度慢

    D.占用空间较小,处理侧重于绘制和创建,显示速度快

    答案 A

    矢量图形是用一系列计算机指令来描述和记录图的内容,即通过指令描述构成一幅图的所有直线、曲线、圆、圆弧、矩形等图元的位置、维数和形状,也可以用更为复杂的形式表示图像中曲面、光照和材质等效果,矢量图法实质上是用数学的方式(算法和特征)来描述一幅图形图像,在处理图形图像时根据图元对应的数学表达式进行编辑和处理。在屏幕上显示一幅图形图像时,首先要解释这些指令,然后将描述图形图像的指令转换成屏幕上显示的形状和颜色,因此这种图形显示速率慢。编辑矢量图的软件通常称为绘图软件,如适于绘制机械图、电路图的 AutoCAD 软件等。这种软件可以产生和操作矢量图的各个成分,并对矢量图形进行移动、缩放、叠加、旋转和扭曲等变换。编辑图形时将指令转变成屏幕上所显示的形状和颜色,显示时也往往能看到绘图的过程。由于所有的矢量图形部分都可以用数学的方法加以描述,从而使得计算机可以对其进行任意方法、缩小、旋转、变形、扭曲、移动和叠加等变换,而不会破坏图形的画质。但是,用矢量图形格式表示复杂图像(如人物、风景照片),并且要求很高时,将需要花费大量的时间进行变换、着色和处理光照效果等。因此,矢量图形主要用于表示线框型的画图、工程制图和美术字等

    位图图像是指用像素点来描述的图。图像一般是用摄像机或扫描仪等输入设备捕捉实际场景画面,离散化为空间、亮度、颜色(灰度)的序列值,即把一幅彩色图或灰度图分成许许多多的像素(点),每个像素用若干二进制位来指定该像素的颜色、亮度和属性。位图图像在计算机内存中由一组二进制位组成,这些位定义图像中每个像素点的颜色和亮度。图像适合于表现细腻,层次较多,色彩较丰富,包含大量细节的图像,并可直接、快速地在屏幕上显示出来。但占用存储空间较大,一般需要进行数据压缩

    题4

    多媒体计算机体系中,内存和光盘属于()。

    A.感觉媒体

    B.传输媒体

    C.表现媒体

    D.存储媒体

    答案 D

    • 感觉媒体:指直接作用与人的感觉器官,使人产生直接感觉的媒体,如声音、图形、图像、动画等。
    • 表示媒体:指为了加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体,常见的有各种编码方式,如文本编码、图像编码和声音编码等
    • 显示媒体表现和获取信息的物理设备,如输入显示媒体键盘、鼠标和麦克风等,输出显示媒体如显示器、打印机和音箱等。
    • 存储媒体存储数据的物理设备,如磁盘、光盘和内存等。
    • 传输媒体传输数据的物理载体,如电缆、光缆、和交换设备等。

    题5

    CD上剩余的采样频率为 44.1kHz,样本精度为32b,双声道立体声,那么其未经压缩的数据传输率为()。

    A. 176.4 kb/s

    B. 1411.2 kb/s

    C. 2822.4 kb/s

    D. 3072.0 kb/s

    答案 C

    本题考察波形声音信号的数据传输率。

    波形声音是一个用来表示声音振幅的数据序列,即通过对模拟声音按一定间隔采样获得的幅度值,在经过量化和编码后得到的便于计算机存储和处理的数据格式。未经压缩的数字音频数据传输率可按下式计算: $$ 数据传输率(b/s) = 采用频率(Hz)*量化位数(b)*声道数 $$ 因此本题结果是 44.1 x 32 x 2 kb/s=2,822.4 kb/s,选择 C

    题6

    以下显示器像素点的规格中,最好的是()。

    A. 0.37

    B. 0.35

    C. 0.32

    D. 0.29

    答案 D

    显示器上的文本或图像是由点组成的,屏幕上的点越密,则分辨率越高。屏幕上相邻两个同色点的距离称为点距,点距越大,所见到的“颗粒”就越大,显示效果就越差;点距越小,分辨率就越高。所以试题中给出显示器像素点距的规格中,最好的是 0.29。

    题7

    某幅图像具有 1024 x 860 个像素点,若每个像素点具有16位颜色深度,则可表示()种不同的颜色。

    A. 16

    B. 512

    C. 1024

    D. 65536

    答案 D

    颜色深度是表示位图图像中单个像素的颜色或灰度所占的位数,16位颜色深度,表示每个像素有16位颜色位,可表示2¹⁶ 种不同的颜色,,因此本题答案选择 D。而题目如果告知某个图像有 65536 种不同的颜色,那么其每个像素用多少位来描述,也应该清楚的知道是16位。

    题8

    在彩色喷墨打印机中,将油墨进行混合后得到的颜色称为()。

    A.相减

    B.相加

    C.互补

    D.比例

    答案 A

    彩色打印机的纸张是不能发射光线的,因而彩色打印机使用能吸收特定的光波而发射其他光波的油墨或颜料来实现。用油墨或颜料进行混合得到的色彩称为相减混色。之所以称之为相减混色,是因为减少(吸收)了人眼识别颜色所需要的反射光。根据三基色原理,油墨或颜料的三基色是青(cyan)、品红(magenta)和黄(yellow)。可以用着三种颜色的油墨或颜料按不同的比例混合成一种油墨或颜料表现的颜色,这种彩色表示方法称为 CMY 彩色空间。

    题11

    人耳能听到的音频信号频率范围是()。

    A. 300Hz ~ 3400Hz

    B. 20Hz ~ 20kHz

    C. 10Hz ~ 20kHz

    D. 20Hz ~ 44kHz

    答案 B

    常见的音频频率范围如下:

    人耳能听到的范围: 20Hz ~ 20kHz (低于 20 Hz 是次声波,超过 20kHz 是超声波)

    人的说话声音频范围为 300~3400Hz

    乐器的音频范围为 20Hz ~ 20kHz。

    题12

    计算机获取模拟语言信息的过程首先要进行()。

    A. A/D变换

    B. 数据压缩

    C. D/A变换

    D. 数据存储

    答案 A

    在计算机中进行处理的数据都是数字信息,而原始的语言信号是一种模拟信号,因此在进行计算机获取模拟语言信息的过程中,首先要将模拟语音信号转换为数字信号,这个过程主要包括采用、量化、编码等,统称为 A/D变换过程。而 D/A变换恰恰相反,是将一个数字信号还原成模拟信号的过程。

    题13

    一幅彩色图像(RGB),分别为 512 x 1024 ,每一种颜色用 8b 表示。则该彩色图像的数据量为()。

    A. 512 x 1024 x 8

    B. 512 x 1024 x 3 x 8

    C. 512 x 1024 x 3 / 8

    D. 512 x 1024 x 3

    答案 B

    本题要求求一幅 RGB 图像的数据量。RGB 图像的颜色是由红、绿、蓝三种颜色混合而成,题目告知每一种颜色用 8b 表示,那么三种颜色就应该用 3 * 8 位来表示,而分辨率其实就是显示图像需要的像素点个数,每个像素点由24位来表示颜色,那么 512 x 1024 就需要 512 x 1024 x 3 x 8 位。

    题14

    下列描述中,错误的是()。

    A. MPEG-1 的音、视频压缩编码技术被应用到 VCD 中

    B. MPEG-2 标准中的音、视频压缩编码技术被应用到 DVD 中

    C. MPEG-21 标准中不包含音、视频压缩编码技术

    D. MPEG-21 是多媒体内容描述接口标准

    答案 D

    MPEG 是 Moving picture Expert Group 的简称,最初是指由国际化标准化组织(ISO)和国际电工委员会(IEC)联合组成的一个研究视频和音频编码标准的专家组。同时 MPEG 也用来命名这个小组所负责开发的一些列音、视频编码标准和多媒体应用标准。

    这个专家组至今为止已制定和制定中的标准包括 MPEG-1 、MPEG-2、MPEG-4、MPEG-7 和 MPEG-21 标准。

  • MPEG-1 、MPEG-2、MPEG-4主要针对音、视频编码技术
    • VCD使用了MPEG-1标准作为其音、视频信息压缩编码方案
    • MPEG-2标准中的音、视频压缩编码技术被应用到DVD
  • MPEG-7多媒体内容描述接口标准
  • MPEG-21多媒体应用框架标准,MPEG-21 中不包含音、视频压缩编码技术
  • 题15

    某相继内置 512 MB 的存储空间,拍摄分辨率设定为 1024 x 1024 像素。颜色深度为 24 位,若不采用压缩存储技术,使用内部存储器最多可以存储()张照片。

    A. 152

    B. 170

    C. 153

    D. 171

    答案 B

    本题考查数字图像格式及分辨率等基本概念。24位真彩色图像每个像素点使用3个字节分别表示 RGB 的分量值,每张照片需要占用 1024 x 1024 x 24 位空间。同时题目也隐含考查了计算机数据存储单位的基本知识,即 B 表示字节,b表示位;1 KB = 1024 B,1MB=1024KB。内部存储大小为 512 x 1024 x 1024 x 8 位,故最多可以存储 512 x 1024 x 1024 x 8 / (1024 x 1024 x 24) = 512/3=170

    题17

    在做视频压缩时,往往要利用到视频的帧与帧之间图像存在大量信息相同的特点。这是属于()。

    A. 熵冗余

    B.时间冗余

    C.频率冗余

    D.空间冗余

    答案 B

    数字图像的冗余主要表现为空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余、知识冗余等。

  • 空间冗余:图像内部相邻像素之间存在较强的相关性所造成的冗余。
  • 时间冗余:视频图像序列中的不同帧之间的相关性所造成的冗余。
  • 视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。
  • 信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像存在冗余,这种冗余称为信息熵冗余。
  • 结构冗余:是指图像中存在很强的纹理结构或自相似性。
  • 知识冗余:是指在有些图像中还包含与某些先验知识有关的信息
  • 题18

    以下标准中,()不属于数字音、视频压缩编码标准。

    A. WMV

    B. WAPI

    C. H.264

    D. AVS

    答案 B

    WMV(Windows Media Video)是微软推出的一种流媒体格式,在同等视频质量下,WMV格式的体积非常小,同时 WMV 格式的文件可以边下载边播放,因此很适合在网上播放和传输。

    数字音频编解码技术标准工作组(简称AVS工作组)由国家信息产业部科学技术司与2002年6月批准成立。工作组的任务是:面向我国的信息产业需求,联合国内企业和科研机构,指定数字音视频的压缩、解压缩、处理和表示等共性技术标准,为数字音频设备与系统提供高效经济的编解码技术,服务于高分辨率数字广播、高密度激光数字存储媒体、无线带宽多媒体通信、互联网宽带流媒体等重大信息产业应用。

    ​ AVS 标准是《信息技术 先进音视频编码》系列标准的简称,AVS 标准包括系统、视频、音频、数组版权管理等四个主要技术标准和一致性测试等支撑标准。

    WAPI(Wireless LAN Authentication and Privacy Infrastructure)是无线局域网鉴别和保密基础结构,是一种安全协议,同时也是中国无限局域网安全强制性标准。

    H.264,同时也是 MPEG-4 第十部分,是由 ITU-T 视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(Joint Video Team,JVT)提出的高度压缩数字视频编解码器标准

    相关推荐

    相关文章