多媒体基础知识

阅读数:82 评论数:0

跳转到新版页面

分类

图形/语音

正文

1.基本概念

1.1分类

按照国际电话电报咨询委员会(Consultative Committee on International Telephone and Telegraph,CCITT)的定义,媒体可以归类为:

(1)感觉媒体(Perception Medium)。指直接作用于人的感觉器官,使人产生直接感觉的媒体。

(2)表示媒体(representation Medium)。指用于数据交换的编码。

(3)表现媒体(Presentation Medium)。指进行信息输入和输出的媒体。

(4)存储媒体(Storage Medium)。指用于存储表示媒体的物理介质。

(5)传输媒体(Transmission Medium)。指传输表示媒体的物理介质。
2.声音

2.1基本概念

人们对声音胡感觉主要有:

(1)音量。取决于声音波形的幅度。

(2)音调。取决于声音波形的基频。

(3)音色。由混入基音(基波)的泛音所决定。一个声波上的谐波越丰富,音色越好。

2.2语音合成

主要指从文本到语音的合成。

原理上一般分成两步

(1)先将文字序列转换成音韵序列。涉及语言学处理,例如分词、字音转换等,以及一整套有效的韵律控制规则。

(2)使用语音合成技术。

2.3MIDI

Musical Instrument Digital Interface,乐器数字接口。

泛指数字音乐的国际标准。

2.4声音文件格式

(1)wave文件。Microsoft公司的音频文件格式,源于对声音模拟波形的采样。利用该格式记录的声音能够和原声基本一致,质量非常高,但文件数据量大。

(2)MPEG文件(mp3)压缩率大,但音质不能令人非常满意。

(3)Module文件(,mod)

(4)RealAudio文件(.RA)主要目标是压缩比和容错性,其次才是音质

(5)MIDI文件(.MID/.RMI)多数CD都利用MIDI制作出来的

(6)Voice文件(.VOC)

(7)Sound文件(.SND)

(8)Audio文件(.AU)

(9)AIFF文件(.AIF)Apple计算机

(10)CMF文件(.CMF)


3.图形和图像

3.1基本概念

(1)色彩的三要素

亮度。描述光作用于人眼时引起的明暗程序感觉。
色调。指颜色类别,由光谱分析可知,不同波长的光呈现不同的颜色,人眼看到一种或多种波长的光时所产生的彩色的感觉,反映出颜色的类别。
色饱和度。指某一颜色的深浅程度(或浓度),高饱和度的深色光可掺入白色光被冲淡,因此,色饱和度可以认为是某色调的纯钯掺入白钯光的比例。

(2)三基色原理

R+G=黄色

R+B=品红

G+B=青色

R+G+B=白色

(3)彩色空间

RGB彩色空间。
CMY彩色空间。用于打印机,彩色打印的纸张是不能发射光线的,因而彩色打印机就不能采用RGB颜色来打印,它只能使用能够吸收特定的光波而反射其他光波的油墨或颜料来实现。三基色:青( cyan)、品红(magenta)、黄(yellow)。
YUV彩色空间。电视图像一般都是采用YUV分量量表示,即一个亮度分量Y、两个色差(UV)分量表示。如果只有Y分量而没有UV分量,那么所表示的图像是黑白灰度图像。

(4)图像的属性

分辨率。图像分辨率确定的是组成一幅图像的像素数目,而显示分辨率确定的是显示图像的区域大小。它们之间的关系为:图像分辨率大于显示分辨率时,在屏幕上只能显示部分图像;图像分辨率小于显示分辨率时,图像只占屏幕的上部分。
图像深度。指存储每个像素所用的位数。
真彩色和伪彩色。每个像素值有RGB三个基色分量称为真彩色,为了减少彩色图形的存储空间,图像中每个像素的颜色不是由三个基色分量的数值直接表达,而是把像素值作为地址索引在彩色查找表中查找这个像素实际的RGB分量,将这种表达方式称为伪彩色。

 

 

3.2图像压缩编码标准

(1)JPEG

Joint Photographic Experts Group,是一个由ISO和IEC两个组织机构联合组成的专家组,负责制定静态和数字图像数据压缩标准,这个专家组开发的算法称为JPEG算法。

既可用于灰度图像又可用于彩色图像,适用于静态图像数据压缩,有两种基本的压缩算法,一种是以离散余弦变换(Discrete Cosine Transrorm,DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。其中JPEG2000采用了小波变换(Wavelet)算法。

(2)MPEG

Moving Pictures Experts Group,将MPEG标准分成两个阶段:MPEG-1是针对1~1.5Mb/的普通电视质量的视频信号,MPEG-2目标是对每秒30帧的720X572分辨率的视频信号进行压缩。

(3)H.261

视频通信编码标准。

3.3图形文件格式

(1)BMP

Windows操作系统采用的图像文件格式 。

(2)GIF

采用LZW无损压缩算法按扫描行压缩图像数据。

(3)TIFF

TIFF-B适用于二值图像,TIFF-G适用于黑白灰度图像;TIFF-P适用于带调色板的彩色图像;TIFF-R适用于RGB真彩色图像。

(4)PCX

(5)PNG

作为GIF的替代品而开发的,采用LZ77算法的改进无损压缩算法。

(6)JPEG

(7)Targe

(8)WMF

(9)EPS

(10)DIF

(11)CDR


4.动画和视频

4.1基本概念

动画的本质是运动,根据运动的控制方式可以将计算机动画分为实时动画和逐帧动画。实时动画是用算法来实现物体的运动,逐帧动画是在传统动画基础上引申来而来的。

4.2视频文件格式

(1)GIF文件

(2)Flic文件

采用行程编码(RLE)算法和Delta算法进行无损的数据压缩。

(3)AVI文件

AVI文件并未限定压缩标准,用不同压缩算法生成的AVI文件,必须使用相同的解压缩算法才能播放出来。

(4)Qu Time文件

Apple公司开发,

(5)MPEG文件

(6)RealVideo文件

可以根据网络数据传输速率的不同而采用不同的压缩比率。


5.多媒体

5.1超文本

与一般的文本文件的差别主要是组织方式不同,它是将文本中遇到的一些相关内容通过链接组织在一起。

5.2流媒体

流媒体技术是指把连续的影像和声音经过压缩处理之后放到专用的流服务器上,让浏览者一边下载一边观看、收听,而不需要等到整个多媒体文件下载完成就可以即时观看和收听的技术。




相关推荐

在 3D 建模和游戏开发领域,3ds Max、Blender 和 Unreal Engine 5 (UE5) 是三种非常流行且功能强大的工具。它们各自有不同的特点和应用场景,适合不同类型的用户和项目需

一、面板的基本使用 1 代表当前选择的颜色,即前景色 2 代表背景色 3 点击可以互换前景色和背景色 4 代表使用圆形取色器 5 色域锁,可以锁定配色范围 6 用方形取色器

一、坐标系统 1、世界坐标系(world coordinate system) 是一个三维坐标系,多用右手直角坐标系,用来描述物体所处理的场景空间。坐标原点在屏幕

一、STL格式 它采用三角形近似的表示三维模型,目前已被工业界认为是快速成形领域的标准描述文件格式。 STL文件的最大特点也是其主要问题是:它是由一系列的三角形无

由于要对图像进行一些复杂的处理,google了一下决定安装imagick,但是网上的安装说明都大同小异,而且很多链接网址根本打不开,让我焦头烂额。所以我决定把我安装的过程记录下来,希望可以帮助到

the Open Tool Kit (OpenTK), 是对 OpenGL、OpenAL、OpenCL 的跨平台的封装,使用 C# 编写,它可以用在Mono、dotNet的语言:c#、VB、C+

bpp:表示图像像素值的位数叫做图像的像素深度,又称为位/像素(BPP)。这个数值用来表示图像的每个像素值所需要的位数(bits per pixel)

1、变换与坐标系 <投影矩阵>*<视