图像和图形知识
1. 有关色彩的基本常识 我们知道,只要是彩色都可用亮度、色调和饱和度来描述,人眼中看到的任一彩色光都是这三个特征的综合效果。那么亮度、色调和饱和度分别指的是什么呢? ★ 亮度:是光作用于人眼所引起的明亮程度的感觉,它与被观察物体的发光强度有关; ★ 色调:是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调; ★ 饱和度:指的是颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。 现在你该明白了,亮度是用来表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。除此之外,自然界常见的各种颜色光,都可由红 (r) 、绿 (g) 、蓝 (b) 三种颜色光按不同比例相配而成;同样绝大多数颜色光也可以分解成红、绿、蓝三种色光,这就形成了色度学中最基本的原理 ---- 三原色原理 (rgb) 。 2. 目前常见的图形(图像)格式 一般来说,目前的图形(图像)格式大致可以分为两大类:一类为位图;另一类称为描绘类、矢量类或面向对象的图形(图像)。前者是以点阵形式描述图形(图像)的,后者是以数学方法描述的一种由几何元素组成的图形(图像)。一般说来,后者对图像的表达细致、真实,缩放后图形(图像)的分辨率不变,在专业级的图形(图像)处理中运用较多。 在介绍图形(图像)格式前,我们实在有必要先了解一下图形(图像)的一些相关技术指标 : 分辨率、色彩数、图形灰度。 ★ 分辨率:分为屏幕分辨率和输出分辨率两种,前者用每英寸行数表示,数值越大图形(图像)质量越好;后者衡量输出设备的精度,以每英寸的像素点数表示; ★ 色彩数和图形灰度:用位( bit )表示,一般写成 2 的 n 次方, n 代表位数。当图形(图像)达到 24 位时,可表现 1677 万种颜色,即真彩。灰度的表示法类似; 下面我们就通过图形文件的特征后缀名(就是如图 .bmp 这样的)来逐一认识当前常见的图形文件格式: bmp 、 dib 、 pcp 、 dif 、 wmf 、 gif 、 jpg 、 tif 、 eps 、 psd 、 cdr 、 iff 、 tga 、 pcd 、 mpt 。 ★ bmp ( bit map picture ) :pc 机上最常用的位图格式,有压缩和不压缩两种形式,该格式可表现从 2 位到 24 位的色彩,分辨率也可从 480x320 至 1024x768 。该格式在 windows 环境下相当稳定,在文件大小没有限制的场合中运用极为广泛。 ★ dib(device independent bitmap): 描述图像的能力基本与 bmp 相同,并且能运行于多种硬件平台,只是文件较大。 ★ pcp ( pc paintbrush ) : 由 zsoft 公司创建的一种经过压缩且节约磁盘空间的 pc 位图格式,它最高可表现 24 位图形(图像)。过去有一定市场,但随着 jpeg 的兴起,其地位已逐渐日落终天了。 ★ dif ( drawing interchange formar ) :autocad 中的图形文件,它以 ascii 方式存储图形,表现图形在尺寸大小方面十分精确,可以被 coreldraw , 3ds 等大型软件调用编辑。 ★ wmf ( windows metafile format ):microsoft windows 图元文件,具有文件短小、图案造型化的特点。该类图形比较粗糙,并只能在 microsoft office 中调用编辑。 ★ gif ( graphics interchange format ) : 在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式。缺点是存储色彩最高只能达到 256 种。 ★ jpg ( joint photographics expert group ) : 可以大幅度地压缩图形文件的一种图形格式。对于同一幅画面, jpg 格式存储的文件是其他类型图形文件的 1/10 到 1/20 ,而且色彩数最高可达到 24 位,所以它被广泛应用于 internet 上的 homepage 或 internet 上的图片库。 ★ tif ( tagged image file format ) : 文件体积庞大,但存储信息量亦巨大,细微层次的信息较多,有利于原稿阶调与色彩的复制。该格式有压缩和非压缩两种形式,最高支持的色彩数可达 16m 。 ★ eps ( encapsulated postscript ) : 用 postscript 语言描述的 ascii 图形文件,在 postscript 图形打印机上能打印出高品质的图形(图像),最高能表示 32 位图形(图像)。该格式分为 photoshop eps 格式 adobeillustrator eps 和标准 eps 格式,其中后者又可以分为图形格式和图像格式。 ★ psd ( photoshop standard ) :photoshop 中的标准文件格式,专门为 photoshop 而优化的格式。 ★ cdr ( coreldraw ) :coreldraw 的文件格式。另外, cdx 是所有 coreldraw 应用程序均能使用的图形(图像)文件,是发展成熟的 cdr 文件。 ★ iff ( image file format ) : 用于大型超级图形处理平台,比如 amiga 机,好莱坞的特技大片多采用该图形格式处理。图形(图像)效果,包括色彩纹理等逼真再现原景。当然,该格式耗用的内存外存等的计算机资源也十分巨大。 ★ tga ( tagged graphic ) : 是 true vision 公司为其显示卡开发的图形文件格式,创建时期较早,最高色彩数可达 32 位。 vda , pix , win , bpx , icb 等均属其旁系。 视频(动画) 1. 动态图像的组成 动态图像,包括动画和视频信息,是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,我们常称作动画;当序列中每帧图像是通过实时摄取自然景象或活动对象时,我们常成为影像视频,或简称为视频。动态图像演示常常与声音媒体配合进行,二者的共同基础是时间连续性。一般意义上谈到视频时,往往也包含声音媒体。但在这里,视频(动画)特制不包含声音媒体的动态图像。 2. 动画的定义 什么是动画?所谓动画,就是通过以每秒 15 到 20 帧的速度 ( 相当接近于全运动视频帧速 ) 顺序地播放静止图像帧以产生运动的错觉。因为眼睛能足够长时间地保留图像以允许大脑以连续的序列把帧连接起来,所以能够产生运动的错觉。我们可以通过在显示时改变图像来生成简单的动画。最简单的方法是在两个不同帧之间的反复。这种方法对于指示 " 是 " 或 " 不是 " 的情况来说是很好的解决方法。另一种制作动画的方法是以循环的形式播放几个图像帧以生成旋转的效果,并且可以依靠计算时间来获得较好的回放,或用记时器来控制动画。 3. 常见的视频文件格式 视频信息在计算机中存放的格式有很多,目前最流行的两种格式是: 苹果公司的 quicktime 和微软的 avi 。 ★ quicktime :是苹果公司采用的面向最终用户桌面系统的低成本、全运动视频的方式,现在在软件压缩和解压缩中也开始采用这种方式了。其向量量化是 quicktime 软件的压缩技术之一,它在最高为 30 帧 / 秒下提供的视频分辨率是 320x240 ,其压缩率能从 25 到 200 。 ★ avi :类似于 quicktime ,是微软公司采用的音频视频交错格式,也是一种桌面系统上的低成本、低分辨率的视频格式。 avi 可在 160x120 的视窗中以 15 帧 / 秒回放视频,并可带有 8 位的声音,也可以在 vga 或超级 vga 监视器上回放。 avi 很重要的一个特点是可伸缩性,使用 avi 算法时的性能依赖于与它一起使用的基础硬件。 mpeg-4 简介 mpeg-4 是目前业界先进的视频压缩技术,具有直览图像清晰,传输带宽要求低,远程监控方便等特点。 mpeg 协会创建于 1987 年。 mpeg 是 motion pictures expert group 的缩写。这个协会是一个全球性的机构,主要致力于影像压缩的研究。 mpeg-1 ,用于 vcd 内的压缩技术, mpeg-2 ,用于 dvd 内的压缩技术,以及 mp3 压缩方法,都是由这个协会创建的。 mpeg 的压缩方式的优点除了画面质量高,带宽要求低以外,也是在于它是现在数码影像届公认的商业标准。使用 mpeg 压缩方式的影像数据流可以通过各类的媒体播放器播放。 以下是 mpeg-4 与 mpeg-1 和 mpeg-2 的比较: mpeg-1 mpeg-2 mpeg-4 标准创建时间 1992 1995 1999 最高图像分辨率 352 x 288 1920 x 1152 720 x 576 普通 pal 制式分辨率 352 x 288 720 x 576 720 x 576 普通 ntsc 制式分辨率 352 x 288 640 x 480 640 x 480 最佳声音频率 48 khz 96 khz 96 khz 最多声音通道 2 路 8 路 8 路 最高数据流量 3 mbps 80 mbps 5 to 10 mbps 一般数据流量 1380 kbps (352 x 288) 6500 kbps (720 x 576) 880 kbps (720 x 576) 帧每秒( pal ) 25 25 25 帧每秒( ntsc ) 30 30 30 图像质量 一般 非常好 非常好 编码硬件要求 低 高 非常高 解码硬件要求 非常低 中等 高 技术支持 -> 监控常识 监控系统性能对比表 比较内容:计算机数字压缩监控系统 闭路电视监控系统 多媒体监控系统 压缩方式:对图像进行数字压缩 无图像数字压缩 不对图像进行数字压缩 配 置:在先进的计算机上集成,设备简洁,可靠性高 由监视器、录像机、编码器解码器、视频转换器、图像分割器、矩阵等组成。设备多、可靠性低 由监视器、录像机、编码器解码器、视频转换器、图像分割器、矩阵等组成。设备多、可靠性低 纪录方式 数字信号 模拟信号 模拟信号 图 像:由计算机显示器显示,图像分辨率达 1024x768 , 16 位增强色,高分辨率,高清晰度,高画质 采用监视器显示,扫描线分辨率为 300 线 可由计算机显示器显示分辨率可达 1204x768 或由显示器显示分辨率为 300 线 传 输:可通过普通电话线远距离传输图形信号,传输速度率为 5/ 帧秒,且能保证图像质量 不能远距离传输 可进行单帧传输 安 全:系统智能化,自动登陆每一个进入系统的人员,有多个安全防范等级,能有效的防范内部人员作案 任何人都可进入系统而不被纪录,不能防范内部人员作案 不能对每个进入系统的人进行安全检测,不能防范内部人员作案 系 统:采用计算机中文视窗 win2000 操作平台,可支持各种软、硬件的扩展,随着计算机升级而升级 系统一经配套组合,便不可升级 系统一经配套组合,便不可升级 操 作:操作简单到只要一按电源开关即可,全自动进入监视状态 需要开启每一台设备的电源,并设置每一设备的参数后,方可工作 需要开启每一台设备的电源,并设置每一设备的参数后,方可工作 值 守:可无人值守 根据系统大小,需多人值守 根据系统大小,需多人值守 功 耗:150w-500w 500w-3000w 500w-3000w 录 制:可多个硬盘循环录制 磁带更换录制 不能循环录制
回 放:可单帧画面回放检索即连续回放,画面质量可靠 只能利用录像机暂停键查看画面,画面质量差 可单帧画面回放或利用录像机暂停键查看画面 检 索:多检索点,可根据文件类型摄像机型号及文件的年月日时分秒进行所要的画面检索 需耗费很多时间自在录像带上反复进退查找确定时刻的画面内容,对某一时刻进行检索难度大,偶然性强 检索方式略多于模拟纪录方式 编 辑:支持多种软件,可对图像的每一帧画面进行多次编辑、修复、打印 不能编辑、修复、打印 可对图像的每一帧画进行多次编辑、修复、打印
图像校正:计算机软件可调整图像清晰度 \ 对比度、亮度及色度等 不能做任何校正 可部分调整图像清晰度对比度亮度及色度等 报 警:智能报警,即可将报警后的图像录入,也可将报警前的内容录下来 只能录下报警后的内容 可将报警后的的内容,也可将报警前的内容自动录入 维 修:无需拆机维护,经培训后普通保安人员即可进行维护 对系统中的每一部分都必须专人定期保养维护,如:清洁录像机磁头、保存录像带等 对系统中的每一部分都必须专人定期保养维护
占用空间:相当于 pc 机的体积,占用空间很小 设备及连线复杂,占用空间较大 设备及连线复杂,占用空间较大 价 格:经济,原有设备不至浪费,免费升级软件,可在相当长的时间内不被淘汰 设备投资大,维修费用高,且无升级潜力 设备投资大,维修费用高,且无升级潜力 多媒体数据压缩和编码技术标准 目前,被国际社会广泛认可和应用的通用压缩编码标准大致有如下四种: h.261 、 jpeg 、 mpeg 和 dvi 。 ★ h.261 :由 ccitt (国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称 px64 标准),它使用两种类型的压缩 : 一帧中的有损压缩(基于 dct )和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的 dct 和 dpcm (差分脉冲编码调制)的混合方式。这种标准与 jpeg 及 mpeg 标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。 ★ jpeg :全称是 joint photogragh coding experts group (联合照片专家组),是一种基于 dct 的静止图像压缩和解压缩算法,它由 iso( 国际标准化组织 ) 和 ccitt( 国际电报电话咨询委员会 ) 共同制定,并在 1992 年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比 100:1 )。但是在这个级别上,图像的质量并不好;压缩比为 20:1 时,能看到图像稍微有点变化;当压缩比大于 20:1 时,一般来说图像质量开始变坏。 ★ mpeg :是 moving pictures experts group (动态图像专家组)的英文缩写,实际上是指一组由 itu 和 iso 制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达 200:1 ,同时图像和音响的质量也非常高。现在通常有三个版本 :mpeg-1 、 mpeg-2 、 mpeg-4 以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高(最高可达 200:1) 、数据失真小。 ★ dvi :其视频图像的压缩算法的性能与 mpeg-1 相当,即图像质量可达到 vhs 的水平,压缩后的图像数据率约为 1.5mb/s 。为了扩大 dvi 技术的应用, intel 公司最近又推出了 dvi 算法的软件解码算法,称为 indeo 技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。 说到 mpeg ,相信没有哪位朋友会不知道,但要追根究底地问你 mpeg 到底是什么,恐怕就没有多少人能正确地回答出来了。实际上, mpeg 的全称应该是 moving pictures experts group (即动态图像专家组),由 iso(international standards organization ,国际标准化组织 ) 与 iec ( international electronic committee )于 1988 年联合成立,致力于运动 图像 (mpeg 视频 ) 及其伴音编码 (mpeg 音频 ) 标准化工作。 mpeg 共有 4 个版本,其中前两个版本 mpeg - 1 和 mpeg - 2 应用比较广泛,而 mpeg - 4 虽然已推出近两年,但有关它的应用却直到最近才活跃起来, mpeg - 7 则是属于未来的标准。今天,我们就在了解 mpeg 这个家庭的成长历程和各个成员的特点的基础上,重点看看 mpeg - 4 的特点和应用,相信在不久,大家就会广泛地接触到采用 mpeg - 4 这种先进技术制作的产品。 广泛应用的 mpeg - 1 与 mpeg - 2 mpeg - 1 标准( iso/iec11172 )制定于 1992 年,是针对 1.5mbps 以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在 cd - rom (包括 video - cd 、 cd - i 等)存储彩色的同步运动视频图像,它针对 sif (标准交换格式)标准分辨率 (ntsc 制为 352×240 ; pal 制为 352×288) 的图像进行压缩,每秒可播放 30 帧画面,具备 cd( 指激光唱盘 ) 音质。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路 (adsl) 、视频点播 (vod) 、教育网络等。 使用 mpeg - 1 的压缩算法,可以将一部 120 分钟长的电影压缩到 1.2gb 左右,因此,它被广泛地应用于 vcd 制作和一些视频片段的下载,目前 90 %以上的 vcd 都是用 mpeg - 1 格式压缩的。 mpeg - 2 标准 iso/iec13818 )制定于 1994 年,是针对 3 ~ 10mbps 的数据传输率制定的的运动图像及其伴音编码的国际标准。 mpeg - 2 可以提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量和带宽的要求。它在与 mpeg - 1 兼容的基础上实现了低码率和多声道扩展: mpeg - 2 可以将一部 120 分钟长的电影压缩到 4 ~ 8gb( 它提供的是我们通常所说的 dvd 品质 ) ,其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达 7 个伴音声道 ( 因此 dvd 可有 8 种语言配音 ) 。 除了作为 dvd 的指定标准外, mpeg - 2 还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说,由于现在电视机分辨率的限制, mpeg - 2 所带来的高清晰度画面质量 ( 如 dvd 画面 ) 在电视上效果并不明显,倒是其音频特性 ( 如加重低音、多伴音声道等 ) 得到了广泛的应用。 mpeg - 3 是 iso/iec 最初为 hdtv( 高清晰电视广播 ) 制定的编码和压缩标准,但由于 mpeg - 2 的出色性能已能适用于 hdtv ,因此 mpeg - 3 标准并未制定,我们通常所说的 mp3 指的是 mpeg layer 3 ,只是 mpeg 的一个音频压缩标准。 令人称道的 mpeg - 4
mpeg - 4 于 1998 年 11 月公布,预计投入使用的国际标准 mpeg - 4 是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。为此, mpeg - 4 引入了 av 对象( audio/visual objects ),使得更多的交互操作成为可能: "av 对象 " 可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。 mpeg - 4 对 av 对象的操作主要有:采用 av 对象来表示听觉、视觉或者视听组合内容;组合已有的 av 对象来生成复合的 av 对象,并由此生成 av 场景;对 av 对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些 av 对象数据;允许接收端的用户在 av 场景中对 av 对象进行交互操作等。 mpeg - 4 标准则由 6 个主要部分构成: 1 、 dmif(the deliveries multimedia integration framework ,多媒体传送整体框架 ) 。主要用于解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的连接与传输。 2 、数据平面。为了使基本流和 av 对象在同一场景中出现, mpeg - 4 引用了对象描述( od )和流图桌面( smt )的概念。 od 传输与特殊 av 对象相关的基本流的信息流图。桌面把每一个流与一个 cat ( channel association tag )相连, cat 可实现该流的顺利传输。 3 、缓冲区管理和实时识别。 mpeg - 4 定义了一个系统解码模式( sdm ),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。 4 、音频编码。 mpeg - 4 不仅支持自然声音,而且支持合成声音。 mpeg - 4 的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。 5 、视频编码。与音频编码类似, mpeg - 4 也支持对自然和合成的视觉对象的编码。合成的视觉对象包括 2d 、 3d 动画和人面部表情动画等。 6 、场景描述。 mpeg - 4 提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息组成场景描述,用于描述各 av 对象在一具体 av 场景坐标下,如何组织与同步等问题。 mpeg - 4 的应用 与 mpeg - 1 和 mpeg - 2 相比, mpeg - 4 更适于交互 av 服务以及远程监控,它的设计目标使其具有更广的适应性和可扩展性: mpeg - 4 传输速率在 4800 - 64000bps 之间,分辨率为 176×144 ,可以利用很窄的带宽通过帧重建技术压缩和传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、 internet/intranet 上的视频流与可视游戏、 dvd 上的交互多媒体应用等方面大显身手。 当然,对于普通用户来说, mpeg - 4 在目前来说最有吸引力的地方还在于它能在普通 cd - rom 上基本实现 dvd 的质量:用 mpeg - 4 压缩算法的 asf ( advanced streaming format ,高级格式流)可以将 120 分钟的电影压缩为 300mb 左右的视频流;采用 mpeg - 4 压缩算法的 divx 视频编码技术可以将 120 分钟的电影压缩 600mb 左右,也可以将一部 dvd 影片压缩到 2 张 cd - rom 上!也就是说,有了 mpeg - 4 ,你不需要购买 dvd - rom 就可以享受到和它差不多的视频质量!播放这种编码的影片对机器的要求并不高:只要你的电脑有 300mhz 以上 ( 无论是哪种型号 ) 的 cpu 、 64mb 内存、 8mb 的显卡就可以流畅地播放。 不过,和 dvd 相比, mpeg - 4 属于一种高比率有损压缩算法,其图像质量始终无法和 dvd 的 mpeg - 2 相比,毕竟 dvd 的存储容量比较大。此外,要想保证高速运动的图像画面不失真,必须有足够的码率,目前 mpeg - 4 的码率虽然可以调到和 dvd 差不多,但总体效果还有不小的差距。因此,现在的 mpeg - 4 只能面向娱乐、欣赏方面的市场,那些对图像质量要求较高的专业视频领域暂时还不能采用。 属于未来的 mpeg - 7 继 mpeg - 4 之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。 1998 年 10 月基于这种设想的 mpeg - 7 标准被提出,它的正式名称是 " 多媒体内容描述接 ?quot; ,将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。 由于该标准不包括对描述特征的自动提取,它也没有规定利用描述进行搜索的工具或任何程序,因此,它可以独立于其他 mpeg 标准使用,但 mpeg - 4 中所定义的对音频、视频对象的描述仍然适用于 mpeg - 7 ,这种描述是分类的基础。我们可以也利用 mpeg - 7 的描述来增强其他 mpeg 标准的功能。 mpeg - 7 的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入 internet 等)。它还可以在实时或非实时环境下应用,如:数字图书馆(图像目录、音乐字典等)、多媒体名录服务(如黄页)、广播媒体选择(无线电信道, tv 信道等)等。它在未来将会在教育、新闻、导游信息、娱乐、等各方面将发挥巨大的作用。 mpeg - 1 的出现使 vcd 取代了录像带, mpeg - 2 的出现使数字电视逐步取代模拟电视, mpeg - 4 的出现使多媒体系统的交互性和灵活性大为增强,而 mpeg - 7 的出现将会带我们进入一个互动多媒体的网络时代。
|