登陆注册
49625400000015

第15章 素材(5)

3.4.2.3MPEG-4音频

MPEG-4为语音编码、通用音频编码、音频语义和语音合成定义了一种扩展工具。MPEG-4音频(和视频部分相似)是面向对象的,它支持音频场景通过多重音频对象(语义的或者自然的)而创建。和MPEG-1以及MPEG-2中定义的一样,自然音频对象是从样本波形中产生的。和视频的方式相似,不同的音频流组合成为一个音频场景。

语音编码部分是特别为口语单词的有效编码设计的,它可以节省带宽、优化网络通信能力和节省存储量。因为只有语音需要编码,所以可以使用更有效的编码技术,其中杰出的有代码激励线性预测方法(Code Excited Linear Prediction, CELP)和MPEG-4谐波矢量刺激编码方法(Harmonic Vector Excitation Coding, HVXC)。CELP所产生的比特率是4~6kb/s,而HVXC编码的比特率是2~4kb/s。

MPEG-4标准的一般音频部分是将自然音频输入信号的重新制作。MPEG-4的代码部分基于MPEG-2优化编码技术,具有更好的压缩能力和纠错机制。而且它还支持很低的比特率和非常低的延迟。另外,它利用大步骤的可伸缩音频编码和比特分割编码算法实现了比特率的可扩展性(例如在接受有效信息时,还可以解码比特流的子集)。

MPEG-4还定义了音频的类、级和对象类型,具有通用音频、语音、语音和通用音频、语意音频和语意语音的扩展类型列表。

MPEG-4音频类定义了比特流和解码器的一致性范围。MPEG-4中定义的类比对象类型要少。MPEG-4的音频级是根据复杂度单元来定义的(处理器和RAM的复杂度)。MPEG-4还限制了特殊类型的对象,作者可以在一个音频场景中以不同的复杂度来使用不同的对象类型,只要总体复杂度不超过所定义的该级的复杂度。

3.4.3内容管理系统中的音频格式

标准音频格式(如44.1kHz和48kHz的PCM编码音频和MPEG音频)的带宽和存储要求比同样类型的视频要求要少,因此被认为更易管理。然而,这些格式同样要被整合到内容管理系统中,并且内容管理系统要对其制作和传输所需的工具和应用给予支持。

MPEG的音频编码器支持整个范围的声音压缩,其中最主要的是MPEG-1的第3层(MP3),因为它是目前网上流行的音频格式。基于MPEG-4的音频系统的相关性是显而易见的,同样也存在其他方式的音频编码格式,如Real音频或流式音频。然而,随着MP3的风靡,它们的实用性已经减弱了。

对内容管理系统的另一个挑战是具有更高抽样率和量化区间的新格式的出现。在专业系统中,96kHz的抽样率将可能成为标准。内容管理系统在处理音频和处理视频时的情况一样,必须应付多种多样的格式和需求。

3.5图片、网页、文本和其他素材格式

除了视频和音频,内容管理系统还要管理其他很多媒体类型(主要是离散媒体类型)。与视频、音频的情况相似的是,图片、图表和文本等的媒体类型都有很多种格式。例如文本文档就可以被编码为无格式ASCII文本、Microsoft Word、FrameMaker、RTF和PDF等。另外,内容管理系统也需要管理一些表示幻灯片、项目计划或计算表单等需要特殊(通常是私有的)格式编码的文本文档。此时内容管理系统的主要功能是索引这些文档以使它们能被检索,以及集成本地应用程序或应用视图以为用户提供原始形式的文档。文档查询索引的问题由可处理多种格式的全文检索引擎来解决,提供本地应用程序和视图的问题要结合第三方的应用综合解决。

内容管理系统管理的其他重要的素材类型是网页中的图片和结构化文档。

3.5.1图片

图片是可视化的照片或图像。它们描述具体的二维情形,没有时间限制(它们属于离散的媒体类型)。在内容管理系统中,图片由数字图片格式或指向外部图片的链接来表示。本书中只讨论相关的数字图片格式。在技术层面上,图片被认为是平面区域每个点的光线强度功能值的反映。为了数字化地表示这些值,需要对它们进行抽样和对抽样值进行量化。数字图片本身就成了表现量化值强度的数字值矩阵。图片的抽样点是画面元素(如视频中),即像素。图片的数字表示可能会很大。一张和NTSC制电视画面大小一样的图片的分辨率为640×480像素矩阵。以8比特和256灰度水平存储该单色图像需要空间大小约为300kB,因此和在视频中一样,需要压缩图片来减少表现时需要的比特数。最常用的图片格式是JPEG、GIF、TIFF和BMP。

3.5.1.1JPEG

JPEG标准是由ISO和CCITT联合组成的联合图片专家组制定的。JPEG定义了彩色和单色图片的编码和压缩方法,以及含有实际图片数据、编码表和编码参数的交换格式。如果编码器和解码器在相同环境中使用,就不需要编码表和编码参数。

JPEG标准具体化了4种基本模型(每一种还有变体):

·缺失序列DCT基本模型,即每个JPEG工具都支持的基本处理模型。

·扩展的缺失DCT基本模型,是对基本处理模型的增强。

·无损模型,支持原始图片信息的精确复制和重组,但是压缩率低。

·分层模型,包含不同分辨率的图片,并应用以上3种JPEG模型的算法。

这些模型的基本编码和压缩步骤相同。不是每个模型都应用所有的技术,如基本处理模型用分块、MCU、FDCT、步长和霍夫曼编码方法。

JPEG定义了一种很普遍的图片模式。图片准备阶段的源图片由至少一个、至多255个组成部分或者平面组成。这些组成部分的像素可能不同,如它们可以表示不同颜色(RGB)、明暗或者色度信息(YUV)。像素的表示也是可变的,每一个像素由值为0到2P-1的P个比特来表示。图片的所有组成部分的所有像素要以相同数目的比特数编码。JPEG缺失模型中每个像素用8或12比特表示。无插帧数据单元的处理命令是从左到右、从上到下,然后未压缩的图片样本被归组成8×8像素的数据单元。

基准模型的图像处理在8×8的像素组中,使用前序离散余弦转换(前序DCT),将二维图片值映射至频率域内。这种转换要进行64次,这一步之后所有DCT的系数要用64个输入口的量化表进行量化,每个输入口对应一个DCT系数的量化。量化和DCT过程都是有缺失的。接下来应用熵编码,在基准模型中的熵编码使用霍夫曼编码方法。

扩展的缺失模型支持高抽样精度(最高12比特)。另外,还使用了扩展的量化方法,从而实现渐进式代替顺序的图像显示。前者使得图片更加清晰,后者使得图片自上到下显示。扩展的缺失模型可以使用熵编码。

在无损模型中,预备处理的图像的每个像素的数据单元每像素精度在2~16比特之间。处理和量化步骤是基于根据相邻样本预测样本值的预测技术。

3.5.1.2GIF

图形交换格式(Graphic Interchange Format, GIF)最初由CompuServe开发,以支持与平台无关的图片交换。GIF使用无损压缩方案,支持在一个文件中插入多幅画面。

GIF图片总是编码为比特流。逻辑屏幕描述符定义了编码过的图片大小、位置和色彩表类型,而且也定义了可操作的全局、局部色彩表和指向该表的像素色彩指针。像素色彩用特殊的算法压缩(称为Lempel-Ziv-Welch),该算法可以检测和处理可变长度的比特模式。该比特模式在表中以短比特的形式表示,出现频率最高的比特模式以最短的比特表示。

GIF图片由以下部分组成:

·头,包含GIF ID和算法版本号码。

·应用部分,支持生成图片的程序的版本和名称信息编码。

·尾部,标示GIF流的结束。

·控制部分,控制后续图片块的显示。

·图片部分,包含图片头、可操作的色彩表和像素信息。

·注释部分,包含每个图片块的附加(文本)介绍信息。

·平面文本部分,支持图片中出现的文本信息的ASCII编码。

在GIF图片中,控制部分、图片部分、介绍部分和平面文本部分可以重复和排列。GIF也支持简短动画和图片序列的编码。GIF只适用8比特的色彩表,所以不能应用于高质量的图片。

3.5.1.3TIFF

标签图像文件格式(Tagged Image File Format, TIFF)是微软公司和Aldus公司联合开发的。TIFF的目标是提供可移植的、与硬件无关的图像编码。它有2个组成部分,称为基准部分和扩展部分。基准部分定义每个解码和显示的应用程序都必须支持的一些特征,扩展部分定义其他的附加信息。TIFF支持在很大范围内的色彩模型:从黑白图像到单色图像再到复杂色彩图像、RGB图像等。与GIF相似,TIFF也有以下几个部分:

·头字典,定义字节顺序、版本号码以及含有其他图片或部分的参考信息。

·结构部分,定义编码技术和标记域的数量。

·字段,定义图片编码块(行、对象、单元和块)以及它们的特征(压缩技术、分辨率和校准)。

·数据字段,定义前面没有定义的图形对象。

TIFF支持的压缩技术有游程编码、霍夫曼编码、Lempel-Ziv-Welch压缩和JPEG压缩方法。TIFF是一种广泛应用的格式,它还支持不同分辨率的图像编码,如预览格式和高清格式图片。

3.5.1.4BMP

位图格式(Bitmap Format, BMP)是基于RGB色彩的一般图像格式。它也被用于单色和黑白图像的编码。BMP格式定义了2个主要部分:头和数据部分。前者被称为位图信息(BITMAPINFO),定义了图片大小、色彩深度、色彩表以及压缩技术。数据部分含有每一行中的各个点的像素值。色彩深度可取的值有1、4、8和24。色彩深度值为每像素4和8比特的图片压缩方案采用游程编码方法,而色彩表中的其他相关信息值则采用特殊的编码算法。

3.5.2结构化文档

结构化文档是内容管理系统中的又一种重要的媒体类型,它的发展主要由2方面促成:印刷媒体工业和网域。另外,超文本和超媒体也对结构化文档语言和标准的发展有一定的影响。与一般文档格式相比(RTF、MS Word或者PDF),结构化文档的特点是使用标记语言并链接到扩展文本和信息。对于内容管理系统来说这是一项特殊的挑战。

这里主要考虑的标准是SGML、HTML和XML。后者在4.5.2与元数据编码、传输和交换一起介绍,因为它主要应用于这些领域。

同类推荐
  • 时尚至死

    时尚至死

    本书从时装潮流、大牌内幕、时装秀、中国时装现状等方面进行深度的社会学、经济学、美学、历史学的分析,引导读者从瞬息万变的时尚现象中去享受时尚、思考潮流、判断品牌,有助于读者在挑选品牌、跟随风尚时建立自己的风格与思想,是时尚人士、都市男女必不可少的时尚参考手册。
  • 未成年人思想道德建设概要-尊师篇

    未成年人思想道德建设概要-尊师篇

    加强和改进未成年人思想道德建设,是全党全社会必须共同承担的重大任务。各级党委和政府都要把思想统一到中央精神上来,切实担负起政治责任,进一步加强和改善对未成年人思想道德建设的领导。要把加强和改进未成年人思想道德建设摆在更加突出的位置,作为精神文明建设的重中之重,纳入经济社会发展总体规划,列入重要议事日程。——胡锦涛
  • 祝酒辞

    祝酒辞

    本书精心打造了中国式宴请的攻略与祝酒技巧,既阐释了宴会的礼仪和酒宴接待,又介绍了祝酒、劝酒、挡酒的实用方法,同时还遴选出各种场合祝酒的言辞。
  • 教师的28个怎么办-教师如何开展活动教学

    教师的28个怎么办-教师如何开展活动教学

    教学目的是从事教学工作所应达到的目标的具体表述,它规定了儿童、青少年发展的基本规格,如知识掌握的程度、能力发展的水平,以及态度、倾向形成方面的具体要求
  • 写作素材大全(超值金版)

    写作素材大全(超值金版)

    平时勤于积累,是打开写作思路、丰富写作内容、提高写作能力的根本途径。那么,我们要如何积累素材呢?一是通过广泛阅读,积累写作的语言、技巧等前人已经成功运用过的“间接材料”,为此,平时我们可摘抄一些优美的句子、片段,对于比较好的材料事例,可摘剪下来;二是通过观察生活,积累生活中的直接素材,无论是阅读积累还是生活积累,都围绕一个核心观察世界与社会,思考自我与人生,积累生活感悟。有感悟,你的文章才具有思想性。作家秦牧说:“一个作家应该有三个仓库:一个直接材料的仓库,装从生活中得来的材料;一个间接仓库,装从书籍和资料中得来的材料;另一个就是日常收集的人民语言的仓库。有了这三个仓库,写作起来就比较容易。”
热门推荐
  • 生命在梦想的起点

    生命在梦想的起点

    此篇乃是获奖短篇征文,并非断更了!!已经完结! 一处大山中,一个外貌平凡,但却坚毅男人,有些伤感的站在村头的大树下,将视线投向了远方...“癌症晚期了吗?孩子马上就要中考了....”“唉...罢了,该教的已经提前教了,不过,出了山,也该教一教他们别的了....”山下因为前几天的大雨,发生了泥石流,山那边的孩子没有来上学,周宁远觉得也该去看看了.....
  • 天帝永生

    天帝永生

    人间,神界皆谈长生,帝王,神尊,道祖谁人能够永生。杨氏子孙得逆天功法,修绝世玄功。看他如何称帝王,做神尊,力压道祖成就无上天帝,得无尽永生。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 银河系神尊

    银河系神尊

    她,是命定之人,也是银河系最后一位神尊。当命运之轮开始转动,冥冥之中,似乎早已安排好了一切,他,是某界帝尊,为了她宁愿孤独千年,只为再次保护她,即使她,忘了他也好。他:你若想天真永存,我便温柔相待,守你一世无忧,纵使经历万般苦难,我亦不悔。他:你若想逆转命运,我便血祭神台,助你涅槃重生,纵使推翻天地原则,我亦不悔。
  • 年夏文筝

    年夏文筝

    一段自我回想的记忆一场完美误会导致的新生活一切都将走上不可控制的道路所有,都有一个未知的结局
  • 黄天无尽

    黄天无尽

    一个落魄而悲惨的人,获得了一桩绝世机缘————黄天印李向天将以黄天印聚集无尽信仰之力破开一切的束缚。在这世间逍遥自在,让这天地随心运转。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 不灭帝尊

    不灭帝尊

    我即生,诸天当灭!伴生神棺埋葬诸天,信我者得永生!林冥生于武帝世家,却天生九阴绝脉,不能修炼。家族破灭,使他悲愤觉醒伴生的天葬之棺,从此踏上强者之路!且看他只靠外功体魄,觉醒武帝血脉,最终武破虚空,成就永生,超脱轮回!
  • 一起来追星

    一起来追星

    追星少女叶橙橙一觉醒来就迎来了自己的高光时刻,她居然魂穿自家爱豆了!不过好像魂穿的过程中出现了什么差错,居然和自家爱豆的队友互换灵魂了。看着近在咫尺的爱豆,叶橙橙想撩一下,结果就崩了人设,再撩一下,又崩了人设。就在叶橙橙在不断撩爱豆的时候,和她互换灵魂的洛臣正在被男人狂撩,被女人当成情敌,洛臣紧握住自己的清白,欲哭无泪。就在洛臣以为自己的清白不保的时候,史上最强外援一个个到达,帮他完成了和男人分手的艰苦心酸的过程。只是,不知道是什么时候开始,画风就变了,戏精的妈妈,大魔王一样的师父,麦丽素一样的爸爸,还有时不时出来刷刷存在感的失忆鬼大叔。这是一场说崩就崩的灵魂互换,也是一场爱与被爱的互换。
  • 创世之核

    创世之核

    凡人,从淬体期修炼至真仙,需经过炼气、先天、筑基、结丹、元婴、化神、炼虚、合体、大乘、渡劫十个阶段。改造人,只需将他们的肉体与机械的相容度从百分之一提升至百分之百,同样能化神而与仙媲美。且看今日,改造人如何修炼成神。