一、AVI文件简介 AVI的英文全称为Audio Video Interleaved,即音频视频交错格式,是将语音和影像同步组合在一起的文件格式。AVI于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。AVI文件格式多用于音视频捕捉、编辑、回放等应用程序中。通常情况下,一个AVI文件可以包含多个不同类型的媒体流(典型的情况下有一个音频流和一个视频流),不过含有单一音频流或单一视频流的AVI文件也是合法的。AVI可以算是Windows操作系统上最基本的、也是最常用的一种媒体文件格式。 Note: 本文介绍的是基本的AVI文件格式规范,至于newAVI等一些AVI扩展格式,请关注笔者后续文章。 二、RIFF文件规范 AVI文件属于一种RIFF(Resource Interchange File Format的缩写)文件格式,与此同类的还有常见的WAV文件。RIFF是Microsoft提出的一种多媒体文件的存储方式,不同编码的音频、视频文件,可以按照它定义的存储规则保存、记录各自不同的数据。如果读者不熟悉RIFF文件规范,阅读下面章节前,建议先阅读《RIFF文件规范》这篇文章:http://blog.csdn.net/sunshine1314/archive/2007/10/10/1817991.aspx 三、AVI文件结构实例分析 1、AVI文件结构示例 图1所示为windows系统目录下的clock.avi的文件结构图,其结构是用RIFFspot程序解析得到的,关于RIFFspot程序,感兴趣的读者可以到下面的网址中下载:http://blog.csdn.net/sunshine1314/archive/2007/09/22/1795739.aspx
图1 clock.avi文件结构 2、AVI文件全局结构说明 如图1所示,整个AVI文件的结构为:一个RIFF头 + 两个列表(一个用于描述媒体流格式、一个用于保存媒体流数据) + 一个可选的索引块 + 一个JUNK块。 首先,RIFF (‘AVI ’…)表征了AVI文件类型。然后就是AVI文件必需的第一个列表——‘hdrl’列表,用于描述AVI文件中各个流的格式信息(AVI文件中的每一路媒体数据都称为一个流)。‘hdrl’列表嵌套了一系列块和子列表——首先是一个‘avih’块,用于记录AVI文件的全局信息。然后,就是一个或多个‘strl’子列表。文件中有多少个流,这里就对应有多少个‘strl’子列表,示例clock.avi文件有两路流,既音频流和视频流。 当AVI文件中的所有流都使用一个‘strl’子列表说明了以后(注意:‘strl’子列表出现的顺序与媒体流的编号是对应的,比如第一个‘strl’子列表说明的是第一个流(Stream 0),第二个‘strl’子列表说明的是第二个流(Stream 1),以此类推),‘hdrl’列表的任务也就完成了,随后跟着的就是AVI文件必需的第二个列表——‘movi’列表,用于保存真正的媒体流数据(视频图像帧数据或音频采样数据等)。 最后,紧跟在‘hdrl’列表和‘movi’列表之后的,就是AVI文件可选的索引块。这个索引块为AVI文件中每一个媒体数据块进行索引,并且记录它们在文件中的偏移(可能相对于‘movi’列表,也可能相对于AVI文件开头)。 图1中还有一种特殊的数据块,用一个四字符码‘JUNK’来表征,它用于内部数据的队齐(填充),应用程序应该忽略这些数据块的实际意义。 3、’avih’块 ‘avih’块,用于记录AVI文件的全局信息,比如流的数量、视频图像的宽和高等,可以使用一个AVIMAINHEADER数据结构来操作: typedef struct _avimainheader { 4、’strl’子列表 每个‘strl’子列表至少包含一个‘strh’块和一个‘strf’块,而‘strd’块(保存编解码器需要的一些配置信息)和‘strn’块(保存流的名字)是可选的。首先是‘strh’块,用于说明这个流的头信息,可以使用一个AVISTREAMHEADER数据结构来操作: typedef struct _avistreamheader {
然后是‘strf’块,用于说明流的具体格式。如果是视频流,则使用一个BITMAPINFO数据结构来描述;如果是音频流,则使用一个WAVEFORMATEX数据结构来描述。 5、‘movi’列表 ‘movi’列表保存的是真正的媒体流数据,其数据组织方式有两种。可以将数据块直接嵌在‘movi’列表里面,也可以将几个数据块分组成一个‘rec ’列表后再编排进‘movi’列表。 当AVI文件中包含有多个流的时候,数据块与数据块之间如何来区别呢?数据块使用了一个四字符码来表征它的类型,这个四字符码由2个字节的类型码和2个字节的流编号组成。标准的类型码定义如下:‘db’(非压缩视频帧)、‘dc’(压缩视频帧)、‘pc’(改用新的调色板)、‘wb’(音缩视频)。比如第一个流(Stream 0)是音频,则表征音频数据块的四字符码为‘00wb’;第二个流(Stream 1)是视频,则表征视频数据块的四字符码为‘00db’或‘00dc’。对于视频数据来说,在AVI数据序列中间还可以定义一个新的调色板,每个改变的调色板数据块用‘xxpc’来表征,新的调色板使用一个数据结构AVIPALCHANGE来定义。(注意:如果一个流的调色板中途可能改变,则应在这个流格式的描述中,也就是AVISTREAMHEADER结构的dwFlags中包含一个AVISF_VIDEO_PALCHANGES标记)。另外,文字流数据块可以使用随意的类型码表征。 6、AVI索引块 索引块使用一个四字符码‘idx1’来表征,索引信息使用一个数据结构来AVIOLDINDEX定义。 typedef struct _avioldindex { 注意:如果一个AVI文件包含有索引块,则应在主AVI信息头的描述中,也就是AVIMAINHEADER结构的dwFlags中包含一个AVIF_HASINDEX标记。 四、后记 大家应该都听过“AVI文件不适合用于流媒体传输”这样的说法,通过本文对AVI文件结构的解析,相信大家对这种说法有更清晰的验证,因为AVI文件结构中置于文件尾部的索引块、头部信息中规定的文件长度等过多的选项都是不适合流媒体应用的。 Note: 本文内容节选自 AVI文件格式----摘自《DirectShow实务精选》 作者:陆其明, 并作了整理。 |
|
来自: changqiong0606 > 《avi》