配色: 字号:
多媒体技术及其应用与发展论文
2016-05-14 | 阅:  转:  |  分享 
  
多媒体技术未来发展与应用的展望



[摘要]多媒体技术是当今信息技术领域发展最快、最活跃的技术,本文通过对多媒体技术的应用现状和发展趋势的分析,使我们展望到,随着日益普及的高速信息网,它正被广泛应用在咨询服务、图书、教育、通信、军事、金融、医疗等诸多行业。

[关键词]多媒体技术应用现状发展趋势多媒体技术是当今信息技术领域发展最快、最活跃的技术,是新一代电子技术发展和竞争的焦点。多媒体技术融计算机、声音、文本、图像、动画、视频和通信等多种功能于一体,借助日益普及的高速信息网,可实现计算机的全球联网和信息资源共享,因此被广泛应用在咨询服务、图书、教育、通信、军事、金融、医疗等诸多行业,并正潜移默化地改变着我们生活的面貌。

多媒体技术的发展趋势

总的来看,多媒体技术正向二个方而发展:一是网络化发展趋势,与宽带网络通信等技术相互结合,使多媒体技术进入科研设计、企业管理、办公自动化、远程教育、远程医疗、检索咨询,文化娱乐、自动测控等领域;二是多媒体终端的部件化、智能化和嵌入化,提高计算机系统本身的多媒体性能,开发智能化家电。



技术的创新和发展将使诸如服务器、路由器、转换器等网络设备的性能越来越高,包括用户端CPU、内存、图形卡等在内的硬件能力空前扩展,人们将受益于无限的计算和充裕的带宽,它使网络应用者改变以往被动地接受处理信息的状态,并以更加积极主动的姿态去参与眼前的网络虚拟世界。

多媒体技术的发展使多媒体计算机将形成更完善的计算机支撑的协同工作环境,消除了空间距离的障碍,也消除了时间距离的障碍,为人类提供更完善的信息服务。

交互的、动态的多媒体技术能够在网络环境创建出更加生动逼真的二维与三维场景,人们还可以借助摄像等设备,把办公室和娱乐工具集合在终端多媒体计算器上,可在世界任一角落与千里之外的同行在实时视频会议上进行市场讨论、产品设计,欣赏高质量的图像画面。新一代用户界面(UI)与智能人工(IntelligentAgent)等网络化、人性化、个性化的多媒体软件的应用还可使不同国籍、不同文化背景和不同文化程度的人们通过“人机对话”,消除他们之间的隔阂,自由地沟通与了解。

多媒体技术的应用现状

多媒体技术的开发和应用,使人类社会工作和生活的方方面面都沐浴着它所带来的阳光,新技术所带来的新感觉、新体验是以往任何时候都无法想象的。

多媒体数据压缩,图像处理的应用

多媒体计算机技术是面向三维图形、环绕立体声和彩色全屏幕运动画面的处理技术。而数字计算机面临的是数值、文字、语言、音乐、图形、动画、图像、视频等多种媒体的问题,它承载着由模拟量转化成数字量信息的吞吐、存储和传输。数字化了的视频和音频信号的数量之大是非常惊人的,它给存储器的存储容量、通信干线的信道传输率以及计算机的速度都增加了极大的压力,解决这一问题,单纯用扩大存储器容量、增加通信干线的传输率的办法是不现实的。

数据压缩技术为图像、视频和音频信号的压缩,文件存储和分布式利用,提高通信干线的传输效率等应用提供了一个行之有效的方法,同时使计算机实时处理音频、视频信息,以保证播放出高质量的视频、音频节目成为可能。

国际标准化协会,国际电子学委员会,国际电信协会等国际组织,于二十世纪90年代领导制定了三个重要的有关视频图像压缩编码的国际标准,JPEG标准;H.261标准;MPEG标准。

JPEG

它是国际上彩色、灰度、静止图像的第一个国际标准,它不仅适于静态图像的压缩,电视图像序列的帧内图像的压缩编码,也常采用JPEG压缩标准。

H.261

它是视频图像压缩编码国际标准,主要用于视频电话和电视会议,可以以较好的质量来传输更复杂的图像。

MPEG

MPEG视频压缩技术是针对运动图像的数据压缩技术。目前又分为MPEG-I、MPEG-Ⅱ、MPEG-IV、MPEG-7和MPEG-21。

MPEG-I最初用于数字存储上活动图像及伴音的编码,数码率为1.5Mbit/s,图像采用SIF格式,两路立体声伴音的质量接近CD音质,到现在,MPEG-I压缩技术的应用已经相当成熟,广泛地应用在VCD制作,图像监控领域。

MPEG-Ⅱ是MPEG-I的扩充、丰富和完善。MPEG-II的视频数据速率为4—5Mit/S,能提供720×480(NTSC)或720×576(PAL)分辨率的广播级质量的视像,适用于包括宽屏幕和高清晰度电视(HDTV)在内的高质量电视和广播。

随着网络、有线/无线通信系统的迅猛发展,交互式计算机和交互性电视技术的普遍应用,以及视频、音频数据综合服务等应用的发展趋势,对计算机多媒体数据压缩编码、解码技术及其遵循的标准提出更多更高的要求,有许多要求MPEG-I和MPEG-Ⅱ标准是难以支持的,因此MPEG-Ⅳ应运而生,它正是为解决这些高需求而推出的。

如今,越来越多的声像信息以数字形式存储和传输,这为人们更灵活地使用这些信息提供了可能性。但随之而来的问题是,随着网络上信息爆炸性的增长,获取到我们感兴趣的信息的难度却越来越大。传统的基于关键字或文件名的检索方法显然不适于数据量庞大、又不具有天然结构特征的声像数据,因此近些年来多媒体研究的一个热点是声像数据的基于内容的检索,例如“从这段新闻片中找出有首相、总统的镜头”这种形式的检索。实现这种基于内容检索的一个关键性的步骤是要定义一种描述声像信息内容的格式,而这与声像信息的存储形式(编码)又是密切相关的。国际标准化组织运动图像专家组注意到了这方面的需求和潜在的应用市场,在推出影响极大的MPEG—1、MPEG-2之后,尚未完成MPEG-4的最后定稿,便开始着手制定专门支持多媒体信息基于内容检索的编码方案:MPEG-7。

MPEG-7作为MPEG家族中的一个新成员,正式名称叫做“多媒体内容描述接口”,它将为各种类型的多媒体信息规定一种标准化的描述,这种描述与多媒体信息的内容本身一起,支持用户对其感兴趣的各种“资料”的快速、有效地检索。

音频信息处理的应用

在多媒体技术中,存储声音信息的文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SON文件及RMI文件等。

音频信息录制编辑

把音乐和语音加到多媒体应用中,是我们研究音频处理技术的目的,下面是我们常用的音频信息录制编辑软件。

WaveEdit工具的REC命令;SoundBlaster卡的VEdit2软件;MicrosoftSoundSystem卡的QuickRecorder软件;Cooledit软件;WaveEdit工具;CreativeWaveStudio。

语音识别

语音的识别长久以来一直是人们的美好梦想,让计算机听懂人说话是发展人机语音通信和新一代智能计算机的主要目标。随着计算机的普及、越来越多的人在使用计算机,如何给不熟悉计算机的人提供一个友好的人机交互手段,是人们感兴趣的问题,而语音识别技术就是其中最自然的一种交流手段。

自从20世纪80年代中期以来,新技术的不断出现使语音识别有了实质性的进展。特别是隐马尔可夫模型(HMM)的研究和广泛应用,推动了语音识别的迅速发展,陆续出现了许多基于HMM模型的语音识别软什系统。

当前,语音识别领域的研究正方兴未艾。在这方面的新算法、新思想和新的应用系统不断涌现。同时,语音识别领域也正处在一个非常关键的时期,世界各国的研究人员正在向语音识别的最高层次应用——非特定人、大词汇量、连续语音的听写机系统的研究和实用化系统进行冲刺,可以乐观地说,人们所期望的语音识别技术实用化的梦想很快就会变成现实。

多媒体通信及分布式多媒体技术的应用

人类社会逐渐进入信息化时代,社会分工越来越细,人际交往越来越频繁,群体性、交互性、分布性和协同性将成为人们生活方式和劳动方式的基本特征,其间大多数工作都需要群体的努力才能完成。但在现实生活中影响和阻碍上述工作方式的因素太多,如打电话时对方却不在。即使电话交流也只能通过声音,而很难看见一些重要的图纸资料,要面对面的交流讨论,又需要费时的长途旅行和昂贵的差旅费用,这种方式造成了效率低、费时长、开销大的缺点。今天,随着多媒体计算机技术和通信技术的发展,两者相结合形成的多媒体通信和分布式多媒体信息系统较好地解决上述问题。

多媒体通信和分布式多媒体技术涉及:计算机支持的协同工作(CSCW)、视频会议、视频点播(VOD)等。

世界正迈进数字化、网络化、全球一体化的信息时代。信息技术将渗透着人类社会的方方面面,其中网络技术和多媒体技术是促进信息社会全面实现的关键技术。

多媒体交互技术的发展,使多媒体技术在模式识别、全息图像、自然语言理解(语音识别与合成)和新的传感技术(手写输入、数据手套、电子气味合成器)等基础上,利用人的多种感觉通道和动作通道(如语音、书写、表情、姿势、视线、动作和嗅觉等),通过数据手套和跟踪手语信息,提取特定人的面部特征,合成面部动作和表情,以并行和非精确方式与计算机系统进行交互。可以提高人机交互的自然性和高效性,实现以三维的逼真输出为标志的虚拟现实。

蓝齿技术的开发应用,使多媒体网络技术无线电。数字信息家电,个人区域网络,无线宽带局域网,新一代无线、互联网通信协议与标准,对等网络与新一代互联网络的多媒体软件开发,综合原有的各种多媒体业务,将会使计算机无线网络异军突起,牵起网络时代的新浪潮,使得计算无所不在,各种信息随手可得。







献花(0)
+1
(本文系幸福小書馆首藏)