分享

TTS在办公系统的研究与开发

 Alkaid2015 2013-06-15
《青海师范大学》 2012年

TTS在办公系统的研究与开发

【摘要】:语音技术是将近半个世纪发展起来的一门新型科学技术,包括语音识别和语音合成。语音识别的目的是让机器把语音信号转化成可以接受的文本文件或者控制命令。语音合成则是将文本转化为人类可以理解的声音信号。语音技术在工业、军事、交通、医学、民用等各方面有广阔的应用前景,蕴含有巨大的社会经济效益,受到各国日益重视。 其中,文字-语音的转换(简称TTS)系统是一项非常有用的语音技术,它可以将任意文本信息转换为语音信号。它的用途很广泛,如汽车导航,电信的呼叫服务,公交车到站站名自动播报等。现有的基于大语料库的TTS系统已经能够产生高清晰度和自然度的合成语音,并已得到较大的发展和应用。 文本转换成语音仍是当前国内外语音方面的一个热点,其核心主要是语音库的建立与搜索引擎的实现与优化问题。因语音在生活中时刻都存在着,我们经常用语音直接打交道,就是根据语音与文本之间存在一定的规律去发现与开发新的产品来为人民之利益,改善大众生活。 目前对于语音在办公软件方面的应用还很欠缺。本文主要研究TTS在办公应用软件中的开发与应用,以使办公“声音”化,为社会中的一些渴求知识的残疾人找到了“新出路”。 本文主要阐述通过利用微软提供的Speech SDK及Agent技术,在办公应用软件中实现语音的识别和合成。利用Speech SDK的API接口和Agent的语音识别方法,可以将办公应用软件中的文本依次朗读出来。同时也可以通过语音识别来进行语音留言,更加方便用户的使用。利用其TTS技术,可以实现语音的合成,能进行中英文混合阅读。通过设置Agent的属性设置与应用,还可以进行动态效果显示。 本论文的研究对于TTS技术应用在社会中的经济实用价值取向有很大的推动作用。
【关键词】:合成 识别 TTS SDK 办公
【学位授予单位】:青海师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TN912.3
【目录】:
  • 中文摘要3-4
  • Abstract4-8
  • 第一章 绪论8-14
  • 1.1 选题的意义与背景8-9
  • 1.2 课题研究的现状和发展趋势9-11
  • 1.3 论文选题的研究特色和创新之处11-12
  • 1.4 论文研究的主要内容和目标12
  • 1.5 论文的组织结构12-14
  • 第二章 MS Speech SDK 开发包与 VFP 介绍14-21
  • 2.1 Microsoft Speech SDK 简单介绍14-16
  • 2.1.1 Microsoft Speech SDK 结构14-16
  • 2.1.2 Microsoft Speech SDK 的使用16
  • 2.2 Text-TO-Speech 简述16-18
  • 2.2.1 声学处理17
  • 2.2.2 基于语音库的 TTS 系统基本框架17-18
  • 2.3 COM 技术相关介绍18-20
  • 2.3.1 COM 技术的主要优点18-19
  • 2.3.2 COM 技术的发展19
  • 2.3.3 COM 技术的主要接口类19-20
  • 2.4 VFP 简述20-21
  • 第三章 语音合成技术21-26
  • 3.1 合成技术简述21
  • 3.2 基于规则合成法21-22
  • 3.3 基于波形合成法22
  • 3.4 常用的语音合成方法的比较22-26
  • 第四章 系统分析与概要设计26-31
  • 4.1 系统分析26-27
  • 4.1.1 系统可行性26
  • 4.1.2 系统功能需求26-27
  • 4.1.3 系统性能需求27
  • 4.1.4 系统开发平台与语言需求27
  • 4.2 概要设计27-29
  • 4.2.1 系统的设计目标28
  • 4.2.2 设计参考模型28-29
  • 4.2.3 设计的基本思路29
  • 4.3 概要设计29-31
  • 第五章 TTS 在办公软件中具体应用31-46
  • 5.1 概述31-32
  • 5.2 有关 Microsoft Agent 的内容32-33
  • 5.2.1 Microsoft Agent 基本概念32
  • 5.2.2 Microsoft Agent 主要作用32-33
  • 5.2.3 Microsoft Agent 主要特点33
  • 5.3 Speech SDK 应用环境33-44
  • 5.3.1 SAPI5.1 安装33-35
  • 5.3.2 VFP 安装与配置 SAPI35-37
  • 5.3.3 SAPI.SpVoice 主要方法与属性37-39
  • 5.3.4 SAPI 应用 TTS 实现方法39-41
  • 5.3.5 系统框架图41-43
  • 5.3.6 TTS 在朗读中的具体实现43-44
  • 5.3.7 音量、语速等的控制44
  • 5.4 系统测试44-46
  • 第六章 TTS 办公软件系统的扩展与设想46-48
  • 6.1 SAPI 语音识别46-47
  • 6.1.1 语音识别原理46
  • 6.1.2 识别实现方法46-47
  • 6.2 屏幕抓词47
  • 6.3 声音保存47-48
  • 第七章 总结和展望48-50
  • 7.1 主要工作与总结48
  • 7.2 存在的问题与改进的方向48-49
  • 7.3 思考与发现49-50
  • 参考文献50-52
  • 致谢52-53
  • 个人简历53

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多