【原】【赠书】高质量语音处理新书，送6本！

有三AI 2020-11-27

展开全文

周末要到了，这次给大家赠送6本语音处理相关的书籍，包括了三本不一样的书籍，都来自于电子工业出版社，分别是《Kaldi语音识别实战》，《语音识别：原理与应用》，《语音识别，原理与应用》，下面首先看看到底有何不同。

《Kaldi语音识别实战》

本书由4位语音识别工业界的专家共同著作，是一本以Kaldi框架为基础，讲解语音识别核心技术的书籍，能够帮助你快速熟悉Kaldi框架的实践。

全书共9章，总计300余页，涵盖了语音识别的核心概念与相关实践。

第1章，语音识别技术基础。介绍的是语音识别的技术发展简史，语音识别系统的基本架构，为接下来的章节打基础。

第2章，Kaldi概要介绍。介绍了当前流行的语音识别经典框架的由来，环境的配置以及简单示例代码运行。

第3章，数据处理。介绍了如何选择训练数据，如何将数据准备为Kaldi框架的格式。

第4章，经典声学建模技术。介绍了经典的GMM声学模型，特征提取，单音子与三音子模型的训练以及特征变换技术。

第5章，构图与解码。介绍了语音识别中的特色技术，即训练后模型的解码，针对GMM-HMM/NN-HMM框架。

第6章，深度学习声学建模技术。介绍了基于神经网络的声学建模，如何在Kaldi中完成实践。

第7章，关键词检索和语音唤醒。介绍了语音技术中的关键技术，关键词搜索及其在语音检索中的应用。

第8章，说话人识别。介绍了语音识别中类似于计算机视觉中人脸识别的身份识别技术，即说话人识别。

第9章，语音识别应用实践。介绍了如何使用Kaldi构建语音识别应用中的各个模块，以及使用中的常见问题。

推荐理由：本书详解了语音识别中的核心技术，并且包含Kaldi的案例讲解，理论和实践兼具。

《实时语音处理实践指南》

本书由5位语音识别工业界的专家共同著作，是一本讲解语音信号处理的书籍，能够帮助大家熟悉语音信号处理实各方面的工程实践。

全书共13章，300余页。

第1章，介绍语音处理中的最基础的技术，包括时域与频域转换，语音信号建模。

第2章，发声机理和器件。介绍了音频设备的相关知识，包括发音机理，发声模型等。

第3章，语音端点检测。介绍了语音检测方法，包括特征提取与模型。

第4章，单通道降噪。介绍了语音中的降噪方法，包括谱减法，维纳滤波，子空间降噪以及深度学习模型。

第5章，声学回声消除。介绍了回声的残产生机理以及消除方法。

第6章，声源定位。介绍了基于麦克风阵列的声源方位估计方法。

第7-8章，分别介绍了声源分离技术中的波束形成技术与盲源分离技术。

第9章，音效处理，介绍了声道技术，编解码处理等音效处理算法。

第10章，语音编解码，介绍了语音编解码与语音质量评估算法。

第11章，语音网络传输，介绍了语音信号在传输中的问题以及解决办法。

第12章，语音唤醒，介绍了语音唤醒中的特征提取与经典模型。

第13章，语音识别，介绍了语音识别中的语音特征提取，声学模型，语言模型技术。

推荐理由：本书内容工程性强，涉及语音处理中的软硬件相关知识点，细节丰富。

语音识别，原理与应用

本书由学校从事语音教学工作的老师编写，能够帮助大家系统性学习语音识别原理与实践。

全书共15章，300余页。

第1章，介绍语音识别基础，发展历史与研究现状，经典模型，以及开源工具和数据集。

第2章，语音信号基础。介绍了声音的采样与量化，WAV文件格式的解析。

第3章，语音特征提取。介绍了语音的预处理技术，常见的语谱图等声学特征。

第4章，HMM。介绍了HMM模型的核心概念，模型评估以及训练问题。

第5章，GMM-HMM。介绍了GMM-HMM算法原理及其模型训练，并基于HTK进行了GMM-HMM系统搭建实践。

第6章，基于HMM的语音识别。介绍了基于HMM的语音识别中的各个模块。

第7章，音素的上下文建模，介绍了基本概念和建模方法。

第8章，语言模型，介绍了n-gram与递归神经网络语言模型，及其中的平滑技术。

第9章，WFST解码器，介绍了WFST理论以及解码等内容。

第10章，DNN-HMM，介绍了DNN基础以及DNN与HMM的结合。

第11章，序列区分性训练，介绍了MMI相关技术。

第12章，端到端语音识别，介绍了端到端语音识别核心技术，包括CTC，Attention与Transformer模型。

第13-15章，分别介绍了工具Kaldi实践与Espnet实践，以及工业应用实践中的库封装与识别引擎优化问题。

推荐理由：本书是一本脱胎于学校的教材，也有丰富的工业界实践。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：有三AI > 《待分类》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

有三AI

关注对话

TA的最新馆藏

【通知】2024年有三AI知识星球重新开放！重点新增大模型内容每日更新
【一对一小组】2024年有三AI-CV中阶-GAN组发布，如何循序渐进地学习好生成对抗网络原理与应用
【百家稷学】大语言模型核心算法原理与综合实践（北京信息科技大学实训）
【技术综述】深度学习模型结构复杂、参数众多，如何更直观地深入理解你的模型？
【百家稷学】人工智能基础理论与实践（广西电力职业学院暑期实训）
【培训】第二届深圳AI视觉项目研发与部署免费线下公开课启动！2023年9月底与我们相约，开启AI视觉之旅！

喜欢该文的人也喜欢更多

热门阅读换一换