分享

【赠书】高质量语音处理新书,送6本!

 有三AI 2020-11-27

周末要到了,这次给大家赠送6本语音处理相关的书籍,包括了三本不一样的书籍,都来自于电子工业出版社,分别是《Kaldi语音识别实战》,《语音识别:原理与应用》,《语音识别,原理与应用》,下面首先看看到底有何不同。

《Kaldi语音识别实战》

本书由4位语音识别工业界的专家共同著作,是一本以Kaldi框架为基础,讲解语音识别核心技术的书籍,能够帮助你快速熟悉Kaldi框架的实践

全书共9章,总计300余页,涵盖了语音识别的核心概念与相关实践。

第1章,语音识别技术基础。介绍的是语音识别的技术发展简史,语音识别系统的基本架构,为接下来的章节打基础。

第2章,Kaldi概要介绍。介绍了当前流行的语音识别经典框架的由来,环境的配置以及简单示例代码运行。

第3章,数据处理。介绍了如何选择训练数据,如何将数据准备为Kaldi框架的格式。

第4章,经典声学建模技术。介绍了经典的GMM声学模型,特征提取,单音子与三音子模型的训练以及特征变换技术。

第5章,构图与解码。介绍了语音识别中的特色技术,即训练后模型的解码,针对GMM-HMM/NN-HMM框架。

第6章,深度学习声学建模技术。介绍了基于神经网络的声学建模,如何在Kaldi中完成实践。

第7章,关键词检索和语音唤醒。介绍了语音技术中的关键技术,关键词搜索及其在语音检索中的应用。

第8章,说话人识别。介绍了语音识别中类似于计算机视觉中人脸识别的身份识别技术,即说话人识别。

第9章,语音识别应用实践。介绍了如何使用Kaldi构建语音识别应用中的各个模块,以及使用中的常见问题。

推荐理由:本书详解了语音识别中的核心技术,并且包含Kaldi的案例讲解,理论和实践兼具。

《实时语音处理实践指南》

本书由5位语音识别工业界的专家共同著作,是一本讲解语音信号处理的书籍,能够帮助大家熟悉语音信号处理实各方面的工程实践

全书共13章,300余页。

第1章,介绍语音处理中的最基础的技术,包括时域与频域转换,语音信号建模。

第2章,发声机理和器件。介绍了音频设备的相关知识,包括发音机理,发声模型等。

第3章,语音端点检测。介绍了语音检测方法,包括特征提取与模型。

第4章,单通道降噪。介绍了语音中的降噪方法,包括谱减法 ,维纳滤波,子空间降噪以及深度学习模型。

第5章,声学回声消除。介绍了回声的残产生机理以及消除方法。

第6章,声源定位。介绍了基于麦克风阵列的声源方位估计方法。

第7-8章,分别介绍了声源分离技术中的波束形成技术与盲源分离技术。

第9章,音效处理,介绍了声道技术,编解码处理等音效处理算法。

第10章,语音编解码,介绍了语音编解码与语音质量评估算法。

第11章,语音网络传输,介绍了语音信号在传输中的问题以及解决办法。

第12章,语音唤醒,介绍了语音唤醒中的特征提取与经典模型。

第13章,语音识别,介绍了语音识别中的语音特征提取,声学模型,语言模型技术。

推荐理由:本书内容工程性强,涉及语音处理中的软硬件相关知识点,细节丰富。

语音识别,原理与应用

本书由学校从事语音教学工作的老师编写,能够帮助大家系统性学习语音识别原理与实践。

全书共15章,300余页。

第1章,介绍语音识别基础,发展历史与研究现状,经典模型,以及开源工具和数据集。

第2章,语音信号基础。介绍了声音的采样与量化,WAV文件格式的解析。

第3章,语音特征提取。介绍了语音的预处理技术,常见的语谱图等声学特征。

第4章,HMM。介绍了HMM模型的核心概念,模型评估以及训练问题。

第5章,GMM-HMM。介绍了GMM-HMM算法原理及其模型训练,并基于HTK进行了GMM-HMM系统搭建实践。

第6章,基于HMM的语音识别。介绍了基于HMM的语音识别中的各个模块。

第7章,音素的上下文建模,介绍了基本概念和建模方法。

第8章,语言模型,介绍了n-gram与递归神经网络语言模型,及其中的平滑技术。

第9章,WFST解码器,介绍了WFST理论以及解码等内容。

第10章,DNN-HMM,介绍了DNN基础以及DNN与HMM的结合。

第11章,序列区分性训练,介绍了MMI相关技术。

第12章,端到端语音识别,介绍了端到端语音识别核心技术,包括CTC,Attention与Transformer模型。

第13-15章,分别介绍了工具Kaldi实践与Espnet实践,以及工业应用实践中的库封装与识别引擎优化问题。

推荐理由:本书是一本脱胎于学校的教材,也有丰富的工业界实践。


    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多