分享

NLP之ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

 处女座的程序猿 2021-09-28

NLP之ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略


利用python进行语音生成

T1、调用win系统自带程序将文字转为语音读出
T2、利用python的pyaudio库进行实时录制,生成wav文件
T3、利用BAT、科大讯飞等的语音识别API(上传到BAT、科大讯飞等语音服务器)API将自定义文字,转换生成wav、mp3等文件

利用python进行语音识别

T1、利用BAT、科大讯飞等语音识别API(上传到百度语音服务器)API将生成wav、mp3等文件,识别转为文本内容
T2、后期更新……

相关文章
百度语音调用流程
百度语音之错误码及常见原因
pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存
ASR:基于pyaudio利用python进行语音生成、语音播放、语音识别总结及其案例详细攻略

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多