发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
▲Bytecover模型结构与训练流程
▲对比结果
▲HTS-AT模型的结构
▲S3T模型结构与训练流程
▲场景感知的服装风格迁移模型框架
▲a. 协同解码 b.细粒度语境知识选择
▲基于稀疏共享结构的多语言预训练流程
来自: 豆豆samuel > 《人工智能》
0条评论
发表
请遵守用户 评论公约
OpenAI 发布的新语音系统Whisper能力到底有多强?
OpenAI 发布的新语音系统Whisper能力到底有多强?OpenAI 最近发布了一个名为Whisper 的自动语音识别系统,声称其在英语语音识别方面已经...
语音识别的降噪思路和总结
8.在整个语音识别体系中,由于声学模型的强抗噪性,所以单通道下的前端降噪似乎没有什么意义,1%左右的wer的改变,基本不影响整个大局,所以想要搞识别这块的朋友,应该先把重要的声学模型,语言模型,...
对不起,AI大模型不是风口
“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”——5月26日,百度创始...
语音识别实际问题:(八)小语种语音识别
语音识别实际问题:(八)小语种语音识别。该模型除了将多个小语种识别作为独立任务外,还引入了一个通用音素识别任务,即将所有语言的...
专访 | 顶级语音专家、MSR首席研究员俞栋:语音识别的四大前沿研究
要说帮助比较大的方面——如果语言模型(language model)算做自然语言处理的话,语言模型还是起到了很大作用的,尤其是在有噪音的环境...
【好文解析】ICASSP最佳学生论文:深度对抗声学模型训练框架
【好文解析】ICASSP最佳学生论文:深度对抗声学模型训练框架CASIA.自动化所智能交互团队刘斌、聂帅、刘文举等针对语音识别系统在噪声环...
对端到端语音识别网络的两种全新探索
在现在主流的利用深度学习的语音识别模型中仍在存在多种派系,一种是利用深度学习模型取代原来的 GMM 部分,即 DNN-HMM 类的模型,另一...
谷歌用新的语音数据扩增技术大幅提升语音识别准确率
谷歌用新的语音数据扩增技术大幅提升语音识别准确率。在谷歌 AI 的近期论文《SpecAugment: A Simple Data Augmentation Method for Auto...
零样本学习:让AI具备从未见过的事物中学习的能力
零样本学习:让AI具备从未见过的事物中学习的能力。零样本学习是一种让AI具备从未见过的事物中学习的能力的方法,它可以让AI在没有任何...
微信扫码,在手机上查看选中内容