分享

【盘点】不得不学,语音识别技术已走到了这里

 鹤轻风 2016-04-11

【盘点】不得不学,语音识别技术已走到了这里

技术语音识别

DevStore · 2015-01-09 18:29

【盘点】不得不学,语音识别技术已走到了这里


研究人员称:人类近期在语音识别和人工智能领域取得的突破将很快会大幅提升设备的理解能力。未来,我们将会生活在一个设备没有键盘的世界里。



语音识别已经进入2.0时代,微软Cortana、Google Now、百度语音助手,大量的独立语音助手面世。不少智能设备包括智能手机、智能电视、智能家居、车联网,语音交互也已成为标配。Google、微软、百度等巨头已经将语音识别能力通过API开放出来,大家都在想办法用语音来取代键鼠或者触摸屏这两种最常见的交互方式,尤其是在移动、家居、汽车等特别场景之下。


在全球,语音识别一直是热门技术之一,尽管还有很多问题,但各大巨头的布局已基本成型。

苹果有 Siri,微软有 Cortana,谷歌有 Google Now,2105年伊始,Facebook 收购语音识别公司 Wit.ai 。

另外

2014年6月,传三星洽购苹果Siri技术语音识别软件商Nuance,三星诸多产品和苹果Siri语音助理采用了Nuance的语音技术。

2014年1月,Intel 的可穿戴设备部门主管 Mike Bell 称,Intel 和第三方机构合作研发的可以运行在 Intel 移动处理器上的语音识别软件,已经能够做到不将用户发出的语音传回云端,而直接在本地进行语音识别。

以色列公司Beyond Verbal 创建的算法甚至可以通过识别音域变化,从而分析出像愤怒、焦虑、幸福或满足等情绪,心情、态度的细微差别也能被识别到,以此进行情绪识别。


在国内,语音识别技术也发展迅速且稳健,目前技术现状:

阿里

前沿:2014年10月,支付宝发布了多款非密码支付产品,包括人脸识别、笔迹识别、击键识别、声纹识别、掌纹识别和指纹识别等。


腾讯

前沿:2014年12月,微信上线iOS新版本,增加“声音锁”功能,用户可以使用声音,无需输入密码即可登录微信。该功能使用的技术是由微信模式识别中心语音技术组开发的声纹识别技术,这也是腾讯在其产品中首次使用此技术。


微信语音开放平台:2014年4月,微信语音开放平台登陆微信智能开放平台,开放了在线语音识别、在线语音合成等技术。腾讯将语音相关技术打包成 SDK,第三方开发者可以通过调用腾讯的 API,直接在第三方应用中调用相关的技术。


微信语音开放平台为开发者提供免费的语音技术,目前已经开放的语音技术包括在线语音识别、在线语音合成等。自定义词表识别技术也已对外开放,用户可以自定义词表,识别结果返回非常精准,而不会像通用识别那样有同音字词的问题。

微信语音技术目前在微信、SOSO地图、QQ音乐、招行等得到应用。


百度

前沿:百度在人工智能领域的投入最多,也最为领先。2014年,百度研究出深度学习语音识别系统DeepSpeech,人工智能智能项目取得突破。 Deep Speech是一款采用深度学习技术的语音识别系统系统。其独特之处在于,它可以在饭店等嘈杂环境下实现将近 81% 的辨识准确率。是同样环境下,其他的商业版语音识别 API,包括 Bing、Google 以及 Wit.AI 等的最高识别率也只有 65%。


百度语音:目前百度语音技术支持适用于搜索及指令场景的短文本识别和适用于短信、微博等输入的长文本识别模式,基于百度海量的数据资源,提供针对音乐、视频、应用、网站搜索及地图POI的识别优化。支持提醒、电话、应用、日历、通讯录、航班、酒店、短信、音乐、手机设置、社交网络、火车、旅游、天气、网 址、地图、通用指令等35个场景。还开放了底层API,开发者可以灵活构建语音识别使用场景,灵活实现各种语音识别交互方式。目前可直接在百度开放平台下载SDK,查看文档。


科大讯飞

科大讯飞是国内语音识别技术比较领先的服务商之一,也是专业的语音技术公司。

前沿:2014年8月,科大讯飞发布了多款软硬件产品,其中包括新版灵犀语音助手,将加入“智能设备”模块,以及与第三方合作的智能音响和“未来遥控”。另外,科大讯飞在方言识别方面也颇为重视。


科大讯飞语音云开放平台:目前,科大讯飞语音云开放平台的语音服务包括:
语音合成:在线语音合成,离线语音合成

语音识别:语音听写、在线命令词识别、离线命令词识别

定制服务:语音唤醒、开放语义、语言云

据悉,科大讯飞语音应用开发接口可供任何团队和个人免费使用。


另外在语音识别技术领域相对领先的还有云之声搜狗语音

云之声主要产品包括语音云平台、微信语音输入插件、云知声输入法等。支持大词汇量连续语音在线识别,支持应用通过API直接调用公有云服务。


搜狗语音云开放平台使用的是自主开发的语音技术,目前使用该技术的有搜狐产品,如搜狗地图、搜狗输入法、搜狐新闻等。

除了上述服务,阿里、盛大、出门问问、捷通华声、紫冬语音、YY、思必驰等也有相关语音服务。


:DevStore对科大讯飞语音、微信语音、百度云语音、云之声、亲加语音通讯云、搜狗语音云都有服务评测,大家可进行查看。




阅读原文 微信原文  分享到微信  文章为作者独立观点,不代表微头条立场                     

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多