分享

评测 | 3款大热人工智能听写APPs,搜狗/讯飞/有道哪个好用一目了然

 四通书斋19 2019-12-17

作为一名媒体工作者,外出采访、整理会议录音几乎可以称得上是家常便饭。

偷偷告诉大家,小编的内心其实是拒绝的。不,工作不可负,然而,不过,可是,采访要记的东西似乎肿么写都写不完,听录音几乎能听到想吐,那种希望有人解救自己于水火之中的心情油然而生,我的盖世英雄,你再不来,人家就要拿小拳拳锤你胸口了啦~~~

呼~ 现在好了!

目前,多家公司已推出了语音识别APP。虽然语音转文字的应用市场仍鱼龙混杂,但如果可以得到一款好用易用的应用,既可以提高效率,还能在某些时候避免出错而出现尴尬。今天我们以安卓手机中的语音转换为例,选出3款我们日常使用的第三方语音转文字软件,从里到外地进行一次全面对比。

我们先分别来介绍下这三款应用:

搜狗听写(截止目前下载量:3311)

8月8日,搜狗推出语音实时变文字的速记工具“搜狗听写”,解决了会议、采访、写作等场景下长语音内容转写难题。搜狗听写可用于写文章、采访录音、会议记录、笔记整理、日常记事等场景,能实现对语音转写的高准确率实时转换,并支持长语音转换等。

版本号:1.1.2.50425

软件大小:5.0MB

发布时间:2017-08-08

讯飞语记(截止目前下载量:474万)

讯飞语记是一款说话就能变文字记录的记事本,首次上线时间为2015年7月,支持普通话、英语、粤语、四川话等多方言多语种输入。据悉,其准确率高达95%,可以让我们毫不费力地记录。另外,在搜狗听写推出当日,“讯飞语记”进行了版本更新。

版本号:3.0.1149

软件大小:23.0MB

更新时间:2017-08-08

有道云笔记(截止目前下载量:683万)

有道云笔记,是目前国内最早的笔记软件之一,2011年6月由网易出品。有道云笔记具备云端资料、文档管理、资料收集、语音速记、扫描OCR等多种功能。其中,其语音速记功能于2016年年底推出。今天,小编将着重在语音速记功能进行横向分析。

版本号:5.9.4.1

软件大小:49.4MB

更新时间:2017-07-28

为了验证语音速记功能的识别速度和准确程度,小编决定在实际体验中以两种形式进行测试,分别是热词长段落不仅考验3款软件语音速记功能,还考验其编辑功能

对2017年热词的语音识别准确度对比测试:

搜狗听写:

讯飞语记:

有道云笔记:

附 热词原文:

先定一个能达到的小目标,比方说我先考个全国第一。/ 明明可以靠脸吃饭,偏偏要靠才华。/ 细思恐极 / 何弃疗 / 你有Freestyle吗? / 扎心了,老铁。/ 我可能是个假人。/ 皮皮虾,我们走。

对段落文字的语音识别准确度对比测试:

搜狗听写:

讯飞语记:

有道云笔记:

附 长段落原文:

2017年,世界遗产大会最重要的成果就是,审议通过了中国青海省可可西里和福建省鼓浪屿两个世界遗产地。特别是可可西里,大多数读者可能对她都有较深的感情,她的美丽更是无与伦比。我第一次详尽了解可可西里还是在大学期间,当时的“三角地”附近展览过可可西里的照片,当我看到“高原精灵”藏羚羊由于其皮毛昂贵而成为偷猎对象,屡遭到凶残杀害的时候,我心无比颤抖,当时就报名了去可可西里的社团活动,希望能为保护可可西里贡献一份自己的力量。现在,万恶的偷猎者的枪声距离可可西里越来越远,一个人与动物和谐共处的环境已形成。

人工智能方面

智能语音目前主要依靠深度学习的技术实现,作为机器学习的一个重要分支,深度学习在于建立、模拟人脑进行分析学习的神经网络,使得机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测,以达到具有人类一样的思考能力。

A.搜狗听写

在转写方面,搜狗听写使用了搜狗知音独家研发的长时语音转写技术,并与业内领先的端到端深度神经网络技术深度整合,使得语音识别准确率保持在较高水平。同时,搜狗听写与搜狗输入法联通,推出国民输入法,即个性化词库功能,能使搜狗听写迅速识别相关的专业词汇。

在“听写”模式下,录音的同时即可实时给出识别结果,话音落文字出,几乎没有时间差;而“转写”模式下则可以离线录音,录音完成后一次性获取文字结果。

同时,搜狗听写还贴心的加入了边听边改、无线标重点、多端同步、信息分享等人性化功能,大幅度提升记录效率。此外,在针对图书馆、咖啡厅等不便于大声说话而又有使用语音的场景,搜狗听写提供耳语识别技术,在人的说话音量低至30分贝时,依然可以准确识别。

B.讯飞语记

讯飞语记是一款内置了讯飞语音输入功能的云笔记应用,有着与讯飞输入法同样的识别速度,高达97%的准确率,还可以将文字转成语音朗读出来。

讯飞语音输入功能搭载自然语言理解(Natural Language Understanding,NLU)优化模型,从“听话”层面进化到“听懂”,识别语音中的深层含义;同时为改变“一声吼”的坏毛病,讯飞输入法内置耳语输入声学模型,结合低分贝大数据训练,说话音量再轻也能兼顾语音识别速度和准确率。此外,通过机器学习分领域的噪音数据,自动采用不同算法去除带噪语音中的噪音部分,混合训练噪音和安静环境,自适应不同噪音环境的语音输入。

由于内嵌了讯飞语音输入,可以全程无需触碰屏幕一直说下去。

C.有道云笔记

有道云笔记的首页设计非常简洁。其语音速记功能为有道云笔记与讯飞共同推出的功能,将讯飞旗下的语音识别技术融入到了移动记录场景,从而完成文字的快速录入。录音的同时进行文字转换,最长支持60分钟。完成后可根据分段语音进行文字调整,并转化为文字笔记。

存在的问题:

首先,在标点符号方面,即使人们在断句处作短时间停顿,这3款软件均存在无法正确标注标点符号的问题。相比之下, 搜狗听写表现最佳。

其次,在部分热词识别准确度方面,这3款软件整体表现良好,而搜狗听写对“我可能是个假人”一句话中的“假人”转换为“家人”,其他2款软件未出现类似问题。

第三,在语音识别速度上,搜狗听写和讯飞语记均速度较快,相比之下,有道云笔记的识别速度较慢,甚至还会出现漏转文字等问题。

最后,当人们说话过程中,穿插英文单词时,搜狗听写和讯飞语记的效果会不太好,相比而言,有道云笔记能够做到准确识别。so那些很love讲English的boys and girls,就不要轻易地have a try啦。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多