分享

全能OCR识别工具,白嫖各个大厂,就是作者有点皮

 山峰云绕 2020-12-14

https://m.toutiao.com/is/JVaEaMp/ 

OCR技术大家都知道,现在真的是必备的生产力神器了。想当年去网上找资料遇到图片无法复制粘贴,就只能手敲...现在有了ORC图像识别,只需一秒就能解决问题。

随着OCR市场需求的增长,像bat、搜狗、网易这些大厂都开放了OCR接口,今天分享的PandaOCR可以白嫖各个大厂的接口,免费享受高精度的图像识别!

图像识别+翻译+朗读

相较于之前用的天若OCR,熊猫OCR从功能到界面都更优秀,并且完全免费无广告。先说支持的识别方式:支持直接拖入、截图和剪贴板识别。

识别后可以勾选自动翻译和自动朗读,还能智能排版,非常便捷。快捷键F4截图识别翻译一气呵成。

再看一眼支持的引擎,基本市面上能见到的全部都有...

这里要和大家说一下,这些接口默认都是演示版,也就是各个厂家拿来给客户体验用的,所以不够稳定并且有限制。

当然如果不是重度使用,演示版基本也够用了,如果使用频率较高或者需要更稳定更精确的服务,推荐使用API版。

API版就是各个厂商拿来卖钱的商用版,但是多数厂商都会提供免费的次数,所以白嫖的机会来了。

这里拿百度的API为例,每天500次免费,个人使用完全够了,而且这是高精度版,正确率很高。

而且如果真的不够用,别忘了还有一堆其他厂商也有免费次数,我们可以换个地方接着薅羊毛。

这里依旧以百度为例,在百度AI开放平台登录,找到文字识别点击立即使用。

然后新建一个应用,选个人,信息随便填。建好后拿到APIKEY和SECRETKEY。

然后打开配置文件(右键窗口左上角图标)填上自己的APIKEY和SECRETKEY,并根据需求修改配置数字。

图 | 修改配置文件切换API版

修改完配置文件记得重启软件。其他API也是同理。

公式识别和表格识别

PandaOCR也是支持公式识别和表格识别的,先说使用频率更高的表格识别。识别引擎选表格识别,识别后右键点击下载表格直接下载到本地。

图 | 识别效果

下载的文件路径就在软件的安装目录,注意默认的表格识别接口可能会失效,记得打开配置文件切换一下试试,想要稳定直接用API版。我这里用的是阿里表格演示版。

图 | 无法识别记得修改配置文件接口

公式识别也是同理,引擎选择公式识别,可以识别出LaTeX公式源码,然后就可以转换MathML代码插入到word。

细节功能

除了基本的识别,PandaOCR还可以进行游戏机翻,识别并翻译外语游戏剧情字幕,实现实时汉化功能。

具体步骤可以看官方教程。下面介绍几个非常实用的功能。

历史记录

鼠标移动到左边面板的上半部分可以显示识别图片的历史记录,非常贴心。

图像处理

直接上传图片可以对图片进行简单处理,比如色彩增强、清晰化、增强对比、二次元化等等,还可以转换成各种风格。

还有图像抠图的接口也是非常好用,试了一下效果不错。

以图搜图也不用多介绍,熊猫里聚合了搜狗、百度、谷歌等主流的搜图入口。

还有图床功能也不多介绍了,临时的长期的都有。

语音识别

强大的功能又来了,熊猫OCR还自带语音识别功能,右键左边面板打开。点开始录音,然后可以把语音转换为文字,非常实用。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多