编辑/排版:卒見 办公文档处理,我们常常会纠结于工具的使用。当然,自己手动操作的笨方法也不是不可以。本次的推荐,是关于PDF文档及文字识别的处理工作,希望可以帮助到你! 01 pdf-diff 我之前给大家推荐过pdf工具,一般在规定文档大小及数量的情况下可以免费使用。pdf-diff没有这样的限制,这是一款开源的pdf文件对比工具。 pdf-diff能够可视化两个pdf文件,追踪、对比不同pdf版本间的差异。类似Git,可以帮助你更好的了解pdf内容变更情况。 它的工作原理很简单: 1.使用pdftoppm从要比较的pdf中生成一系列图像(每页一个); 2.再用简单的像素比较算法,将pdf中已更改的页面栅格化为png,并在更改的文本周围绘制红色轮廓,用以显示一个pdf和另一个pdf之间的差异。 GitHub: github.com/serhack/pdf-diff 02 LookScanned Pdf文件在很多时候和扫描件是分不开的,将PDF转换成扫描文件是工作中一项非常简单的需求。 LookScanned是一个纯粹的前端网站,它可以帮你将PDF转换成扫描文件。支持设置文件角度、噪点、模糊度等属性,整个过程无需用到打印机和扫描仪。 特点: 1.浏览器处理,无隐私风险,适用于所有浏览器和设备。 2.可在没有网络连接的情况下工作。 3.支持调整设置、实时并排查看扫描的PDF。 4.所有文件都是静态的。无需后端服务器。 官网:zh.lookscanned.io GitHub:github.com/rwv/lookscanned.io 03 Umi-OCR 文字识别,其实用微信或是网页就可以完成,这里的OCR文件识别,到是有一个突出的有点,你可以完全离线操作。 Umi-OCR是一款功能齐全的开源OCR软件,基于PaddleOCR,可离线使用,适用于Win10 x64 平台。 特点: 1.支持截屏识别、粘贴图片,可批量导入本地图片; 2.支持将OCR识别结果输出到软件面板或本地文件; 3.支持合并段落、竖排文字,可排除水印区域,提取干净的文本; 4.多国语言。 GitHub:github.com/hiroi-sora/Umi-OCR 04 Text to Handwriting 如果你需要书面作业,且不想要写作的话。你可以选择将文本转换为手写工具。 Text to Handwriting是一款可以将普通文本转换为手写文本的工具。 支持中文字体,支持自定义字体大小、墨水颜色、页面大小、字体间距、纸张背景等。 官网: saurabhdaware.github.io/text-to-handwriting GitHub: github.com/saurabhdaware/text-to-handwriting 今天的文档处理工具就推荐这几个啦,能不能帮助到你呢? |
|