现在已经有一些工具软件,可以识别扫描版PDF文件中的表格,但是效果差强人意,会有很多错误,还需要进行很多修改。 万知作为李开复老师旗下零一万物AI大模型的产品,不仅可以免费,而且识别准确率最高,几乎没有任何错误,可以完美还原原文档内容。 打开万知:https://www.wanzhi.com/chatwithdoc,上传扫描图片版的PDF文件, 输入提示词:提取PDF中的表格内容,然后 全部合并在一起,以markdown格式输出表格 只提取了一部分,看来没法一步到位,那就拆分成几步。 输入提示词:提取文档中第1页的表格内容,以markdown格式输出表格 |
|