hello大家好,前几天老Y在github上闲逛,发现了一个大神项目,这个工具已经被标星将近5K,可见其受欢迎程度。 这个工具叫Tabula,它是用于提取pdf中的数据表格工具。我们知道pdf中的数据表格,不好复制,即使用文字识别工具也未能很好的识别,更别说直接生成excel表格了。 而Table可以将pdf中的数据直接提取到csv或excel表格中,很实用很方便的一个工具。Table支持Windows、Mac OS X、Linux三大系统。 下面老Y在windows中用个例子说明一下。 在Windows中,工具下载后只有一个exe文件如下图所示,使用方法很简单直接双击就可以了。 运行后会自动跳出网页,如果没有自动跳出,在浏览器输入http://localhost:8080即可. |
|