分享

怎样把tif格式的文本转换成doc格式的文本

 布狄厄布狄厄 2007-06-20

这是wordPDF~
PDF
文件格式转换心得
世事无绝对,首先解密方面,试过几种软件,最好用的还是Passware_Acrobat Key,其次是Adult PDF Password Recovery v2.2.0PDF Password Remover v2.2,再次,至于图像扫描的文本转换,中文的话,比较麻烦,将图片存为不压缩的TIF格式,用清华TH-OCR 9.0版或者汉王文本王进行识别转换,如只是部分识别也可以不存图片,用文通慧视小灵鼠进行屏幕捕获识别,上面这3OCR软件可以在VeryCD.Com上面下载,如果是文本格式可用Solid Converter PDF转换Word编辑翻译,不过,Solid Converter PDF支持的语言较多,英文和繁体中文应该也没问题,至于英文方面,文本格式的PDF可以通过ABBYY PDF Transformer 1.0进行文本转换,格式为RTF可以在Word中编辑,图像格式可以使用最近刚推出的OCR软件_IRIS Readiris Pro v10.0,速度效果都还不错,最后翻译软件方面就看大家自己的喜好了。以上是个人的小小心得,仅供各位参考!
最近更新的Recosoft PDF2Office Personal v2.0软件也可以将PDF文件转换DOC格式,也支持中文,如果有专业版就更好了。IRIS Readiris Pro v10.0也有亚洲语言支持包OCR,如果可以下载到带Keygen的最新版本就可以转换中文了!目前看来只有再等等看了!
部分软件可以在eastgame.netISO0day下载到,也可以去Verycd.com找不到部分!
这是PDFWORD
PDF
文件是很常见的一类电子文档,但在对其中的文字进行摘录时很不方便,有很多将PDF文件转化为文本的工具软件,但直接在Office中转化却是Office 2003中新增的一项功能,与其它专用的程序相比,限制少,使用方便,它实质是利用了OCR文字识别方法,故对含图片等对象识别后会有一些乱码,但对纯文字内容的转化正确率是比较高的,使用也非常方便。
Office中将PDF转换DOCword文件)具体实现是利用Office 2003中的Microsoft Office 文档 Imaging组件来实现这一要求。 
  第一步:先用Adobe Reader打开想转换PDF文件,接下来选择文件打印菜单,在打开的打印窗口中将打印机栏中的名称设置为“Microsoft Office 文档 Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
  注:如果没有找到“Microsoft Office 文档 Image Writer”项,使用Office 2003安装光盘中的添加/删除组件更新安装该组件,选中“Office 工具 Microsoft DRAW转换
第二步:运行“Microsoft Office 文档 Imaging”,并利用它来打开刚才保存的MDI文件,选择工具将文本发送到Word”菜单,在弹出的窗口中选中在输出时保持图片版式不变,确认后系统会提示必须在执行此操作前重新运行OCR。这可能需要一些时间,不管它,确认即可。
  注:对PDFDOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在word2003中可用,其它版本没有Microsoft Office 文档 Image Writer

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多