分享

(ocr相关)老马提取的微软MODI独立安装包和21种语言包等(接口开放)

 quasiceo 2014-02-09

楼主 axv <1811806> 2012-07-04 13:09:23 发表在网盘 2614人浏览 38人参与 2012-07-04 20:09:54 更新过


http://q./115/56350?p=all#
【王牌和革命性效果】本地或云端等自动OCR后阅读的设想


http:///folder/fbgdrnxu#(ocr相关)老马提取的微软MODI独立安装包和21种语言包等(接口开放)

含:

 

http:///file/dpa475os#
unicornviewer+0.22+绿色免注册版.rar

http:///file/e7c0qd2q#
MODI中的OCR模块.pdf

http:///file/e7c0qrm4#
用MODI OCR 21种语言.pdf

http:///file/dpa4qrt2#
MODI-OCR-CHN.rar

http:///file/e7c0qtz2#
modi 21种语言.rar

http:///file/e7c0qakn#
MODI2003.exe

http:///file/c2iw9jy6#
Download Microsoft Office Document Imaging Visual Basic Reference (MODI) - Microsoft Download Center - Download Details.mht

http:///file/be1b22vp#
modi-kor.rar

http:///file/e7c0bfun#
modi-jap.rar

http:///file/anp2mt9k#
modi-eur.rar

http:///file/e7c0bh6p#
modi-cht.rar

http:///file/c2iwp9s8#
jocr 1.0 繁体中文化版.rar

http:///file/anp2mdi5#
JOCR.rar

 

补:http:///file/e7c0tbt5#
热卡文档拍照识别软件 Android版 Hotcard OCR Reader for Android.doc

 

2011-11-2 12:59 就一股股票 | 二级
具体看手机的功能,因为目前手机都有照相功能,安装一个识别软件就能解决,比如我的HTC  Touch HD 通过汉王软件,就可以将整页文字进行识别
http://zhidao.baidu.com/question/336527486.html

 

 

 

MODI_OCR_CHN  压缩包

 

用途:在未安装Office 2003/2007的机器上安装MODI的OCR接口,供第三方软件的OCR功能调用。内含简体中文、英文OCR模块,只能用于简体中文Windows XP/Vista/Win7。其中注册表项用的是SharePoint Designer 2007的,文件全部用的是Office 2007 SP3的。

安装方法:双击运行install.bat,自动完成文件复制(复制到C:Program FilesCommon FilesMicrosoft Shared文件夹),并写入OCR接口所需的注册表项。install.bat会自动识别是x86还是x64系统。

安装完成后可以删除解压出来的所有文件,DjVuToy、FreePic2Pdf、Pdg2Pic、UV等软件的OCR功能即可正常使用。
相关技术细节详见《MODI中的OCR模块》一文,在此基础上OCR更多语言的配置过程详见《用MODI OCR 21种语言》一文。

 

 

 

老马:

 

MODI全称Microsoft Office Document Imaging,是微软Office 2003/2007所带的光学字符识别(OCR)组件,其OCR引擎采用清华文通和ScanSoft的技术,支持21种语言,是一个方便的OCR工具。

与其他商业OCR软件相比,MODI具有下列特点:

支持多页TIFF。某些OCR只支持单页TIFF,OCR以后还需要对结果进行合并。当然MODI支持的TIFF页数也不是无限的,我个人的经验是不要超过300页。单页TIFF可用免费的TiffToy合并成多页TIFF,再用MODI进行OCR。TiffToy合并时可以选择每合并多少个文件生成一个新文件。


支持的语言比较多,目前有21种。


提供开放的编程接口。对于软件开发人员来说,到微软网站下载一份MODI编程手册,即可开发出基于MODI的、具有多国语言OCR功能的软件。MODI编程手册下载地址:
http://www.microsoft.com/downloads/details.aspx?FamilyId=8F93E445-B1CF-4477-A373-E17417D616BC&displaylang=en


别的语言我没试过,但对简体、繁体、日文、朝鲜语来说,仅支持印刷体识别,不支持手写识别。如果您想要的是手写体识别,别浪费时间了,找其它软件去吧。


对于简体、繁体、日文、朝鲜语,识别结果只有字符、字符位置,没有任何字体信息,因此不能做到精确版面还原,不过对于只想看文字来说是够了。其他语言能够识别字体,因此可以做到版面还原。


一次只能选一种语言,因此对于多语言混排的情况识别率不佳。


图文混排、表格的识别要看人品和运气。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多