分享

OneNote与OCR文字识别

 老董私人 2018-08-28

Office2013Office2016OneNote记事本
Office2003自带的OCR文字识别功能的操作方法

      

         DOC88 网站 道客巴巴、百度文库等网页上的资料,有用的资料不少,但是能看不能下载,因为要积分,咱刚注册哪里有那么多积分?偏偏上传者非得要100 分,得上传100个文件才能赚够积分,并且上传的文件与他系统中不能有重复的,而且每个上传的文件要等管理员人工审核,并且每次只能上传一个文件,不能批量。上传一个文件要点来点去设定参数,可见这100积分多难挣到!其实就是不让下载,花钱可以买了到积分。笑话!难道不花钱就办不了事?要钱要疯了!太缺德,不得好死!

        眼看着有用的资料无法弄下来,真是又急又恨!百度一下“下载器”,没有!谷歌?也没有!尤其是“道客巴巴”的,没辙!此路不通!(找到个“冰点文库下载器”却下载不了DOC文档)

分析IE缓存里的文件试试呢?能看到的是个 EBT扩展名的文件下载到本机上了,没有能打开它的软件,就算有也不可能打开为DOC文档,实在没法。

        办法总是人想出来的,天无绝人之路。最后一招,祭出截图大法! 抓图再OCR文字识别。欲截图截得又快又好,得让页面全屏显示才能提高效率,显示器到是宽屏,偏偏页面是竖的,想看清楚就得滚动屏幕,要想看整页,显示的文字就太小太模糊了,矛盾呀!它的页面不能横过来吗?最好能把屏幕转过来配合页面那才真叫绝配呢!

        怎么?将屏幕横过来呢?高档的显卡驱动自带旋转屏幕功能,咱的破兼容机没有啊?咋办?靠山吃山、靠水吃水,到网上找一下!iRotate 这个小巧精致的软件,一下就把屏幕横过来了!不过刚横过来还得歪着脑袋看,鼠标就更不好控制了,真没辙,只能慢慢适应它吧!

        横过来后再调整页面大小,(Ctrl+鼠标滚轮前后滚动)先让那些工具条休息去吧!最好是将显示器也转过来!等以后我来发明一个能 360 度旋转的显示器!下一步是截屏了,要是抓一下存一下同样要累死人的!“屏幕照相机”绝对能达到所有要求,运行后点击“查看”下的“选项”在“保存”标签下勾选“自动保存捕捉的图像”,设置一个存放路径,类型需要设为“BMP”再将“热键”下的“缺省捕捉模式”根据你的屏幕设为“区域”或者是“窗口”。

        现在右手翻页左手按“F2”,你就只管抓图,每抓一张都已自动保存。很快就能把 100 页给抓下来的,嘿嘿!抓完后按照刚刚设置的路径打开那个目录,OK!全都在这里吧?

        现在用系统自带的“图片和传真查看器”打开刚抓下来的纯文字的BMP图片,点击“图片和传真查看器”下面如下图红圈处的“顺时针或逆时针旋转”按钮,将图片旋转过来。 

 
 

  

        Ctrl+S 在弹出的保存窗口的下方“选择TIFF”格式。回车。再按一下向下的方向键,如此这般将全部的图片转换为 TIF 格式。删除全部BMP 图片。双击转换后的TIF图片,系统即自动调用 Office 自带的“Document ImagingOCR 文字识别程序来打开了。 

        点一下“使用 OCR 识别文本”,“等三五秒钟后再点一下”将文本发送到 Word ,上图中的红圈处的两个按钮。在弹出的发送对话框上点“确定”按钮。(见下图)

 

 
 
 
  

        下面的这个图标就是Office自带的OCR工具,默认是不安装的,必须在安装Office时手动选中。识别率优于其它的专业软件!  

        将打开后的 WEB 文档调整为页面视图方式显示! 

        此时还不是真正的Word能直接打开的DOC文档,还需要另存为DOC文档后才能直接双击后自动调用Word程序打开。 

下图就是由图片经过 OCR 程序识别出来的能够编辑的 WEB 文档。

 

 

 

 

 

 

 

 

 

    将打开后的 WEB文件另存为 doc 文档!(上图)

 

技巧1;截屏时要将图片与纯文字部分分开来抓图,否则OCR不能正确识别图片中的文字。

 

技巧2;不要急于求成,要反复多试 N 次,调整网页页面视图的大小来配合所抓的图片上的文

字的大小比例,以便于 OCR 能正确识别,只有调整到最佳时方能百分百的识别出来!

 

技巧3;如果识别率不高的原因可能是图片的清晰度或者是对比度不够好,可通过Photoshop

图像处理软件来调整即可达到要求。

 

技巧4双击TIF文件时如果系统没有调用“Document Imaging”程序来打开的原因有两个。

1、是文件失去关联,需要重新将TIF文件与“Document Imaging”程序关联一下。当然,

也可以在Office工具里先运行“Document Imaging”程序,再在其中打开TIF图片。

2、是因为电脑里当时选择了默认安装Office的原因,这就需要卸载后重新安装Office

在安装时必须手动选中这个“Microsoft Office Document Imaging”组件。

在此将经验与大家共享一下,用得着的朋友有个参考,可以少走弯路!其实这种方法也是没有办法的办法,虽然是没有办法的办法,恰是万能的最好的办法,只要在电脑屏幕上能看到的或者扫描下来的,又或者是用手机拍下来的,(带个手机去逛新华书店是个好主意)都可以将它们变为可编辑的DOC文档。害怕打字的朋友一定要学会!也免得经常打字将键盘敲坏了又得花钱买!

文中所提及的几款软件可通过邮箱或QQ向笔者索取。

 

        微软公司真会折腾,新出来的Office2013Office2016功能虽然强大了不少,增加的功能对于个人用户并没有多少作用,用习惯的功能与常用的工具确实不好找,对于OCR这个功能在安装Office时不但要将“光学识别”选上而且还要将“OneNote”安装到电脑里,否则就无法使用OCR功能。使用方法也与Office2003大相径庭,下面将不同点作补充说明一下!

        C:\Program Files\Microsoft Office\Office15\OneNote.exe这里是Office2013的默认安装路径下的OneNote.exe程序,对于Office2016则安装在C:\Program Files\Microsoft Office\Office16目录下。

运行“OneNote.exe”在“新分区1”点击菜单上的“插入”(下图)

 

 
   

    浏览找到需要识别文本的图片并打开。(并非一定要TIF格式)在插入的图片上点右键(下图)

  

 

 

 

        在弹出的右键菜单的“复制图片中的文本”上点左键复制。复制后就无需再说了吧?   

说明:它的记事本功能是强大了,对于文字识别率并没有Office2003的识别率高,凑合着用吧!

 

OneNote作为一个功能强大的记事本,以下作一简单介绍。

 

        Office OneNote 是一种数字笔记本,它为用户提供了一个收集笔记和信息的位置,并提供了强大的搜索功能和易用的共享笔记本:搜索功能使用户可以迅速找到所需内容,共享笔记本使用户可以更加有效地管理信息与协同工作。

 

 
 
         OneNote的重要创新之一是内建的搜索功能,以及可索引的图形和音频仓库。图像文件(例如屏幕截图、扫描的嵌入式文档,或照片)中可以搜索内嵌的文本内容,电子墨水注释也可作为文字进行搜索。 
        
       
1可提供一种灵活的方式,将文本、图片、数字手写墨迹、录音和录像等信息全部收集并组织到算机上的一个数字笔记本中。 
 
   

OneNote的部分使用方法

 

        2、安装Office20132016时必须选择上“onenote”,然后单击开始按钮——展开Office文件所在的文件夹,选择OneNote软件打开。 

 
 

        打开以后这个软件就会自动的默认开机启动,在任务栏中我们就可以看到它的图标了以后我们想要用的时候,按下win图标建+N即可快速打开OneNote软件。

 

  

        3选择新建一个记事本——然后就会弹出一个记事本的小窗口,单击右上角的全屏箭头。

这样我们就可以快速的打开OneNote进行记事了。 

 
 

             以下是关于“OneNote”的记事本功能说明

        4个一定用得上的 OneNote 技巧,让你的笔记有条理。

        OneNote 的结构体系不仅体现在目录上,内容的结构也非常强,就像利用“无序列表”这样的方式,可以无限多地创建子列表。

这个时候双击父列表前面的那个“箭头”的标记是可以把列表收起来的,这个功能也非常强大。 

 
         OneNote 常被认为拥有更自由且弹性排版的一个重要原因,就是在正文的编辑上,通过拖曳、缩放这些简单易用的操作,就能非常自由地重新组合内容,或是让内容呈现出更精简易读、更有结构的版面。如果你是利用 OneNote 来建立大纲、草稿,你一定喜欢下面的优点。假如你在一则 OneNote 笔记中,建立了一个项目计划有多个层次的大纲,这时候 OneNote 能让你用大纲的层次缩放笔记的正文。这样即使是很长的大纲,也能精简地呈现,聚焦在目前需要的部分。

        如果你在 OneNote 中写草稿,可能常常需要调整正文的段落顺序、搬移内容位置。这时候 OneNote 帮你省下「复制粘贴」的工夫,可以直接拖曳来调整内容次序。好好利用下面 4 OneNote 笔记内容编辑的技巧,会是大纲、草稿撰写者所需要的。

 

      1. 草稿编辑:拖移正文段落

 

        OneNote 2016 Windows 电脑软件版为例,我在笔记内撰写大纲,过程中想要调整内容的段落位置,这时候鼠标移动到正文左方开头处,就会浮现一个箭头。 

 
 

        我只要直接按住箭头,进行拖曳,那么右方那一段正文,就会跟着我拖曳到我要的位置上。只要每一个分段分行的正文,都可以这样在 OneNote 笔记中直接拖曳,也就不用一直圈选、复制、剪下、贴上来调整草稿内容了。 

 
         附注:一般编辑软件,也可以直接圈选某一段正文,然后按住后拖曳到想要的位置上。不过就不像 OneNote 这样可以更快速且精准地拖曳每个段落。

 

       2. 任务排序:拖移待办清单

 

        如果在 OneNote 笔记中建立了待办清单,那么要调整任务执行的前后顺序时,也可以这样直接拖曳来改变上下次序。 

 
         对于待办清单来说,调整任务顺序是常常需要的功能,而在 OneNote 的笔记内操作起来,就跟 Todoist 这类待办清单工具一样方便。 
 
 

       3. 编号排序:拖移编号清单 

        有时候我们在需要做有编号的清单,甚至是有层次的编号清单,例如下图。这时候利用前面的拖曳功能,我们也可以直接拖曳某一个项目到清单的其他位置。

  

 
 
       
最棒的是,拖曳过去后,就会自动排序出最新的编号次序。​ 
 

       4. 大纲层次:缩放项目符号清单

 

        无论是 OneNote 笔记中的编号清单,或是项目符号清单(如下图),都可以利用拖曳调整上下顺序,也能利用拖曳改变前后的层级关系。

这样我们在建立大纲时,就能更快速的整理层次。 

 
 

 

        如果是笔记内的“项目符号清单(无序清单)”,这时候可以在母层级的左方箭头处双击鼠标,那么下面子层级的清单就会被“收纳”起来。这样一来,如果清单很长,或是清单需要聚焦,就可以用缩放来完成。(如下图所示) 

 
       

         利用上面 4 个编辑技巧,在 OneNote 笔记中,你就可以完成更有结构的大纲草稿编辑了,推荐给使用 OneNote 的朋友参考。

 

 


 



​​

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 全屏 打印 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多