适用于 |
Microsoft Office 2003 |
Microsoft Office Document Imaging 程序包含两个组件,扫描组件和图像处理组件。扫描组件通过使用安装的任何扫描仪来控制将文档扫描到计算机中的过程。扫描完成后,将立即自动对扫描文档执行 光学字符识别 (OCR) (OCR:将文本图像(如扫描的文档)转换为实际的文本字符。也称为文本识别。) 。您可以轻松地将多个页面扫描到单个文件中。图像处理组件使在屏幕上查看和处理扫描文档变得更容易。
扫描仪驱动程序:TWAIN 驱动程序和 WIA 驱动程序
大多数扫描仪使用 TWAIN 驱动程序在扫描仪与计算机之间传输状态和设置信息。在 Microsoft Windows? XP 以及更高版本中,扫描仪还可以包括 Windows 图像采集 (WIA) 驱动程序。Microsoft Office Document Imaging 使用这些驱动程序来确定扫描仪的性能以及从扫描仪获取图像。
Document Imaging 包含一个已识别扫描仪和驱动程序的数据库。如果 Document Imaging 识别到扫描仪,您可以选择在每次扫描时显示扫描仪驱动程序对话框并自己调整扫描设置,也可以让 Document Imaging 为您管理扫描过程。
在带有自动文档送纸器的扫描仪上,WIA 驱动程序可能无法正常工作。如果扫描仪带有自动文档送纸器,则应该安装并使用 TWAIN 驱动程序以获得最佳效果。
一些扫描仪使用 TWAIN 仿真驱动程序。Document Imaging 不支持仿真驱动程序。如果您的扫描仪使用 TWAIN 仿真驱动程序,请与制造商联系以获取最新版本的可兼容 TWAIN 或 WIA 驱动程序。
扫描文件的格式和压缩
Document Imaging 使用“Microsoft Document Imaging 格式 (MDI)”或“Tag 图像文件格式 (TIFF)”存储扫描的图像。结果文件比以“联合图像专家组 (JPEG)”格式存储的同一图像的文件要大。两种格式都可用于存储由 OCR 识别的文本和图像。
Microsoft Document Imaging 格式 (MDI)
MDI 文件格式基于专为按页面版式保存图像而设计的 TIFF 格式。在 Document Imaging 中,您可按 MDI 格式和 IFF 格式打开和保存扫描的文件。
通常,图像保存为 MDI 文件格式比保存为 TIFF 文件格式占用更少的磁盘空间。以 MDI 文件格式保存的图像质量与以 TIFF 格式保存的同一图像的质量相当。
Tag 图像文件格式 (TIFF)
TIFF 是一种适用于多种图像处理程序(包括扫描和传真程序)的常用格式。您可以使用多种其他图形处理程序来打开和编辑使用 Document Imaging 创建的 TIFF 文件。请注意:只能在 Microsoft Office Document Imaging 2003 中打开或编辑 MDI 文件。如果希望与正在使用 Microsoft Office Document Imaging 2002 或其他文档图像处理程序的用户共享文件,请将文件保存为 TIFF 格式以与其他人员使用的程序相兼容。
联合图像专家组 (JPEG)
JPEG 是 Web 图形最常用的文件格式。因为 JPEG 文件具有很高的文件压缩比,所以它们的下载速度很快。JPEG 文件使用的压缩方法会导致图像细节和清晰度方面的损失。细节的损失会影响 OCR 质量,因此不容易得到满意的 OCR 效果。这就是 Document Imaging 文件存储为 MDI 或 TIFF 格式而非 JPEG 格式的原因。
JPEG 格式用于保存从 Document Imaging 复制到其他程序的图像,包括使用“复制”或“复制图像”命令(“编辑”菜单)或者“将文本发送到 Word”命令(“工具”菜单)的场合。Document Imaging 支持复制最大为 2 兆字节 (MB) 的图像。这意味着如果在 Document Imaging 中复制一个较大的高分辨率 (600 dpi) 图像,粘贴图像的图像保真度可能会比较低,这样可以在保留原始图像尺寸的同时使文件大小保持在 2 MB 的限制内。
关于压缩和 OCR 效果的提示
Document Imaging 可用于查看使用其他程序创建的标准 TIFF 文件。通过电子邮件或计算机上的传真程序收到的传真经常存储为 TIFF 文件。为了使用传真中的文本(如将文本复制到其他程序中),您可以在 Document Imaging 中打开该 TIFF 文件,然后在“工具”菜单上,单击“使用 OCR 识别文本”以运行 OCR。在 Document Imaging 中保存 MDI 或 TIFF 文件时,会将 OCR 信息添加到文件中并压缩原始图像。运行 OCR 并保存文件后,就可以对传真中的文本进行搜索了。
以 300 dpi 左右的分辨率扫描图像可获得最佳的 OCR 效果。大多数扫描图像的分辨率是 300 dpi,而 Document Imaging 中的默认扫描预设被设置为 200 dpi 或 300 dpi。在 Document Imaging 中,最高可以使用 1200 dpi 的分辨率来扫描文档。但是,将分辨率设置高于 300 dpi 会显著增大扫描时间和文件大小,并且较高的分辨率设置不一定会获得更好的 OCR 效果。
向多页扫描文件中添加页面
在 Document Imaging 中,您可以将多个文件拖动到单独的文件中以创建一个较大的文件。例如,您可以扫描上次出差或住宅建设项目的所有收据,然后将它们放到一个文件中以便参考。如果忘记了某个收据,您可以很容易地将其添加到文件中:
- 在 Document Imaging 中,打开包含先前扫描的所有收据的文件。
- 在“文件”菜单上,单击“扫描新文档”,然后扫描要添加的收据。
- 在“窗口”菜单上,单击“全部重排”以显示带有新扫描收据的文档和带有先前扫描收据的文档。
- 在新扫描收据的 缩略图窗格 (缩略图窗格:将当前扫描的文档作为一个或多个小图像来提供。) 中,选择该缩略图,然后将其拖动到带有先前扫描收据的文档的缩略图窗格中。
- 请确保保存包含所有收据的文件。
您还可以使用缩略图窗格来重排多页文件中的页面。 |