分享

书籍中文字数字化

 昵称47118240 2017-09-14

  图书数字化中处理数据流程的技术要点  【内容提要】 图书数字化大致有影印出版和电子出版两种类型。影印出版指的是将图书扫描或拍照,生成图像格式文件,经图像修复处理后生成电子书。该类型的复制书与原版基本无差别,生产成本较低,缺点是不能进行内容检索。    图书数字化大致有影印出版和电子出版两种类型。影印出版指的是将图书扫描或拍照,生成图像格式文件,经图像修复处理后生成电子书。该类型的复制书与原版基本无差别,生产成本较低,缺点是不能进行内容检索。电子出版指的是使用OCR(光学字符识别)技术,把纸质图书资料转化为多种格式的原式原样的电子图书,通过先进的生产流程管理系统,将文本的错误率控制在一定范围内,达到出版质量的水平。电子出版的图书可实现全文内容检索,但是工序多、工艺复杂、成本高。本文将重点探讨断版书影印出版的数字化复制。    影印出版的数据处理流程包含图书扫描、图像数据处理、文件串联、文件存储等步骤

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多