分享

重磅推出古籍OCR自动秒级识别

 小藏身馆 2019-12-21

录入汗牛充栋的古籍中的汉字识别工作,是古籍全文数字化中的一大障碍。北京书同文重磅推出古籍手写汉字OCR识别系统(点字成金),机器识读古文字,自动生成文本文件,保留原有版式,提供在线高效多角度的校对方式,令您从疲乏中解脱,轻松完成古籍汉字的录校工作。


亮点概述:(选中图像,自动秒级录入,一气呵成! 无需前期人为操作:端正图像、单列画框等)

1.单独或批量选择所需要识别的图像,系统自动识别文字且自带原版面信息。正常自动识读率百分之九十之上,规范手写自动识别正确率百分之九十五以上。【扫描质量很差,或特殊形式的文字书写除外(草书、篆书、甲骨文等)】

原书页如下:

自动识别效果见下图,红色箭头为原图列,蓝色为自动识别文本列

再如:

以上书页样本汉字识别正确率非常之高!

为保证文字的正确率,进一步再进行少量人工校对

2.提供多种校对工具,提供识别评分系统
(1)显示评分区域滑块,用户可以利用评分的高低去筛选重点需要校对的文字

(2)对比原图校对错字


(3)聚类校对错字

(4)输出json 和 txt
您可以

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多