分享

djvu转pdf方法

 东西二王 2015-05-04

djvu转pdf方法

djvu

DjVu是由AT&T实验室自1996年起开发的一种图像压缩技术,已发展成为标准的图像文档格式之一。国际上大量应用实例已证明,DjVu可替代PDF成为网络传输扫描文档、数码照片、图像文件的主流技术。

中文名  图像压缩技术
外文名
  djvu
提出者  AT&T实验室
提出时间  1996年

1基本简介

Djvu(念作 "déjà vu" 法语中“曾经见过,似曾相识”之意),是一种用于保存图书的文件格式,和Acrobat PDF有相似之处。它的原理是把图像分离成前景层和背景层进行压缩。通过将文字和背景分离开来,DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。
DjVu 格式背后的一项主要技术是将图像分为背景层 ( 纸的纹理和图片 ) 和前景层 ( 文本和线条 ) 。传统的图像压缩格式对于简单的图片来说,还可以接受,但对于强对比色彩区域之间的色彩反差的表现则大打折扣,这也是为什么它们对于文字的还原难以令人满意的原因。一般来说,要确保文字和线条的清晰度需要较高的分辨率 ( 通常为 300dpi) ,而反映连续色彩图像和纸张的背景机理则不需要那么高的分辨率 ( 通常为 100dpi) 。因此,要提高清晰度,最好的方法就是将这些元素分为不同的层来进行处理。

2主要优势

文件更小,容量更大
利于文件的快速浏览,传送和下载
支持IE、NS等多种浏览器,插件免费下载
支持多种格式文件的转换(pdf,dwg,jpg,tif,bmp,doc等)
支持网页中的图文打印
能够快速获取档案中的文字内容
支持文本关键字搜索
支持本地路径和网络路径超链接
支持水印、数字等多种图像加密技术
公开标准,其解码程序和部分编码程序可在网上免费获得
拥有浏览器插件,可直接在 LizardTech 公司的主页上下载
DjVu应用范围非常广泛:图书档案、古籍数字化政府单位、金融档案单据的电子化管理,加工制造业相关说明书、维修手册、图纸等的电子化,城市建设,地图等。

3产生背景

随着因特网的 逐渐普及和扫描存储设备的成本逐步降低,越来越多的文件开始以数字化的形式在网上处理、传播和保存。人们对于信息的瞬间获取需要使得电脑屏幕成为各种信息 的最佳显示媒介。然而世界上90%以上的信息仍然在纸上。大量纸质文件,包括经典印书籍、绘画、彩色图片和照片,都拥有十分珍贵的价值,而其中被发布在网 络上的却寥寥无几。
制约这些信息在网上发布的一个瓶颈就在于扫描图像的文件大小问题。现阶段,如果要保证文字和影像的清晰效果,就必须要用较高的分辨率来进行扫描,其所得文件往往十分巨大,难以在网上下载。于是,为了达到差强人意的下载速度就不得不降低分辨率,这也意味着图像质量和可辨性得不到保证。传统的网络图像格式,如JPEG、GIF和PNG等,在普通分辨率下的图像大小都十分巨大。这也使得网络内容开发者们面对现存的印刷材料宝库只能望洋兴叹
在过去数年中,人们对于有效处理彩色图像文件的技术的需求越来越强烈,而这种技术实际上就是一种有效的彩色图像的压缩技术。当人们试图建立古代或历史文献的网上数字图书馆,制作电子商务网站的网上购物索引,或进行网络出版时,这种技术就显得尤为重要。另外,低成本、高质量彩色扫描仪,以及高分辨率数码相机的出现,也为这类技术的应用提供了契机。
DjVu就是在这种背景下由美国电报电话公司实验室(AT&T Labs)于1996年开发成功的一项新的图片压缩技术。通过这项技术,几乎所有的传统印刷资料都可在网上以高速传播。
DjVu在纸质世界和比特世界之间搭起了一座桥梁。它使得高质量的扫描图像可以轻易地在因特网上进行发布。 DjVu有两大优势:
第一是可以将500M以上的高清晰杂志压缩到只有10M左右甚至更小的容量,而杂志质量丝毫不受影响。
第二是由于彻底改变了传统的互联网传输方式,在观看DjVu格式的文件时,甚至比打开普通的网页更快。

4格式转换

DjVu ---> PDF

利用Adobe Acrobat的虚拟打印机功能就可以将Djvu转化为pdf格式,如果用Djvu的ie插件的话,可以直接利用插件中的一个打印按钮(可以看见),而不是文件菜单中的打印功能,这样效果最好,选择打印,然后选择虚拟打印机pdf。注意转换以后的文件一般情况下要比Djvu要大得多,有时甚至是原来的10倍之多,但也有差不多的,关键看Djvu文件的来源。

PDF ---> DjVu

常见的方法一般是安装体积庞大的Document Express Enterprise with DjVu或者安装LizardTech公司出的专门打印程序,但不太方便。
pdf2djvugui: 是一个绿色软件,使用简单,每次只须执行文件夹bin内的pdf2djvugui这个可执行文件就可以了,其他参数可自行设置,每次可转换一个文件。但这个软件也有不足之处,就是对一些语言(包括中文)文本识别过的pdf文件转换成djvu时可能无法进行,必须选择Text Extraction为No Text Extraction。

5主要应用

DjVu 的应用非常广泛,任何扫描的高分辨率图像和数字生成的文件都可以通过DjVu的方式在网上进行发布。有了DjVu,网络内容提供商们就可以将大量宝贵的书 籍、杂志、索引、手稿、报纸和古代历史资料通过扫描而在网上发布了。原来被保存在这些物质载体上的信息,现在可以通过比特的形式被更为广泛的受众所获取 了。具体来说,DjVu的应用主要体现在以下几个方面:

商业方面

产 品照片的网上发布是一个重要用途。虽然电子商务正在逐渐普及,但网上产品的图像质量却另人难以满意。一般来说,这些产品图片不是只有邮票大小,就是要花上 几分钟来下载,而且对于局部的细节无法放大观看。DjVu则可以解决这些问题。通过分层逐步解码,图像可以很快显示出来,而且还可以利用拖动和放大功能来 观察所有细节。这些特点也非常适用于拍卖物品的图片发布。商业应用的另一个方面是公司报告的网上发布。目前,PDF格式是公司报告的一个主要发布方式。一 份60页A4大小公司报告用PDF格式来发布,其大小大概在4MB左右,而扫描之后以DjVu格式保存,其文件大小则不超过800K。此外,其他公司文 件,如技术手册、CAD绘图、财务文件、税务和邮件等,都可通过DjVu在公司内部网中保存。

教育方面

DjVu 将成为电子图书网上发行的最佳手段。即使已经有了完全电子生成的数字版本,DjVu仍然是屏幕显示的最佳选择。例如,对于页面上包括一定数量的颜色、图 片、公式、线条和其它非文字对象(如大学教材)时,DjVu的超强压缩功能将大大缩小文件的尺寸,使其在性能上优于PDF格式。对于网页设计者来说,DjVu插件的压缩界面和自动装载功能,以及和网页浏览器的完全兼容等也是可圈可点之处。另外,DjVu格式的电子书也具有文字查找功能,对于读者查找关键词也非常方便。对于学术作品的网络发布来说,DjVu也是很好的方式。目前,人们主要是将文字处理软件完 成的作品压缩,然后在网上发布。这样做的缺点在于,必须先将整个文件下载,之后才能阅读,而且一旦文件当中插有图片时,文件又大得惊人。用DjVu则可以 将数字生成或扫描生成的任何文件进行有效的压缩和快速的显示,而且不受文件内容的限制,这也是为什么越来越多的科学家、研究者和学生开始在网上利用 DjVu来发布他们作品的原因。图书馆的资料保存和文件管理也将受益于DjVu。原来以各种形态出现的文档,现在都可通过扫描压缩成DjVu格式,并在网络数据库中保存。这样一来,所有的资料都能十分逼真的转化为数字形式。读者也就可以更加便利地在网上获取一些以前很难看到的珍贵材料。

文学艺术方面

对 人类早期的手稿和印刷品进行网上发布是DjVu的“杀手锏”。迄今为止,DjVu是唯一能够将这些材料纤毫毕现地在网上发布的压缩技术。公众以前基本无法 接触到的稀有珍藏,现在都可以毫无限制地在网上传播,公众只需花几秒钟的时间就可以在自己家里的电脑屏幕上欣赏到这些珍贵的历史资料,而历史学家和研究者 们则可以对所有的色彩和细节部分进行细致的分析。除以文字为主的文献资料外,绘画作品也可通过DjVu在网上发布。虽然前文强调的是DjVu对文字边缘清 晰呈现的能力,但对色彩的压缩和还原,DjVu的表现同样出色。通过基于微波理论的连续色彩压缩技术,DjVu对绘画图像的处理要优于JPEG格式。特别对于高压缩比例的图像来说,DjVu的优势比较明显。其连续显示、放大和移动功能也使用户的读图体验超越传统。而且,与文字资料不同的是,绘画图像的压缩显示没有前景和背景的分层,因此整幅图下载起来更为流畅。

行政司法方面

地 图和土地登记文件可以通过DjVu在网上发布。由于地图对图例标记的清晰度要求极高,用传统的图像压缩技术很难将地图以高分辨率在网上发布。人们目前在网 上能看到的JPEG格式的地图,要么根本看不清上面的文字和标记,要么就需要花很长的时间来下载,对电脑内存的要求也很高。通过DjVu,则可以轻松地将 地图和各种土地登记文件在网上传播。
例如,美国国会图书馆的一张1915年出版的黄石国家公园的 地图,原始文件为5900x6900 像素,大小为121MB,用DjVu压缩后只有450KB,在当前任何一台电脑上都可以毫不费力地清晰显示。而用JPEG格式压缩的文件则有2.1MB大 小,如果没有十分充裕的内存空间,是无法自如显示的。另外,许多法律文件,如各种法庭记录(口供书、判决书等)、不动产记录(房屋平面图、买卖合同、抵押证书等)以及税收记录等,都可以通过DjVu方便地在网上保存和发布,有利于提高文件管理效率和司法透明度。例如,佐治亚州科布县克拉克最高法院就通过DjVu将所有的司法文件在网上进行发布,用户可以通过各种标准对文件进行搜索。

6产品意义

DjVu,作为一种新的彩色文件压缩技术,在纸质世界和比特世界之间搭起了一座桥梁。它使得高质量的扫描图像可以轻易地在因特网上进行发布。专门针对网络发行而设计的DjVu技术,以其友好的用户界面和网络功能博得了越来越多的商业和非商业用户的垂青,其应用将会使方兴未艾的网络传播进入一个新的阶段。

使原有的网上图片传播更加便捷

随着读图时代的到来,网上图片传播的地位将越来越高。原来以JPEG、GIF和PNG等格式在网上发布的图片,不论是图像质量还是下载时间,都难以令人满意。DjVu以其科学有效的压缩模式,使网上图片传播的硬件和带宽瓶颈得以突破。普通网民可以在普通的计算机上方便快速地进行图片浏览和发布。

使原来无法上网的资料能够在网上发布

当 人类网络传播逐步由初期的硬件建设发展为一种文化产业,网上内容的开发和建设成为当务之急。除了直接以数字方式进行网上内容生产(如直接在电脑上用字处理 软件和图像制作软件进行生产)之外,一个资源最丰富的渠道就是将人类传统的纸质信息转化成数字信息而在网上发布,也就是将人类的文化遗产数字化。要成功地 实现这一转化,除了扫描技术之外,还必须要有高效的图像压缩技术。DjVu技术就是解决这一问题的关键。它可以将以前由于扫描文件大小原因而难以在网上发 布的资料轻易地搬上因特网,从而使人类宝贵的知识遗产能够得到更为广泛的传播。

有利于推进电子商务和电子政务的发展

消 费者在网上无法得到全方位的产品外观,并对其细节进行研究,是制约电子商务发展的因素之一。DjVu技术的出现,使得产品图片的发布轻而易举,而且成本低 廉,为电子商务的发展消除了这方面的障碍。对于电子政务来说,政府可以通过DjVu技术方便地将各种文件在网上存档和发布,不仅可以提高行政管理效率,也 有利于保护公众的知情权。


词条标签:
软件 , 计算机术语 , 网站

djvu转pdf方法

 Djvu 是一种用于保存图书的文件格式,和Acrobat PDF有相似之处。它的原理是把图像分离成前景层和背景层进行压缩。

因为看影印古籍的缘故,不少书现在都是用的.djvu的影印扫描件,这对于习惯了用PDF人,阅读还是觉得不怎么方便,于是就想办法把djvu转化成pdf文件,下面我们一起来做吧。

 

工具/原料

  •  Adobe Acrobat Professional

  •  windjview

方法/步骤

  1.  准备工作:

            1、安装Adobe Acrobat Professional(我安装的是XI版本,在打印机和传真里,多了一个虚拟打印机“Adobe PDF”,这个是主角);

            2、windjview(用来打开后缀是.djvu的文件,下载地址网上很多,很小的一个软件,只有500K左右)。

  2.          其实原理很简单,就是利用Adobe Acrobat Professional超级无敌打印功能来转换,这个功能,使得只要是窗口上有打印选项的文件,全部能无条件转成PDF的。

  3.  开始工作:

    1、用windjview打开文件

  4.  然后选择菜单-->打印,打印机选择“Adobe PDF”,设置好相关纸型、居中布局等,如下图

  5.  点右上角的 “属性“,将“Adobe PDF设置”中的“默认设置”改为“高质量打印”(这个文档会比较大)当然可以选择其他的

  6.  确认—打印,就开始自动转PDF了

  7.  因为选择的是“高质量打印”,转换之后,PDF文件会比较大,我10M的文件打印完事23M了。

    但是PDF放大后,影印件的细节部分质量还是相当不错的,比较适合那种纯影印的小东西,估计如果单纯是转换黑色的印刷字体,就没必要这么弄了,普通质量就足够看了。

    END

djvu转pdf方法2

DjVuToy(djvu转pdf)是一款功能强大的处理DjVu的工具集。

DjVuToy是一款强大的专门处理djvu的软件,他可以将分散的 djvu文件合并为一个多页的文件,你也可以反过来将之拆散,你还可以自由的调整一个多页的djvu文件,包括插入、删除、移动、旋转等功能。

功能:
 

文件合并:将散页DjVu文件合并成一个多页DjVu。
文件拆分:将多页DjVu拆分成每页一个文件。
页面调整:插入、删除、移动、旋转多页DjVu中的页面。
生成索引:为文件夹下的散页DjVu文件生成索引文件,打开索引文件即可浏览全部散页文件,就像将散页文件合并成了多页文件一样。但是与多页文件不同,索引文件不能挂书签。
PDG转DjVu:这个不用说了吧?
PDG压缩:对清晰版进行无损压缩,或将清晰版压缩成快速版,或将黑白TIFF转换成PDG。
DjVu书签处理:包括导出书签、加挂书签(支持多级书签)、将中美百万的a.opf、catalog.xml转换成FreePic2Pdf接口文件。
DjVu页宽设置:将多页DjVu的页面宽度或DPI设置为一个统一值。
转为图像:将多页DjVu的每一页转换成一个图像。
DjVu文本处理:包括OCR(生成可检索的隐藏文本)、导出纯文本、导出XML文本、导入XML文本、删除文本。
DjVu转PDF:一次将整本DjVu转换成PDF,并可以选择是否转换书签(目录)。
查看DjVu文件结构:导出DjVu文件结构。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多