分享

有什么好的软件能把PDG格式的转成PDF格式的?

 M.T 2011-07-17
你是下载超星的书籍吧,只有下载那种转换软件才可以,你可以上网搜索,不过现在超星加强了控制。不知道以下内容对你有帮助不?
超星图书让人既爱又恨。近来,我一直在琢磨转化超星图书的事儿。在网上看了很多方法,自己也尝试了很多方法,有了一些体会,写出来与大家一起分享,并希望能对大家有帮助。需要说明的是,这只是我的一些经验,以实用为主,并不专业。
为什么要转换呢?
当然要转!原因很明显。首先,超星的书超级好!其次,超星公司的服务超级差。他们很不厚道,搞了太多的限制。不买卡不让检索;买了卡,还是有很多图书不让下载;勉强下载了换台机器又不能看了,并且他们还搞打印限制!(最近他们又在限制虚拟打印,想法很奇特,天下头一份!)另外,超星阅览器非常垃圾,翻几页之后CPU的使用经常达到100%,下载任务稍微一多就会死掉,更主要的是它只能在windows环境下使用,在其他的环境下,比如linux,根本不能用!(超星阅览器的代替品BooX Viewer,虽然在linux下可以使用,但是它支持的超星格式实在有限!)总之,超星有很多好东西,但是他本身很垃圾,所以我们要取其精华,弃其糟粕,就是要转!
转化成什么格式呢?
我们的原则是转化生成文件的性价比要高。其中“性”是指生成的图书文件文字要清晰,并且阅读要方便,没有那么多的限制;“价”主要是指转换速度要快。一年就转一本书,要疯?!djvu格式是近来网上比较流行的图片格式,它用特殊的技术使图像高压缩而不失真(这个技术将图像分为背景层<纸的纹理和图片>和前景层<文本和线条>,用高分辨率来还原文字,用较低的分辨率来压缩背景图片,从而使整个图像在保证质量的同时尽可能的减小体积)。所以djvu格式是我们转换的首选。遗憾的是,一般的,pdg转化为djvu所需的时间比较长。pdf格式自不用说了,它是Adobe公司推出的图片格式。它虽然没有一统江湖,但至少也是目前这方面的老大!(听说微软的Vista要推出一种新的格式metro来取代pdf,不知道现在怎么样了,希望这次比尔大叔会做的好一些。)但是pdf文件的体积会大一些,我个人感觉清晰度也不如djvu,然而由于它的转换速度快,并且有Adobe公司给我们撑腰,所以pdf也是我们不错的选择。另外,由于mdi格式的转化速度超快,可以在windows下用强大的Microsoft Office自带工具观看,所以也有人转化成这个。其他的,比如jpeg、bmp图像,因为它们要么不清晰,要么体积超大,再不就是阅读不方便,所以很少人会选择这些。有没有更好的图书格式呢?我就不清楚了,真诚盼望各位大虾的教诲。 (? D s5JB
怎么转化呢?
转化的方法非常多,但在我看来,超星图书的转化的第一步还是以虚拟打印或者抓图为主(尤其是虚拟打印技术,这是一种简单而实用的转化方法,很值得着重介绍一下)。然后结合其他的方法转化为djvu或者pdf。其他的,如果没有特殊的要求而用OCR文字识别技术,无疑是一个很疯狂的想法!(为什么?用用就知道了。)另外,BooX Viewer只能打开一些00H、02H什么的,对于目前流行的66H毫无办法,所以我们一般不用它转化。网上有些高人也曾经设计了一些其他转化软件,那都是好人阿!我举双手赞成!!但是,实事求是的讲这些工具的转化效果并不怎么好,而且运行不太稳定。
Ⅰ.抓图
抓图工具我只用过SnagIt。SnagIt结合按键精灵转化效果还是不错的,只是转化速度太慢。本论坛的Kingsnow曾经介绍过。首先把超星阅览器窗口的缩放调为50%(这样可以使抓取的图像更清晰一些。当然也可以调节为“整高”,但是这样抓取得图像不清晰。)打开SnagIt,在“输入”中选择“滚动”、“自定义滚动”(抓图的时候上面有说明的,很傻瓜,容易学会)。对“过滤”进行重新设置:对于单色图书在“颜色深度”选择“单色”或者“灰度”,以减小生成文件的体积;在“图像分辨率”中设置一个比较大的分辨率,比如300或者更高,以提高图像的清晰度。在“输入”、“属性”中,把图像格式设为tif(都说这个好,不知道为什么。实际效果也确实不错)。很多网站都提供按键精灵下载,比如http://soft./SoftView/SoftView_6853.htm。打开按键精灵,单击“增加”按钮,编辑一个合适的脚本(对于这个我很不在行阿,所以我编的脚本很不好用,就不多说了)。或者选择“录制”按钮,录制鼠标动作,这个很简单,比较适合像我一样喜欢省事儿的同志!这时候SnagIt和超星阅览器可能会有热键冲突,只要在SnagIt“工具”、“程序参数设置”、“热键”中更改热键就行了。接下来开始抓图,保存图像,为下面的转换工作做准备。这个转换方法生成的图像比较清晰,但是转换速度极慢,转换一页图书至少需要10秒钟。对于少量图书可以选择这种方法,但对于稍大量的图书用这种方法就很不划算了。比如我有10多G的图书,所以我在正式转换的时候没有使用这种方法。另外,这种方法还适合将只允许在线阅读的图书抓图。 |Ⅱ.虚拟打印
虚拟打印的工具有很多,比如Adobe Acrobat自带的虚拟打印机Adobe Pdf、Microsoft Office自带的打印机Document Image Writer、djvu虚拟打印机LizardTech Virtual Printer、DocConvert、pdfFactory、FinePrint等等。另外,伟大的抓图工具SnagIt、新版的腾讯QQ都具有虚拟打印功能。虽然虚拟打印机转换文件不够专业,但是它足够简单,非常实用。对于一般用户来说完全够用了! [, J ]m
谈到虚拟打印,需要多说一点。超星阅览器的3.9版对打印进行了限制,即限制了每月最多能打印的数量。但是3.9也增加了一些非常有用的功能,比如预估打印多余的部分不进行打印功能,也就是说在打印前你输入的要打印的页数大于实际页数,打印出来的就是实际页数。比如有一本超星图书总共有60页,用超星阅览器3.9打开,从第一页开始打印,在“打印页数”中输入100,而打印出的实际页数为60,多出的40页不被打印。3.8版的超星阅览器没有此功能,如果输入要打印的页数大于实际页数,它将重复打印最后一页。所以用3.8 打印时需要准确无误的数出总页数,很麻烦。但是3.8没有打印限制。所以我们要取二者的长处,而避免它们的短处。网上也有一些破解3.9打印限制的方法,比如重写ssreader.ul文件或者把它设为只读属性等等,但是这些破解方法都不太理想。后来在网上看了一篇文章,深受启发(http://www./viewarticle.php?id=124188)。它完美的结合了3.8与3.9二者的优点,而避免了它们的缺点。做法是先安装3.8,然后将安装目录中的全部文件剪切出来,然后再安装3.9的,把3.9目录下的文件直接删除,之后把导出去的3.8的文件再剪切回来,这样就能打印出实际页数了,也消除了打印限制。能出现这个结果的原因,我估计是由于没有完全卸载3.9,所以它在注册表或者系统文件夹中留下了痕迹。无论如何,这都是一个非常实用的方法。
介绍几种虚拟打印方法:
①LizardTech Virtual Printer   工具设置 书名 大小 页数 转化时间 转化一页的时间 j]3zP R:[t
默认设置 微精神分析学 13.9M 397 3'46" 0.57" ,
默认设置 精神病学(第二版) 66.8M 938 10'24" 1.05"
⑤DocConvert文档转换工具 )
DocConvert也是一款非常优秀的虚拟打印工具。超星对它没有限制。它不但可以把文件虚拟打印成pdf格式,而且还可以打印成tiff格式。用DocConvert打印pdf并没有优势,但是用它打印成的tiff,与同类软件相比效果较好,转化速度非常快。根据pdg—>tiff—>djvu的转化路线,得到一个清晰的tiff文件是非常重要的一步。在打印tiff时需要进行设置,以保证较高的清晰度和较小的体积。我在多次对比之后,认为这样设置比较好:在“图片文档设置”选项卡中的“Tiff文档图片”一项中选择“2色(黑/白)2维G4传真编码”第二个,在“设置”中将“分辨率”设为1200dpi,其他各项保持默认设置即可。我同时发现用DocConvert打印成pdf文件时,无论如何设置,生成文件的效果都一样!! 7) p`cb 4
Ⅲ. 第二步转化
①workflow manager
用上面提到的方法转化之后,有的就转化完毕,有的需要进一步处理。比如要把pdg转化成djvu,在pdg文件虚拟打印成pdf或者tiff等之后,必需进行第二步转化,这时候常常需要用到workflow manager。
安装Document Express Enterprise5.1.0后会有一个程序workflow manager。workflow manager是专业制作djvu的软件。它的功能非常强大,它可以把pdf、jpeg、bmp、gif、tiff等格式的文件转化为djvu。它使用起来也很方便。打开workflow manager,在右侧的窗口中首先选择“workflow”选项卡,一般的,在“Raster Profile”中选择scaned(600dpi)或者直接用默认设置,如果要将pdf转化为djvu,可在“PDF Profile”中选择highest quality一项,可保证较高的清晰度,但生成的文件体积较大;在“Input”选项卡中点击“choose files”,选择要转化的文件;在“Output” 选项卡中点击“choose folder”,选择生成文件的保存路径。设置完毕之后,在左侧的窗口中选择“job”菜单,点击“start all jobs”或者直接按F5键开始转化。此时在右侧的“log”中可以看到转化的进度。另外,Document Express Enterprise5.1.0作为专业制作djvu文件的软件,应该有很多很精细的设置,但是我至今没有学会,恳请各位大虾多多指教!
②多线程转化
虽然workflow manager是一个非常优秀制作djvu的软件。但是它的转化速度太慢,漫长的等待实在令人难以忍受。在网上看了一些文章以后,觉得很不错。其做法是在windows的命令提示符下,用多线程进行转化。在任务管理器中可以看到,把别的文件转化为djvu格式时,其实只有documenttodjvu或者pdftodjvu等进程(转化的文件格式不同,调用的进程也不一样)在活动。所以我们可以在命令提示符下直接调用相应的进程进行转化,这样可以避免在纯windows下的各种干扰。更重要的是,在命令提示符下面一次打开多个线程,实现多线程同时工作,大大提高了工作效率(而在单纯windows下转化一次只能打开一个进程)。我们可以编写一个脚本实现这个想法。由于本人的电脑水平实在有限,想不出更好的脚本,这里在网上下载了一个脚本并稍加改动:
@=
move d:\书\*.tiff d:\djvu\
d: +j ixq
cd d:\djvu\
For /L %%a in (1,1,192) do documenttodjvu %%a.tiff %%a.djvu k
move d:\djvu\*.djvu d:\书\
具体操作如下: @HM NNFZX(
安装Document Express Enterprise5.1.0,并在D盘新建2个文件夹“书”和“djvu”。超星图书《三国志故事选译》共192页,用合适的虚拟打印工具把它转化为tiff格式(这样的工具很多,一搜一大堆),共192页,全部放在d:\书。在Document Express Enterprise5.1.0的安装目录中有一个bin文件夹,把其中的文件documenttodjvu复制到d:\djvu。根据上面的内容在d:\djvu中建立脚本文件djvu.bat。双击运行djvu.bat,稍等片刻,“d:\书”中tiff文件是不是都转换成djvu文件了! 另外,如果一本超星图书只转化成了一个大文件(大多数情况下是这样的),那么只要把生成的文件、documenttodjvu、脚本放在同一个文件夹中,然后在脚本中写一条语句就可以了:“documenttodjvu 书名.tiff 书名.djvu”。可以多建几个这样的文件夹,在各个文件夹中同时运行脚本,让几本书同时转换,成倍的提高转化效率。理论上,当我们打开n个线程时,转化时间就缩短为原来的1/n;而实际上转化的工作效率受电脑配置的限制。比如我的电脑配置较低(CPU赛扬1.70,内存256M DDR),当同时运行3个线程时,所用时间比依次转化3个文件所用时间还要长!没有银子升级,很无奈啊! ③关于tiff的转化 )
pdg—>tiff—>djvu的转化路线号称是pdg转化为djvu的正途。把pdg转化为tiff的工具也很多,比如前面提到的虚拟打印工具Document Image Writer、 DocConvert、 FinePrint以及SK虚拟打印机、SmartPrinter等等,其中不乏优秀的转化工具。我们可以先用虚拟打印工具把pdg转化为tiff,然后用workflow manager把tiff转化为djvu。然而若要得到较清晰的tiff文件,所生成文件的体积非常大。要在我的破电脑上把这么大的tiff文件转化成djvu,要经过漫长的等待,那实在是一件很痛苦的事!所以我只是尝试了几次这种转化方式,并没有大批量的转换。尝试转化结果如下: 2[<'YQ$E
pdg——>tiff
转化工具:DocConvert;工具设置:2色(黑/白)2维G4传真编码,1200dpi
书名 页数 转化时间 转化一页的时间
精神病学(第二版) 938 5'05" 0.325"
脑的十年-由科学研究求答案 60 25" 0.42"
tiff——>djvu !
转化工具:workflow manager;工具设置:scaned(600dpi)
书名 页数 转化时间 转化一页的时间
精神病学(第二版).tiff 938 80'1" 5.12"
脑的十年-由科学研究求答案.tiff 60 4'31" 4.52"

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多