分享

各类电子书及其格式转换软件集合(txt、html、exe、chm、pdf、doc、pdc、prc、clf)

 st清霜 2010-10-06
各类电子书及其格式转换软件集合(txt、html、exe、chm、pdf、doc、pdc、prc、clf)
 
首先来介绍一下我们目前在网络上能找到的电子书的各种格式吧。

1.TXT
我个人觉得这个格式是电子书的最好的格式,不管你使用什么样看电子
书的硬件,拥有这个格式的电子书都是最容易转换的,我转换的终极目标
就是想把各种电子书转换成为TXT的文本文件。当然,很多人也许喜欢网
页那样可以有一个目录的格式,看个人习惯了。

2.HTML
这个格式是在网上看得最多的格式,超链接的模式让每本书分章分节看
起来很舒服,要看第几章到目录去点点就可以了,在PPC上面可以直接用
IE打开,我猜测PPC用户应该不会讨厌这种格式。可是在PALM的用户面
前,这么多年都没有完美支持这种格式的软件,PALM用户只能使用各种不
同的路子来将他进行转换,或者和我一样直接把它转换成为TXT。最近我
试用Webpro的时候发现这个软件可以打开HTML文件,其中的图形连接什
么都还可以用,但是对于PALM来说太过巨大的这个软件加上他速度的超
慢,我最后还是把它删掉了。

3.EXE
也算是常见的电子书格式,一般是作为版权的需要将电子书做成这种不
方便编辑的格式,不过在很多电子书的网站,你只能找得到这种格式。这
种电子书在PC上面可以直接阅读,在手持设备上就无能为力了。(我好像
听说PPC上面有软件可以直接阅读EXE和CHM,希望清楚的高手给予说明)

4.CHM
HTML帮助文件格式,似乎是偶然的某一天有人发现这种格式很适合拿
来做电子书,但它和EXE文件一样讨厌,同样不方便进行编辑,因此在很
多电子书网站也可以看到这种格式。这种格式在PC上面也是可以直接阅读
的。

5.PDF
ADOBE公司的ADOBEACROBATREADER使用的专门的格式,因为安
全性强,内容不能被编辑,而且大多数格式转换到PDF都很方便,所以成
为网络上官方发布文档的最喜欢的格式,见得比较多的是一些说明书,有
一段时间网络上面很多电脑学习类书籍都是使用PDF文件格式的。这种格
式图文混排效果很好,在阅览器里面阅读就如同看一本书,可是想要完美
转换图文到其他格式都相当困难,一直都没有见到比较好的工具。其格式
英文书籍的在PALM上面可以用专门软件转换后阅读,目前还不支持中文书
籍。PDF文档最大的缺点就是文件很大,一本书在TXT格式下面可能只要
几百K,成为这种格式,随便就上兆了。

6.DOC
MicrosoftWORD的专有格式,当然是要用WORD打开了,相兼容的什
么WPS,OPENOFFICE应该也能打开,只不过排版或者字体上可能会有些
出入。DOC可以很容易转换成HTML和TXT,顶多就是丢失一些格式的信
息,也算是比较开放的了。

7.PDB/PRC
这两个就是PDA专用的格式了,主要是PALM先使用的,后来PPC通过相
关软件也支持了这种格式的电子书。

8.CLF
这个格式问得不多,但是还是有人问,就在这里简单说说。这个是
LISTPRO这个软件的专有格式,由于在PALM,PPC和PC上面都有这个软
件,因此只要大家在自己机器上安装这个软件就可以阅读了。至于这个格
式的转换,应该是能够做到的,但我不熟悉,之后完善。

9.其他
一些特别的格式,如超星电子图书馆的电子书,方正阅览器的电子书,
XREADER等等,这几种格式目前只能使用提供的专门阅读器,也无法转换
成为其他方便编辑的格式。(在写这些期间,发现有软件名曰UnEBook,
可以转换XREADER的EBX格式成为HTML,我试用一下效果很好,又一个
格式被征服了:)

其中,XREADER的文件后缀一般是EBX,也有把阅读器直接打包在一起
成为EXE文件的,文件大小略大于EBX格式。其阅读器下载地点如下:
http://www./soft/11659.html

超星电子图书馆的书籍后缀一般是PDG,阅读器下载地点如下:
http://www./download/

方正电子书后缀是CEB,阅读器下载地点:
http://www./soft/5531.html


在这里补充一点,在写该文期间,了解了一些PPC的内容,目前TXT,
PDB,PRC,HTML,CHM,DOC等格式都可以完美阅读,PDF暂时还不完
美,而PALM对HTML,CHM,PDF基本上无能为力(这里有人会提到一个
软件REPLIGO,稍后提到),对于DOC现在有DOCUMENTTOGO可以支
持了,可是总觉得支持的比较勉强。

好,现在我来谈谈怎么把格式都转换成为TXT吧。

首先,CHM和EXE先算做一类,这两种格式在之前有一些“E书伴侣”
“ChmDecompiler”类型的软件,可以转换成为TXT或者HTML,但是这些
软件仅仅对某种软件制作的EXE敏感,对用其他软件制作的EXE,就解不出
来了。或者看到某种格式就要用某个软件来转,实在是麻烦。不过这些问
题都已经是过去时了,TOMPDA的GMX老大,写出了TL-PDB这个软件,这
个软件支持几乎所有的EXE和CHM格式文件(除了上文提到的XREADER格
式做成的EXE包),他截取的方法和其他直接转换的不同,但是有效,运
行了TL-PDB之后,打开一个CHM或者EXE,就可以看到每个页面的上部就
出现了CLIPTOTL-PDB,在它前面的那个框里面打勾,这个页面里面的所
有文字都自动记录到TL-PDB的界面去了,然后另存为PDB或者TXT随便你
了。使用这个软件,基本上CHM和EXE文档就不成为问题了,不过每个页
面都要打一次勾,如果这本书的页面很多,就有的忙了。不过有得必有
失,能统统搞定,麻烦一点也是值得的。


PDF,说实话,我很不喜欢这种格式,文件极其巨大,对于我翟画带用
户,实在是苦大仇深;文件保护的比较好,试用了不少PDF转换的软件,
都没有一个满意的,要么丢失图片,要么不支持中文。倒是我很久以前用
过的叫做PDF2HTML和PDF2TXT的软件,前者是WINDOWS下的程序,需
要注册,未注册只能转换5页,可是生成的文件极其巨大,但是转换成
HTML的效果倒是还不错;后者是DOS下的,有特殊的命令,对存储的路
径都不能指定,但是速度很快,如果你只想要文本,还是很合适的。

HTML,这个在PPC和PC上面阅读都不成问题,可是到PALM上面就难受
了,一种方法是用HANDSTORY的PC端来转换,在右键菜单中选择CLIP
TOPALM,然后打开PALMDESKTOP同步才行;另一种方法就是用软件
(TL-PDB也有这个功能)把HTML转换成为TXT。对于后面的方法,有两
个软件可以推荐,一个是DREAMEDIT,另外一个是看书的软件
READBOOK,两个都可以批量转换合并HTML成为TXT,不过前者在转换
多个HTML并且合并的时候会有时候报错并且退出,当然不排除我手头软件
版本问题;后者在繁体简体之间的转换和保存存在一些问题,某些时候会
存盘存成乱码。

到重头戏了,就是现在PDA上面最流行的格式PDB/PRC了。这个是
PALM的文件格式单一造成的,在PC上面都是后缀为PDB的,由于生成的软
件不同,在PALM上面需要不同的软件来阅读。

PALM上有这几种类型的电子书,类型可以在LOOKPDB或者TL-PDB里
面看得到,或者在PALM的资源管理器类软件中查看TYPE:

1.TEXT,电子书的通用格式PALMDOC,注意这个格式不是WORD使用的
那个DOC,这格式的电子书所有的电子书软件都可以很好的阅读;用任何
一个PC端的阅读PDB的软件比如说W***EPDB,DOCREADER,
LOOKPDB,当然还有TL-PDB都能够阅读或者转换成功。

2.ZTXT,这是一种压缩格式,文件大小比标准的DOC小,只有少数软件如
TIBRPRO等支持阅读,如果你使用的机器内存比较小又不能扩展存储卡,
节省一点是一点阿。将这种格式的电子书转成TXT可以使用TL-PDB打开然
后另存为TXT就可以了;

3.CLIP,这是HANDSTORY的专门格式,只能在HANDSTORY里面阅读,
使用HANDSTORY桌面端转换。TL-PDB许诺在下个版本提供对他的支持,
目前在PC端还没有比较好的阅读方法,但是在最近找到一个很好的软件:
dehsib.exe,这个软件只能在DOS下面运行,将它和要转换的CLIP文件一起
放到一个目录下,然后用DOS方式进入这个目录,运行“dehsibxx.pdb
(xx指的是要转换的文件名,最好用英文文件名,否则不方便转换)”,它
可以把HANDSTORY的文档转换成为HTML,而且链接等显示都很正常,也
可以保存为TXT。我手头CLIP格式不多,但是转换都很快并且效果很好,
推荐。

4.TOGO,这是ISILO才能阅读的专有文件格式,由ISILO的桌面端ISILOX
转换得来,在PPC和PALM上面都有ISILO可以阅读,PC上面有ISILOFOR
PC,可以打开这种PDB,并且可以另存为TXT,但是在点里面的链接的时
候经常会报错退出,TL-PDB也许诺在下个版本支持,拭目以待。

至于PPC对这几种格式是否完全支持,由于PPC上有HANDSTORY和
ISILO,我想除了ZTXT,其他的格式应该都可以支持。


至此为止,绝大部分我们会遇到的电子书的处理办法都在这里了。大家
花费几分钟时间看看,可以解决大多数问题。这样大家也不用每次在那里
问:这种文档怎么打开?那个格式怎么在PC上面看?自己搞定就行了。
 
 
============================================================

 

  为了方便操作,我们在进行转换之前,最好把待转换的电子书,放到一个路径不是很深的文件夹内。

  1 HTM(HTML)转TXT

  点此下载(常用软件1)

      点此下载(常用软件2 推荐)

  2 CHM转TXT

  所需软件:CHM Encoder

  说明:启动软件,单击“打开”按钮,找到需要转换的CHM文件;选择一个输出文件夹,然后单击“开始”按钮,即可得到反编译后的HTM文件。接下来执行上面讲过的HTM(HTML)转TXT的步骤,即可得到TXT文件。

  点此下载

  

  3 PDF转TXT

  所需软件:PDF Text Converter

  说明:启动软件后,先在左上方的浏览器窗口内找到PDF文件所在的文件夹,此时左下方的文件列表窗口中会显示出该文件夹中的PDF文件,选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换。转换好的TXT文件保存在源文件所在文件夹内。

  点此下载

  4 JAR转TXT

  所需软件:WinRAR

  说明:只要你的电脑上安装了WinRAR,即可右击JAR文件,直接将其解压缩。此时你需要做的,就是将这些没有扩展名的文件加上TXT的扩展名并合并(快捷的方法下面会有介绍)。

  点此下载

        5 UMD转TXT

  所需软件:XBookMaker

  说明:启动软件后,单击左上方的“Open folder”按钮,定位到包含UMD电子书的文件夹,此时会在左边的的“Files”窗口列出该文件夹内包含的所有UMD格式的电子书,点击一个UMD 文件,左下方的“Chapters”窗口中即会显示该电子书中所包含的章节。单击任意一个章节,即可在右边的窗口中看到该章节的内容。现在你只需将其复制并将其粘贴到记事本中,保存为TXT即可。

  点此下载

  6 EXE转TXT

  所需软件:miniKillEBook

  说明:先打开想要转换的EXE电子书,再启动miniKillEBook,勾选“以文本方式保存”复选框,拖动图中的图标到电子书窗口中。单击“开始”按钮,软件即会自动将电子书“逐页翻过”并将每一页的内容存为TXT文本。

      点此下载


 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多