分享

pdf使用了cjk字符,读取时乱码。(解决方法)

 xdd响当当 2011-06-29

pdf使用了cjk字符,读取时乱码。(解决方法)

    一个pdf文档,用Adobe Reader(高版本也试过)打开后提示如下:

    “您的pdf文档使用了cjk字符。您必需在您的foxit应用程序文件夹安装fpdfcjk.bin文件,否则某些cjk字符将不能正确被显示。您可以从www./pdf/rd_intro.php下载该文件。”

    点击确定后,你会看到,这个pdf文档里的内容大部分都是乱码,无法阅读。

    现在来看看为什么会出现这样的问题:cjk是Chinese, Japanese & Korean的缩写,这样看来,pdf文档里包含了中国、日本、韩国三个国家的文字,而Adobe Reader里没有相应的显示这些文字的字体。所以显示出来的都是乱码。

    看到上面的提示,我们可以去那个网站下载相应的软件或文件安装来解决。就下载Foxit Reader(现在出的是3.0版的),FREE VIEWER版的就行。下载后安装,后用foxit reader打开这个pdf文档,这时软件会提示需要安装一个插件(就是显示cjk字符的),点击下载后自动安装,完成后,你就可以看这个pdf文档了。

 

cjk相关知识:

    CJK:中日韩统一表意文字(CJK Unified Ideographs),目的是要把分别来自中文、日文、韩文、越文中,本质、意义相同、形状一样或稍异的表意文字(主要为汉字,但也有仿汉字如日本国字、韩国独有汉字、越南的喃字)于ISO 10646及Unicode标准内赋予相同编码。
  《CJK统一汉字编码字符集》— 国家标准 GB13000.1 是完全等同于国际标准《通用多八位编码字符集 (UCS)》 ISO 10646.1。《GB13000.1》中最重要的也经常被采用的是其双字节形式的基本多文种平面。在这65536个码位的空间中,定义了几乎所有国家或地区的语言文字和符号。其中从0x4E00到 0x9FA5 的连续区域包含了 20902 个来自中国(包括台湾)、日本、韩国的汉字,称为 CJK (Chinese Japanese Korean) 汉字。CJK 是《GB2312-80》、《BIG5》等字符集的超集。
  CJK 简介
  CJK 是 Werner Lemberg 的出色工作。CJK 是中文(Chinese)、日文(Japanese)、韩文(Korean)三国文字的缩写。顾名思义,它能够支持这三种文字。实际上,CJK 能够支持在 LaTeX 中使用包括中文、日文、韩文在内的多种亚洲双字节文字。
  与国内较为普遍使用的中文 LaTeX 扩展 CCT 相比较,CJK 与 LaTeX 结合得更为紧密。LaTeX 输出的 DVI 文件就是标准的 DVI 文件,可以直接浏览而无须象 CCT 那样要先用 patchdvi 进行预处理。(CCT 是在 emTeX 上开发的,和 emTeX 结合的较好,但由于 emTeX 版本较老,无法使用一些 TeX 和 LaTeX 的新功能,如用 pdfTeX、pdfLaTeX 生成 PDF 文件,以及用 LaTeX2Html 将中文 LaTeX 文件转换为 HTML 文件)
  CJK 作为一个 LaTeX2e 宏包,其对字体的定义遵照 NFSS(新字体选择框架)。这样就无须对 DVI 文件做特殊的处理就可以直接在任何 DVI Viewer 中预览和打印,也可直接用 dvips 等工具进行转换。CJK 可以自定义多种字体,可以使用多种字库,包括 TrueType 字库、Type1 字库等。由于使用的是轮廓字库,因而 CJK 生成的 PS 文件和 PDF 文件效果要好于 CCT。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多