分享

LaTex与word文件的相互转换

 优优的爸 2018-06-07


 word与LaTex概述 


word是众所周知的排版软件之一,其最大的特点是“所见即所得”,因其方便、易于操作而拥有大量的用户。而LaTex 是一种基于TeX 的排版系统,从严格意义上讲并不是一种软件,而是一类格式化排版程序,是在TeX 语言上发展起来的一种更加方便、强大的宏命令包,通过排版程序对LaTex 源文件(.TeX或者.ctx)进行处理并将结果传到输出设备,其最大优点是开源和高质量的输出(常见输出格式为PDF文件)。虽然TeX 系统是目前公认的数学公式排得最好的系统,但其排版命令繁琐,源文件可读性差,用户不易掌握。这两种排版系统各有千秋,而在排版高质量科技书籍或论文,尤其是含有大量数学公式的科技论文方面,LaTex 更受到科技学者的青睐。国际上许多著名出版机构也都推荐或要求使用LaTex 投稿,例如荷兰爱思唯尔公司、德国施普林格公司等。


 Tex2word与word2Tex软件简介 


 Tex2word 

Tex2word软件可以将TeX/LaTex 文件转化为word文件。LaTex 源文件是ASCII码的文本文件,本身并不能像word一样实现“所见即所得”,需要运行程序编译成PDF文件,才能显示如同word一般的排版效果。也有人尝试利用PDF 转word 的软件(如PDF2word)将LaTex 源文件生成的PDF文件转换为word文件,但由于PDF格式与word格式解码不同,所以对于科技论文尤其是数学类论文,转换效果都不理想,即使可以转换一部分文本,也会丢失所有数学公式,出现大量乱码,排版混乱。那么,最可行的途径还是直接由LaTex源文件转换成word文件,而Tex2word恰好是目前LaTex源文件转换成word文件的最好软件。


 word2Tex 

word2Tex 软件可以将word 文件转化为TeX/LaTex文件。即使没有学习过LaTex 也可以编写LaTex格式文章,作者可以先用word撰写论文及书籍,使用word 自带公式编辑器或MathType编辑器编写公式,插入图形或建立表格,再通过word2Tex软件将其转换成LaTex文件,而不需要重新输入LaTex 命令来编写数学公式。转换后只需做一些命令的调整,就可以编译生成与原word内容基本一致的PDF文件。


 Tex2word软件的使用及转换效果 


 安装及使用说明 

(1)操作系统必须是Windows XP SP2及以上;已安装Microsoft word/Office(32位);如果版本低于word/Office2007,则必须安装MathType数学公式编辑器4.0以上;硬盘空间不小于100M。

(2)下载并按提示安装Tex2word软件(官网地址http://www./products/Tex2word/Tex2word/)。

(3)运行Microsoft word,点击“文件”→“打开”→“文件类型”下拉菜单中选择“TeX”格式。

(4)选择待转换LaTex源文件,点击“打开”,跳出对话框选择“是”,出现转换界面,点击“ok”,另存为“.doc”文件,即可得到转换后的word文件。

注:即使电脑上未安装LaTex相关软件,也可以进行以上转换操作。更方便地,可以直接右键点击待转换LaTex 源文件,选择“打开方式”为“Microsoft word”,点击“确定”即可转换LaTex为word文件。如果LaTex 源文件的后缀名是“.ctx”,则只需将后缀名改为“.TeX”,再进行如上步骤。


 转换效果 

衡量LaTex转换成word是否成功的关键在于,其转换后的文件内容是否可以跟源文件编译的PDF文件内容保持高度一致。而事实证明,Tex2word能转换LaTex中的绝大部分中英文文本,而不出现乱码,且对于数学公式的转换效能也非常出色。


图1 Tex2word软件对数学符号的转换效果


图1给出了Tex2word对于常用数学符号的转换情况。从图中可见,经Tex2word转换后的word文件中的数学符号基本与由LaTex生成的PDF中的数学符号一致,少数符号出现了乱码(图1中显示为“?”)。

图2 Tex2word软件对复杂数学公式的转换效果


哪怕是较为复杂的数学公式,转换效果也很理想,如图2所示,公式中的希腊字母、运算符、上下角标等,在转换过程中,未发生偏差。进一步,我们选取LaTex源文件的部分编译命令,制成一个精简的数学论文LaTex模板,来看一下Tex2word软件对于整篇LaTex文件的转换效果,如图3所示(LaTex源文件略)。

图3 Tex2word软件对整篇LaTex模板的转换效果

比较发现,经Tex2word转换后的整篇word 文件(图3b),与LaTex源文件生成的PDF文件(图3a)相差无几,不仅保留了绝大部分文本信息,而且也没有丢失数学公式。即使LaTex源文件是中英文混排,其中还包含方程组、矩阵、复杂多排公式等,也都不影响转换。虽然转换成word后在排版格式上(如字号、字体、位置、间距等)会有些许改变,但只需后期再稍微调整一下即可,这就极大地减少了重排版时的工作量。


其中需要注意几点:1)转换过程中有一些LaTex语句word无法识别,会导致编译陷入死循环,造成转换失败,这时只需在LaTex源文件中修改或删除这些无法识别的指令,再运行Tex2word进行转换。2)Tex2word只能转换常见数学符号(图1),对于LaTex中Amssymb宏包里的数学符号无法进行转换。3)因为作者撰写的LaTex模板不同,所以转换后word文件中会多出一些LaTex语句(如字号、间距等命令),重排时需要删去这些语句。


 word2Tex软件的使用及转换效果 


 安装及使用说明 

(1)操作系统必须是Windows 95以上;已安装Microsoft word 95 以上版本;硬盘空间不小于10M。

(2)下载并按提示安装word2Tex软件(官网地址http://www./products/Tex2word/word2Tex/)。

(3)安装完成后word2Tex会自动嵌入word,打开需要转换的word文件,然后点击“文件”→“另存为”→“保存类型”中选择“.TeX”格式→属性框(图4)中点击“确定”,即可完成转换。

注:默认设置下(每次转换文件时都会弹出该属性对话框),输出版本为LaTex 2e(与旧版LaTex 2.09区别主要在于导言、公式及样式命令),输出文件编码为ANSI码(Windows系统下),采用UNIX/Windows系统下的换行字符LF,且能够识别文本中的内嵌公式。

图4 Tex2word转换属性框


 转换效果 

在对属性框默认设置不做修改的情况下,word2Tex能够迅速转换word文件中的文本信息。而且,由于word公式编辑器(或者MathType编辑器)自带的translator选项本身就提供了向LaTex/amsLaTex格式转换的功能(只针对单个公式),所以word2Tex能够非常完美地批量转换这类编辑器创建的一系列数学符号及复杂公式。此外,我们还可以通过对属性框子菜单的进一步设置,如转换文本颜色、字号等(图4),获得更为理想的转换效果。选取一篇含有数学公式、表格及图片的中英文混排word文件(图5a),经word2Tex转换(其中属性框设置稍作修改),得到LaTex源文件(略),编译生成PDF文件(图5b)。两者对比发现,除了排版格式上的不同,如字体、标题位置、表样式等,显示内容基本一致,这说明word转LaTex文件是比较成功的。


其中需要注意几点:

1)对于中英文混排的word文件,转换成LaTex文件后,如果直接编译会丢失中文文本信息,因此,在LaTex文件导言部分需要使用CCT预处理(如输入命令\documentclass{cctart}),或者调用CJK宏包,以便排版中文。

2)默认设置下,word中的图片转换成EPS格式,直接编译可能会丢失图片,为解决EPS图片插入问题,可在源文件导言部分调用\usepackage{EPStoPDF}宏包;另外,图片文件名中如果出现中文会导致编译失败,需重新用英文或数字命名。

3)原word文件尽可能使用适合的段落样式排版(如利用“样式与格式”菜单设置章节标题),这样转换出来的LaTex 文件中也将包含标题命令,如“\section{标题一}”,否则将转换成不带标题命令的普通文本。

4)利用word公式编辑器(或者MathType编辑器)编辑的数学公式内不能含有中文,否则转换后会丢失中文信息;数学公式编号必须加括号(英文半角),如“(1)、(1.1)”,而不能表示为“1-1”,否则,将转换成普通文本而不是LaTex的编号命令。当然,word2Tex转换属性框的设置毕竟是有限的,word2Tex 转换出来的也只是一个简单的LaTex模板,仍然无法达到一些用户的更高要求。所以为了获得更好的转换输出效果,推荐做法是先选取一个特定模板(一般利用LaTex排版的编辑部都会提供自己的LaTex模板),通过word2Tex将word转换成LaTex文件,再将转换后的内容(LaTex语句)分段复制粘贴到给定LaTex模板中的相应位置。每个模板都对字体、字号、章节段落等格式化排版命令做了严格规定,而分段粘贴能够确保正文内容上的准确性,也避免了对模板格式命令的改动,不会对输出版式造成很大影响,只要对局部命令稍作调整后再进行编译,即可很快实现LaTex重排。

图5 Word2Tex软件对整篇Word文件的转换效果


 结  语 


使用Tex2word与Word2Tex软件,能够最大限度地实现Word与LaTex文件的快速转换,这为排版工作带来极大方便。收到的稿件不论是Word格式还是LaTex格式,都可以根据编辑部排版系统的要求,选择这两款软件其中之一进行转换,从而得到所需的稿件格式。虽然转换中会出现一些问题,但在很大程度上减少了重排时的工作量,提高了排版效率。

来源:中国科技期刊研究

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多