我们需求如下:给你一个模板,里面有一个表格,标题已经给好,程序主要就是完成把数据填写到word中并提供给用户下载。 网上找了很久,发现主要两种开源包:POI和Jacob,Jacob首先被否决掉了,因为他最后必须运行在windows平台上。Excel导入导出我就是用的POI,但是POI中的word操作实在不行,读取还可以,写入数据远不能满足项目的需要。后面尝试诸如生成PDF然后转Word,生成XML转Word,生成Html转word,生成rtf转word。这些都是可行的办法,但是网上开源包的功能有限,iText对PDF操作是很强,但是对PDF内容的解析不行。 最后这个事情拖了四天,我看文档的时候想到mht文件,于是我把Word模板导出成mht文件,然后查看其源码,其实就是html代码,我想这样可以用velocity填写数据,然后直接导出成doc格式的文档,后来这样基本满足我们项目的需要。 #foreach($bean in $beanList) <tr style=3D'mso-yfti-irow:1;mso-yfti-lastrow:yes;page-break-inside:avoid; height:22.7pt'> <td width=3D"6%" style=3D'width:6.52%;border:solid windowtext 1.0pt;borde= r-top: none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid window= text .5pt; padding:0cm 5.4pt 0cm 5.4pt;height:22.7pt'> <p class=3DMsoNormal align=3Dcenter style=3D'text-align:center'><span style=3D'mso-bidi-font-size:10.5pt;font-family:SimSun'>${bean.seqNo}<o:p></o:p></span= ></p> </td> <td width=3D"10%" style=3D'width:10.12%;border-top:none;border-left:none; border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt; mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid window= text .5pt; mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:2= 2.7pt'> <p class=3DMsoNormal align=3Dcenter style=3D'text-align:center'><span style=3D'mso-bidi-font-size:10.5pt;font-family:SimSun'>${bean.name}<span lang=3DEN-US><o:p></o:p></span></span></p> </td> </tr> #end 上面是用mht源码改写成vm文件的部分代码,就和生成一般的文本文件一摸一样。这儿如果直接把汉字、特殊字符什么的传给模板(当然英文不会),会出现乱码,导致根据模板导出的word文件这个都是乱码,关于乱码的详细解释可以参考:http://blog.csdn.net/myyate/archive/2008/04/08/2260234.aspx ; 也就是说导出时需要把带汉字的字符串都进行转码,这儿给出一些方法:
上面的Form类型不需要关心,就是一个Bean接口。这样在传到模板之前进行上述转码,就基本上可以避免乱码问题。 导出结束后,只需要把OutputStream导出到*.doc文件中即可,下载的话只要设置:
在mht文件中,图片都是以base64码来存储的,所以在存取之前,必须把二进制的图片进行base64编码:
上面的“编号”、表格数据、横线上的都是填写的。 这种导出到word的方法的一个缺点是模板复杂繁琐,尤其修改的时候更是如此;而且必须是officexp及其以上版本。
|
|