分享

基于Java的Office 系列文档处理五种工具简单介绍

 wenxuefeng360 2022-09-01 发布于四川
                                           随手一查,发现还不少

一、Jacob

Jacob是Java-COM Bridge的缩写,通过它Java与Microsoft的COM组件建立桥梁,实现了对微软Office的COM接口进行调用

acob技术的优势是通过对微软Office的COM接口简单调用,能够生成格式规范的word文件。Jacob技术的缺陷是只能使用windows平台作为服务器,对unix和linux不很支持,且Microsoft Office软件必须在服务器端安装。



二、Apache POI

Apache 软件基金会的开放源码函式库就是Apache POI。Java程序对Word文件的读、写功能就是 POI 提供给 API 的,它可以灵活操作基于Microsoft OLE 2 Compound Document Format的格式文件,完成 Java 读写 Microsoft Office 文件[2]。Apache POI中的HWPF具体提供了读写Microsoft Word格式文件的功能。

Apache POI 的特点是支持 windows、unix 和linux 等多平台,不足是对 word 文件的处理不如excel 格式文件处理效果。它仅能对 Word 进行简单操作,对 Word 样式不能自定义设置,且生成word文件的格式不规范。



三、Java2word

Java2word本质是一个在组件(类库),利用它可以在 java 程序中调用 MS Office Word 文档Java2word提供了一组简易的接口,可以使得Java程序方便调用接口服务操作 Word 文件。 提供操作Word的主要服务功能有:打开、新建、查找和替换、插入文本和图片、插入表格等。



四、FreeMarker

FreeMarker 技 术 的 原 理 是 通 过XML+FreeMarker功能生成word文档。首先新建一个Word文件,然后另存为一个xml文件。然后将特殊字符串作为占位符插入在 xml 文件中指定位置,并将 xml 转换为 FreeMarker 模板。最后,通过Java程序解析FreeMarker模板,将FreeMarker模板中的文本替换并输出到Word文件中。

FreeMarker技术的优点是比Java2word功能强大,且是纯粹的 Java 编程;不足是生成 Word 文件其结构本质上是xml,如超链接、换行等很多常用的word格式无法处理,出现乱码、部分生成的文件打不开等异常。



五、PageOffice

PageOffice技术原理是其封装了Microsoft Office VBA接口。VBA接口本身是很复杂的,但他提供简单的Java编程对象,并支持Word文件的生成技术,并对Word文件能在线编辑、读写内容。

PageOffice的特点是支持Windows、Unix、Linux多平台,且支持文字、表格、图表、段落、超链接等多种格式的设置,生成word文件格式规范。PageOffice技术还支持多Word文档合并技术,耗费服务器资源低,操作简单、稳定;PageOffice技术不足的是不能在服务器端生成文件,只能客户端生成。



五、参考文档

[1]叶文胜.利用Java技术动态生成Word文档之探索[J].黄冈职业技术学院学报,2019,21(06):123-125.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多