分享

纯Java的方式读取excel2007

 老年图书馆 2011-12-20

纯Java的方式读取excel2007

(2010-05-10 11:09:27)
标签:

excel

it

分类: 数据编程

* 首先介绍excel2007文件的格式,这里单只工作表文件,不包括加载宏的以及其他格式的,即.xlsx扩展名的
* 你可以把Book1.xlsx这个文件用解压缩文件打开,这是office2007的新格式,所有的该版本的文件都可以用
* 解压缩文件打开。
* 在解压到的文件夹里主要用到的是xl这个文件夹,这里也只介绍这个文件夹里的部分文件,其他信息可以在微软
* 的msdn上找到。
* xl文件夹下有sharedStrings.xml,styles.xml,workbook.xml三个文件,第一个是放共享字符的,在msdn上说
* 在这里可以定义各种语言的字符,然后在sheet.xml里引用这个来达到国际化,而不用为每种语言建立一个excel,styles
* 可能是样式吧,workbook.xml是表的总体情况,有几个sheet等等。
* 接着是该文件夹下的worksheets文件夹,里面放的是每个sheet的具体内容,比如在workbook.xml定义有3个sheet,那么
* 在这里你就能看到三个文件,文件名对应workbook.xml中sheet节点的name属性,但是这里要注意大小写
* 打开一个sheet1.xml文件,可以看到这里定义了该sheet中的行和列的信息,具体在程序里有介绍。
* 读取简单的工作表文件的内容基本上用到这些,如果还要对文件进行操作的话,可能还可以修改字体,样式什么的。
*

 

import java.io.File;
import java.io.InputStream;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;

import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;

 
public class ReadExcel2007 {
 public static void main(String[] args){
  try{
   
   //解压Book1.xlsx
   ZipFile xlsxFile =new ZipFile(new File("c:\\l_f3.201004.xlsx"));
   DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
   
   //先读取sharedStrings.xml这个文件备用
   ZipEntry sharedStringXML = xlsxFile.getEntry("xl/sharedStrings.xml");
   InputStream sharedStringXMLIS = xlsxFile.getInputStream(sharedStringXML);
   Document sharedString =    (Document) dbf.newDocumentBuilder().parse(sharedStringXMLIS);
   NodeList str=((org.w3c.dom.Document) sharedString).getElementsByTagName_r("t");
   String sharedStrings[]=new String[str.getLength()];
   for(int n=0;n<str.getLength();n++){
      Element element=(Element)str.item(n);
      //System.out.println(element.getTextContent());
      sharedStrings[n]=element.getTextContent();
   }
   //找到解压文件夹里的workbook.xml,此文件中包含了这张工作表中有几个sheet
   ZipEntry workbookXML = xlsxFile.getEntry("xl/workbook.xml");
   InputStream workbookXMLIS = xlsxFile.getInputStream(workbookXML);
   Document doc =    dbf.newDocumentBuilder().parse(workbookXMLIS);
   //获取一共有几个sheet
   NodeList nl=doc.getElementsByTagName_r("sheet");
   
   for(int i=0;i<nl.getLength();i++){
      Element element=(Element)nl.item(i);//将node转化为element,用来得到每个节点的属性
      System.out.println(element.getAttribute("name"));//输出sheet节点的name属性的值
      //接着就要到解压文件夹里找到对应的name值的xml文件,比如在workbook.xml中有<sheet name="Sheet1" sheetId="1" r:id="rId1" /> 节点
      //那么就可以在解压文件夹里的xl/worksheets下找到sheet1.xml,这个xml文件夹里就是包含的表格的内容
      ZipEntry sheetXML=xlsxFile.getEntry("xl/worksheets/sheet"+element.getAttribute("sheetId").toLowerCase()+".xml");
      InputStream sheetXMLIS=xlsxFile.getInputStream(sheetXML);
      Document sheetdoc =    dbf.newDocumentBuilder().parse(sheetXMLIS);
      NodeList rowdata=sheetdoc.getElementsByTagName_r("row");
      for(int j=0;j<rowdata.getLength();j++){
        //得到每个行
        //行的格式:
       Element row=(Element)rowdata.item(j);
       //根据行得到每个行中的列
       NodeList columndata=row.getElementsByTagName_r("c");
       for(int k=0;k<columndata.getLength();k++){
        Element column=(Element)columndata.item(k);
        NodeList values=column.getElementsByTagName_r("v");
        Element value=(Element)values.item(0);
        if(column.getAttribute("t")!=null&column.getAttribute("t").equals("s")){
           //如果是共享字符串则在sharedstring.xml里查找该列的值
           System.out.print(sharedStrings[Integer.parseInt(value.getTextContent())]+" ");
        }else{
           System.out.print(value.getTextContent()+" ");
        }
       }
       System.out.println();
      }
   }
  }catch(Exception e){
     e.printStackTrace();
  }
 }
}

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多