分享

java解析xml常用的三种方法

 ls02 2014-08-06
(I)Java通过DOM解析XML
 
1>得到DOM解析器的工厂实例
  DocumentBuilderFactory domfac=DocumentBuilderFactory.newInstance();
  得到javax.xml.parsers.DocumentBuilderFactory;类的实例就是我们要的解析器工厂
  
2>从DOM工厂获得DOM解析器
  DocumentBuilder dombuilder=domfac.newDocumentBuilder();
  通过javax.xml.parsers.DocumentBuilderFactory实例的静态方法newDocumentBuilder()得到DOM解析器
  
3>把要解析的XML文档转化为输入流,以便DOM解析器解析它
  InputStream is=new FileInputStream("bin/library.xml");
  InputStream是一个接口。
4>解析XML文档的输入流,得到一个Document
  Document doc=dombuilder.parse(is);
  由XML文档的输入流得到一个org.w3c.dom.Document对象,以后的处理都是对Document对象进行的
  
5>得到XML文档的根节点
  Element root=doc.getDocumentElement();
  在DOM中只有根节点是一个org.w3c.dom.Element对象。
  
6>得到节点的子节点
  NodeList books=root.getChildNodes();
  for(int i=0;i<books.getLength();i++){
 Node book=books.item(i);
  }
   这是用一个org.w3c.dom.NodeList接口来存放它所有子节点的,还有一种轮循子节点的方法,后面有介绍
  
7>取得节点的属性值
  String email=book.getAttributes().getNamedItem("email").getNodeValue();
  System.out.println(email);
  注意,节点的属性也是它的子节点。它的节点类型也是Node.ELEMENT_NODE
  
8>轮循子节点
  for(Node node=book.getFirstChild();node!=null;node=node.getNextSibling()){
  
    if(node.getNodeType()==Node.ELEMENT_NODE){
  
        if(node.getNodeName().equals("name")){
  
     String name=node.getNodeValue();
   
     String name1=node.getFirstChild().getNodeValue();
   
    ...
   
     if(node.getNodeName().equals("price")){
   
     String price=node.getFirstChild().getNodeValue();
...
  
 
Java代码  收藏代码
  1. <span style="font-family: courier new,courier; font-size: small;"><?xml version="1.0" encoding="UTF-8"?>   
  2. <xml>   
  3.     <conn-params>   
  4.         <conn-url>jdbc:mysql://192.168.101.7:3306/bbs</conn-url>   
  5.         <conn-driver>com.mysql.jdbc.Driver</conn-driver>   
  6.         <conn-username>root</conn-username>   
  7.         <conn-password>root</conn-password>   
  8.     </conn-params>   
  9.         
  10.     <person>   
  11.         <user>   
  12.             <username>xzc</username>   
  13.             <password>sdf23223</password>   
  14.             <birthday>2012-01-23</birthday>   
  15.         </user>   
  16.         <user>   
  17.             <username>误闯</username>   
  18.             <password>wuchuang3223</password>   
  19.             <birthday>2002-01-03</birthday>   
  20.         </user>   
  21.     </person>   
  22. </xml> </span>  
  
////////////////////////////////////////////////////////////////////////////////////
  
Java代码  收藏代码
  1. <span style="font-family: courier new,courier; font-size: small;">package com.xcz.xml;   
  2.     
  3. import java.io.File;   
  4. import java.io.IOException;   
  5. import java.util.List;   
  6.     
  7. import javax.xml.parsers.ParserConfigurationException;   
  8.     
  9. import org.xml.sax.SAXException;   
  10.     
  11. import com.xcz.po.User;   
  12. import com.xcz.xml.util.DomUtil;   
  13.     
  14. public class Dom4Xml {   
  15.     
  16.     private DomUtil domUtil = new DomUtil();   
  17.         
  18.     public static void main(String[] args) {   
  19.         try {   
  20.             File f = new File("src/jdbc-params.xml");   
  21.             List<User> list = new Dom4Xml().domUtil.parseXml(f);   
  22.             for (User user : list) {   
  23.                 System.out.println(user);   
  24.             }   
  25.         } catch (ParserConfigurationException e) {   
  26.             e.printStackTrace();   
  27.         } catch (SAXException e) {   
  28.             e.printStackTrace();   
  29.         } catch (IOException e) {   
  30.             e.printStackTrace();   
  31.         }   
  32.             
  33.     }   
  34. } </span>  
 
  
////////////////////////////////////////////////////////////////////////////////////
  
Java代码  收藏代码
  1. <span style="font-family: courier new,courier; font-size: small;">package com.xcz.xml.util;   
  2.     
  3. import java.io.File;   
  4. import java.io.IOException;   
  5. import java.util.ArrayList;   
  6. import java.util.List;   
  7.     
  8. import javax.xml.parsers.DocumentBuilder;   
  9. import javax.xml.parsers.DocumentBuilderFactory;   
  10. import javax.xml.parsers.ParserConfigurationException;   
  11.     
  12. import org.w3c.dom.Document;   
  13. import org.w3c.dom.Element;   
  14. import org.w3c.dom.Node;   
  15. import org.w3c.dom.NodeList;   
  16. import org.xml.sax.SAXException;   
  17.     
  18. import com.xcz.po.User;   
  19.     
  20. public class DomUtil {   
  21.     
  22.     private DocumentBuilderFactory factory;   
  23.     private DocumentBuilder builder;   
  24.     private Document document;   
  25.         
  26.     private List<User> list;   
  27.         
  28.     /**  
  29.      * 创建一个DocumentBuilderFactory 对象  
  30.      * @return DocumentBuilderFactory  
  31.      */   
  32.     private DocumentBuilderFactory getDocumentBuilderFactory(){   
  33.         return DocumentBuilderFactory.newInstance();   
  34.     }   
  35.         
  36.     /**  
  37.      * 创建一个DocumentBulider 对象  
  38.      * @param DocumentBuilderFactory fac   
  39.      * @return DocumentBuilder  
  40.      * @throws ParserConfigurationException  
  41.      */   
  42.     private DocumentBuilder getDocumentBuilder(DocumentBuilderFactory fac) throws ParserConfigurationException{   
  43.         return fac.newDocumentBuilder();   
  44.     }   
  45.         
  46.     /**  
  47.      * 功能:解析XML文件  
  48.      * @param file xml文件  
  49.      * @return List<User>  
  50.      * @throws ParserConfigurationException  
  51.      * @throws SAXException  
  52.      * @throws IOException  
  53.      */   
  54.     public List<User> parseXml(File file) throws ParserConfigurationException, SAXException, IOException{   
  55.         factory = getDocumentBuilderFactory();   
  56.         builder = getDocumentBuilder(factory);   
  57.         document = builder.parse(file);   
  58.         List<User> list = parseXmlProcess(document);   
  59.         return list;   
  60.     }   
  61.         
  62.     /**  
  63.      * 功能:xml文件具体解析过程  
  64.      * @param document  
  65.      * @return List<User>  
  66.      */   
  67.     private List<User> parseXmlProcess(Document document){   
  68.         list = new ArrayList<User>();   
  69.             
  70.         //获取根节点   
  71.         Element root = document.getDocumentElement();   
  72.         //获取根节点下面的所有孩子节点   
  73.         NodeList childNodes = root.getChildNodes();   
  74.             
  75.         for(int i=0; i<childNodes.getLength(); i++){//获取节点集合长度:getLength()   
  76.             Node node = childNodes.item(i);//获取第index 节点:item(index)   
  77.                 
  78.             if("person".equals(node.getNodeName())){//获取当前节点tagName:getNodeName()   
  79.                 NodeList pChildNodes = node.getChildNodes();   
  80.                 
  81.                 for(int p=0; p<pChildNodes.getLength(); p++){   
  82.                     Node pNode = pChildNodes.item(p);   
  83.                     
  84.                     if("user".equals(pNode.getNodeName())){   
  85.                         User user = new User();   
  86.                         NodeList uChildNodes = pNode.getChildNodes();   
  87.                         
  88.                         for(int u=0;u<uChildNodes.getLength();u++){   
  89.                                 
  90.                             Node uNode = uChildNodes.item(u);   
  91.                             
  92.                             if("username".equals(uNode.getNodeName())){   
  93.                                 user.setUsername(uNode.getTextContent());//获取当前节点的具体内容:getTextContent()   
  94.                             }   
  95.                             if("password".equals(uNode.getNodeName())){   
  96.                                 user.setPassword(uNode.getTextContent());   
  97.                             }   
  98.                             if("birthday".equals(uNode.getNodeName())){   
  99.                                 user.setBirthday(uNode.getTextContent());   
  100.                             }   
  101.                         }   
  102.                         list.add(user);   
  103.                     }   
  104.                 }   
  105.             }   
  106.         }   
  107.             
  108.         return list;   
  109.     }   
  110. }</span>  
 
 
 
 
(II)Java通过SAX解析XML
    Simple API for XML(简称SAX)是个循序存取XML的解析器API。

    一个实现SAX的解析器(也就是“SAX Parser”)以一个串流解析器的型式作用,拥有事件驱动API。由使用者定义回调函数,解析时,若发生事件的话会被调用。SAX事件包括:

  • XML 文字 节点
  • XML 元素 节点
  • XML 处理指令
  • XML 注释

 

Java代码  收藏代码
  1. <person>   
  2.     <user>   
  3.         <username>谢成志</username>   
  4.         <password>6626310xie</password>   
  5.         <sex>男</sex>   
  6.         <birthday>1988/11/28</birthday>   
  7.         <headpic>   
  8.             <pictitle>ermao</pictitle>   
  9.             <picurl>images/head1.jpg</picurl>   
  10.         </headpic>   
  11.     </user>   
  12. </person>   
 此为下面即将解析度简单xml结构,并将其封装成一个User对象。
 
////////////////////////////////////////////////////////////////////////////////////
Java代码  收藏代码
  1. <span style="font-family: courier new,courier; font-size: small;">package com.xcz.xml;   
  2.     
  3. import java.io.File;   
  4. import java.io.IOException;   
  5.     
  6. import javax.xml.parsers.ParserConfigurationException;   
  7. import javax.xml.parsers.SAXParser;   
  8. import javax.xml.parsers.SAXParserFactory;   
  9.     
  10. import org.xml.sax.SAXException;   
  11.     
  12. import com.xcz.util.SaxUtil;   
  13.     
  14. public class Sax4XML {   
  15.     
  16.     public static void main(String[] args) {   
  17.             
  18.         try {   
  19.             //1.获取factory   
  20.             SAXParserFactory factory = SAXParserFactory.newInstance();   
  21.             //2.获取parser   
  22.             SAXParser parser = factory.newSAXParser();   
  23.             //3.获取解析时的监听器对象   
  24.             SaxUtil su = new SaxUtil();   
  25.             //4.开始解析   
  26.             parser.parse(new File("src/user-params.xml"), su);   
  27.                 
  28.             System.out.println(su.getUser());   
  29.             
  30.         } catch (ParserConfigurationException e) {   
  31.             e.printStackTrace();   
  32.         } catch (SAXException e) {   
  33.             e.printStackTrace();   
  34.         } catch (IOException e) {   
  35.             e.printStackTrace();   
  36.         }   
  37.             
  38.     }   
  39. }   
  40. </span>  
 
////////////////////////////////////////////////////////////////////////////////////
Java代码  收藏代码
  1. <span style="font-family: courier new,courier; font-size: small;">package com.xcz.util;   
  2.     
  3. import java.text.ParseException;   
  4. import java.text.SimpleDateFormat;   
  5.     
  6. import org.xml.sax.Attributes;   
  7. import org.xml.sax.SAXException;   
  8. import org.xml.sax.helpers.DefaultHandler;   
  9.     
  10. import com.xcz.po.HeadPic;   
  11. import com.xcz.po.User;   
  12.     
  13. /**  
  14.  * 定义xml解析时的监听类  
  15.  *   
  16.  * 实现方式有很多,可以实现接口:ContentHandler,DTDHandler, EntityResolver 和 ErrorHandler   
  17.  * 但我们常用的继承:DefaultHandler   
  18.  */   
  19. public class SaxUtil extends DefaultHandler {   
  20.     
  21.     private User user;   
  22.     private HeadPic headPic;   
  23.     private String content;   
  24.     private SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd");   
  25.         
  26.     @Override   
  27.     public void characters(char[] ch, int start, int length)   
  28.             throws SAXException {   
  29.         content = new String(ch, start, length);   
  30.     }   
  31.         
  32.     //当解析到文本开始时触发   
  33.     @Override   
  34.     public void startDocument() throws SAXException {   
  35.         super.startDocument();   
  36.     }   
  37.         
  38.     //当解析到文本结束时触发   
  39.     @Override   
  40.     public void endDocument() throws SAXException {   
  41.         super.endDocument();   
  42.     }   
  43.         
  44.     //当解析到元素开始时触发   
  45.     @Override   
  46.     public void startElement(String uri, String localName, String name,   
  47.             Attributes attributes) throws SAXException    
  48.     {   
  49.         if("user".equals(name))   
  50.         {   
  51.             user = new User();   
  52.         }   
  53.         if("headpic".equals(name))   
  54.         {   
  55.             headPic = new HeadPic();   
  56.         }   
  57.     }   
  58.         
  59.     //当解析到元素结束时触发   
  60.     @Override   
  61.     public void endElement(String uri, String localName, String name)   
  62.             throws SAXException    
  63.     {   
  64.         if("username".equals(name))   
  65.         {   
  66.             user.setUsername(content);   
  67.         }   
  68.         if("password".equals(name))   
  69.         {   
  70.             user.setPassword(content);   
  71.         }   
  72.         if("sex".equals(name))   
  73.         {   
  74.             user.setSex(content);   
  75.         }   
  76.         if("birthday".equals(name))   
  77.         {   
  78.             try {   
  79.                 user.setBirthday(sdf.parse(content));   
  80.             } catch (ParseException e) {   
  81.                 // TODO Auto-generated catch block   
  82.                 e.printStackTrace();   
  83.             }   
  84.         }   
  85.         if("pictitle".equals(name))   
  86.         {   
  87.             headPic.setPicTitle(content);   
  88.         }   
  89.         if("picurl".equals(name))   
  90.         {   
  91.             headPic.setPicUrl(content);   
  92.             user.setHeadPic(headPic);   
  93.         }   
  94.             
  95.     }   
  96.     
  97.     public User getUser(){   
  98.         return user;   
  99.     }   
  100.         
  101. }</span>  
 

[优点]

    (1).节约内存开销   

    SAX解析器在某些方面优于DOM风格解析器,因为SAX解析器的内存使用量一般远低于DOM解析器使用量。DOM解析器在任何处理开始之前,必须将xml以整棵树放在内存,所以DOM解析器的内存使用量完全根据输入资料的大小。相对来说,SAX解析器的内存内容,是只基于XML档案的最大深度(XML树的最大深度)和单一XML项目上XML属性储存的最大资料。

    (2)解析速度快

    因为SAX事件驱动的本质,处理文件通常会比DOM风格的解析器快。 

[缺点]

    SAX事件驱动的模型对于XML解析很有用,但它确实有某些缺点。

    某些种类的XML验证需要存取整份文件。例如,一个DTD IDREF属性需要文件内有项目使用指定字串当成DTD ID属性。要在SAX解析器内验证,必须追踪每个之前遇过的ID和IDREF属性,检查是否有任何相符。更甚者,一个IDREF找不到对应的ID,使用者只会在整份文件都解析完后才发现,若这种连结对于建立有效输出是重要的,那用在处理整份文件的时间只是浪费。

    另外,某些XML处理仅要求存取整份文件。举例来说,XSLTXPath需要能够任何时间存取任何解析过的XML树。当SAX以用来建构此树时,DOM解析器在设计上已经是如此了。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多