JAVA解析xml的四種方式比較_ZenDei技術網路在線

<province> <city code="027">武漢</city> <city code="0716">荊州</city> <city code="0718">宜昌</city></province> JAVA代碼如下： ...

1)DOM解析

	DOM是html和xml的應用程式介面(API)，以層次結構（類似於樹型）來組織節點和信息片段，映射XML文檔的結構，允許獲取
	和操作文檔的任意部分，是W3C的官方標準
	【優點】
		①允許應用程式對數據和結構做出更改。
		②訪問是雙向的，可以在任何時候在樹中上下導航，獲取和操作任意部分的數據。
	【缺點】
		①通常需要載入整個XML文檔來構造層次結構，消耗資源大。
以下實例採用這個XML文件內容,例如（demo.xml）

<province>
<city code="027">武漢</city>
<city code="0716">荊州</city>
<city code="0718">宜昌</city>
</province>

JAVA代碼如下：

//使用前請先導入w3c-dom.jar包。省略導入步驟。

//註意，DOM解析時會將註釋部分和空格換行讀入子節點中,註意check。

package com.phone1000.lq.xml_demo;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

/**
 * @author lq
 *XML文件內容讀取，轉換成流，然後轉換成對應的子節點類型字元串。
 */
public class Xml_demo {
    private static final String PROVINCE="province";
    public static void main(String[] args) {
        
        try {
            FileInputStream fin=new FileInputStream(new File("src/demo.xml"));
             DocumentBuilderFactory docFac=DocumentBuilderFactory.newInstance();
             DocumentBuilder builder=docFac.newDocumentBuilder();
             //解析流
             Document doc= builder.parse(fin);
             NodeList docNodePar=doc.getChildNodes();
             //獲取父節點長度
             int parNum=docNodePar.getLength();
             System.out.println(parNum);
             for(int i=0;i<parNum;i++){
                 Node parNode= docNodePar.item(i);
                 System.out.println(parNode.getNodeName());
                 if(PROVINCE.equals(parNode.getNodeName())){
                     NodeList childNode= parNode.getChildNodes();
                     
                    int childNum= childNode.getLength();
                     for(int j=0;j<childNum;j++){
                         Node childNodeName=childNode.item(j);
                         if(childNodeName.hasAttributes()){
                             NamedNodeMap childNode_child= childNodeName.getAttributes();
                            Node childNode_childNode=childNode_child.getNamedItem("code");
                            String codeStr=childNode_childNode.getNodeValue();
                            String text= childNodeName.getTextContent();
                            System.out.println(codeStr+"\t"+text);
                         }
                     }
                 }
             }
        } catch (ParserConfigurationException | SAXException | IOException e) {
            //
            e.printStackTrace();
        }
        
    }

}

View Code

(2)SAX解析XML
	流模型中的"推"模型分析方式。通過事件驅動，每發現一個節點就引發一個事件，事件推給事件處理器，通過回調方法
	完成解析工作，解析XML文檔的邏輯需要應用程式完成
	【優勢】
		①不需要等待所有數據都被處理，分析就能立即開始。
		②只在讀取數據時檢查數據，不需要保存在記憶體中。
		③可以在某個條件得到滿足時停止解析，不必解析整個文檔。
		④效率和性能較高，能解析大於系統記憶體的文檔。
	【缺點】
		①需要應用程式自己負責TAG的處理邏輯（例如維護父/子關係等），文檔越複雜程式就越複雜。
		②單嚮導航，無法定位文檔層次，很難同時訪問同一文檔的不同部分數據，不支持XPath。

以下實例採用這個XML文件內容,例如（demo.xml）

<province>
<city code="027">武漢</city>
<city code="0716">荊州</city>
<city code="0718">宜昌</city>
</province>

JAVA代碼如下：

//使用前請先導入sax.jar包。省略導入步驟。

//此處創建內部類重寫了DefaultHandler的startDocument()，endDocument()，startElement()，endElement() ，characters()，五種方法。

//註意，SAX解析時會將註釋部分和空格換行讀入子節點中。所以要check。

package com.phone1000.lq.xml_sax;

import java.io.File;
import java.io.FileInputStream;
import java.util.ArrayList;
import java.util.List;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

/**
 * @author lq
 *另一種XML解析方法，記憶體占用少
 */
public class Xml_Sax {
    private static List<CityList> list=new ArrayList<>();
    public static void execute() throws Exception{
        FileInputStream fiin=new FileInputStream(new File("src/demo.xml"));
        SAXParserFactory saxF=SAXParserFactory.newInstance();
        SAXParser saxP=saxF.newSAXParser();
        saxP.parse(fiin, new myHandler());
        
        for(CityList city:list){
            System.out.println(city.getName());
        }
    }
    static class myHandler extends  DefaultHandler{
        private CityList citylist;
        @Override
        public void startDocument() throws SAXException {
            System.out.println("開始標簽");
        }

        @Override
        public void endDocument() throws SAXException {
            System.out.println("結束標簽");
        }

        @Override
        public void startElement(String uri, String localName, String qName, Attributes attributes)
                throws SAXException {
            String attr=attributes.getValue("code");
            if("city".equals(qName)){
                citylist=new CityList();
                citylist.setCode(attr);
            }
        }

        @Override
        public void endElement(String uri, String localName, String qName) throws SAXException {
            if("city".equals(qName)){
                list.add(citylist);
            }
            citylist=null;
        }

        @Override
        public void characters(char[] ch, int start, int length) throws SAXException {
            String str=new String(ch,start,length);
            System.out.println(str);
            if(citylist != null){
                citylist.setName(str);
            }
        }
        
    }
}

View Code

package com.phone1000.lq.xml_sax;

public class CityList {
    String name;
    String code;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public String getCode() {
        return code;
    }
    public void setCode(String code) {
        this.code = code;
    }
    public CityList(String name, String code) {
        super();
        this.name = name;
        this.code = code;
    }
    public CityList() {
        super();
        // TODO Auto-generated constructor stub
    }
    @Override
    public String toString() {
        return "CityList [name=" + name + ", code=" + code + "]";
    }
    
}

View Code

package com.phone1000.lq.xml_sax;

public class TsetSax {

    public static void main(String[] args) {
        try {
            Xml_Sax.execute();
        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }

}

View Code

(3)JDOM解析XML
	Java特定的文檔對象模型。自身不包含解析器，使用SAX
	【優點】
		①使用具體類而不是介面，簡化了DOM的API。
		②大量使用了Java集合類，方便了Java開發人員。
	【缺點】
		①沒有較好的靈活性。
		②性能較差。

以下實例採用這個XML文件內容,例如（demo2.xml）

<beans>
<bean name="demo">demo.java</bean>
<bean name="home">home.java</bean>
<bean name="index">index.java</bean>
</beans>

JAVA代碼如下：

//使用前請先導入jdom.jar包,省略導入步驟。

//註意，jdom解析時會跳過註釋部分和空格換行內容。

package com.phone1000.lq.jdom;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.List;

import org.jdom.Document;
import org.jdom.Element;
import org.jdom.JDOMException;
import org.jdom.input.SAXBuilder;

public class Xml_Jdom {
　　public static void main(String[] args) {
　　try {
　　　　SAXBuilder builder=new SAXBuilder(false);
　　　　FileInputStream fin=new FileInputStream(new File("src/demo2.xml"));
　　　　Document doc=builder.build(fin);
　　　　Element ele=doc.getRootElement();
　　　　String str=ele.getName();
　　　　System.out.println(str);
　　　　@SuppressWarnings("unchecked")
　　　　List<Element> list=ele.getChildren();
　　　　for (Element element : list) {
　　　　　　System.out.println(element.getAttributeValue("name")+"\t"+element.getText());
　　　　　　}
　　　　} catch (FileNotFoundException e) {
　　　　　　e.printStackTrace();
　　　　} catch (JDOMException e) {
　　　　　　e.printStackTrace();
　　　　} catch (IOException e) {
　　　　　　e.printStackTrace();
　　　　}
　　}
}

View Code

(4)DOM4J解析XML
	簡單易用，採用Java集合框架，並完全支持DOM、SAX和JAXP
	【優點】
		①大量使用了Java集合類，方便Java開發人員，同時提供一些提高性能的替代方法。
		②支持XPath。
		③有很好的性能。
	【缺點】
		①大量使用了介面，API較為複雜。

以下實例採用這個XML文件內容,例如（demo2.xml）

<beans>
<bean name="demo">demo.java</bean>
<bean name="home">home.java</bean>
<bean name="index">index.java</bean>
</beans>

JAVA代碼如下：

//使用前請先導入dom4j.jar包,省略導入步驟。

//註意，dom4j解析時會跳過註釋部分和空格換行內容，直接獲得節點內容。

 1 package com.phone1000.lq.dom4j;
 2 
 3 import java.io.File;
 4 import java.io.FileInputStream;
 5 import java.io.FileNotFoundException;
 6 import java.util.List;
 7 
 8 import org.dom4j.Document;
 9 import org.dom4j.DocumentException;
10 import org.dom4j.Element;
11 import org.dom4j.io.SAXReader;
12 
13 public class Xml_dom4j {
14 　　public static void main(String[] args) {
15 　　try {
16 　　　　SAXReader sax=new SAXReader();
17 　　　　FileInputStream fin=new FileInputStream(new File("src/demo2.xml"));
18 　　　　Document doc=sax.read(fin);
19 　　　　Element ele=doc.getRootElement();
20 　　　　String str=ele.getName();
21 　　　　System.out.println(str);
22 　　　　@SuppressWarnings("unchecked")
23 　　　　List<Element> list=ele.elements();
24 　　　　for (Element element : list) {
25 　　　　　　System.out.println(element.attributeValue("name")+"\t"+element.getText());
26 　　　　　　}
27 　　　　} catch (FileNotFoundException | DocumentException e) {
28 　　　　　　e.printStackTrace();
29 　　　　}
30 　　}
31 }

View Code

附加StAX解析XML
	流模型中的拉模型分析方式。提供基於指針和基於迭代器兩種方式的支持,JDK1.6新特性
	【和推式解析相比的優點】
		①在拉式解析中，事件是由解析應用產生的，因此拉式解析中向客戶端提供的是解析規則，而不是解析器。
		②同推式解析相比，拉式解析的代碼更簡單，而且不用那麼多庫。
		③拉式解析客戶端能夠一次讀取多個XML文件。
		④拉式解析允許你過濾XML文件和跳過解析事件。
	【簡介】
		StAX API的實現是使用了Java Web服務開發（JWSDP）1.6，並結合了Sun Java流式XML分析器(SJSXP)-它位於
		javax.xml.stream包中。XMLStreamReader介面用於分析一個XML文檔，而XMLStreamWriter介面用於生成一個
		XML文檔。XMLEventReader負責使用一個對象事件迭代子分析XML事件-這與XMLStreamReader所使用的游標機制
		形成對照。