<!-- 占用一個節點對象 --><province> <city code="027">武漢</city> <city code="0716">荊州</city> <city code="0718">宜昌</city></province><!-- 占用第三個節點對象 --> JAVA代碼如下: ...
1)DOM解析
DOM是html和xml的應用程式介面(API),以層次結構(類似於樹型)來組織節點和信息片段,映射XML文檔的結構,允許獲取
和操作文檔的任意部分,是W3C的官方標準
【優點】
①允許應用程式對數據和結構做出更改。
②訪問是雙向的,可以在任何時候在樹中上下導航,獲取和操作任意部分的數據。
【缺點】
①通常需要載入整個XML文檔來構造層次結構,消耗資源大。
以下實例採用這個XML文件內容,例如(demo.xml)
<!-- 占用一個節點對象 -->
<province>
<city code="027">武漢</city>
<city code="0716">荊州</city>
<city code="0718">宜昌</city>
</province>
<!-- 占用第三個節點對象 -->
JAVA代碼如下:
//使用前請先導入w3c-dom.jar包。省略導入步驟。
//註意,DOM解析時會將註釋部分和空格換行讀入子節點中,註意check。
package com.phone1000.lq.xml_demo; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; /** * @author lq *XML文件內容讀取,轉換成流,然後轉換成對應的子節點類型字元串。 */ public class Xml_demo { private static final String PROVINCE="province"; public static void main(String[] args) { try { FileInputStream fin=new FileInputStream(new File("src/demo.xml")); DocumentBuilderFactory docFac=DocumentBuilderFactory.newInstance(); DocumentBuilder builder=docFac.newDocumentBuilder(); //解析流 Document doc= builder.parse(fin); NodeList docNodePar=doc.getChildNodes(); //獲取父節點長度 int parNum=docNodePar.getLength(); System.out.println(parNum); for(int i=0;i<parNum;i++){ Node parNode= docNodePar.item(i); System.out.println(parNode.getNodeName()); if(PROVINCE.equals(parNode.getNodeName())){ NodeList childNode= parNode.getChildNodes(); int childNum= childNode.getLength(); for(int j=0;j<childNum;j++){ Node childNodeName=childNode.item(j); if(childNodeName.hasAttributes()){ NamedNodeMap childNode_child= childNodeName.getAttributes(); Node childNode_childNode=childNode_child.getNamedItem("code"); String codeStr=childNode_childNode.getNodeValue(); String text= childNodeName.getTextContent(); System.out.println(codeStr+"\t"+text); } } } } } catch (ParserConfigurationException | SAXException | IOException e) { // e.printStackTrace(); } } }View Code
(2)SAX解析XML
流模型中的"推"模型分析方式。通過事件驅動,每發現一個節點就引發一個事件,事件推給事件處理器,通過回調方法
完成解析工作,解析XML文檔的邏輯需要應用程式完成
【優勢】
①不需要等待所有數據都被處理,分析就能立即開始。
②只在讀取數據時檢查數據,不需要保存在記憶體中。
③可以在某個條件得到滿足時停止解析,不必解析整個文檔。
④效率和性能較高,能解析大於系統記憶體的文檔。
【缺點】
①需要應用程式自己負責TAG的處理邏輯(例如維護父/子關係等),文檔越複雜程式就越複雜。
②單嚮導航,無法定位文檔層次,很難同時訪問同一文檔的不同部分數據,不支持XPath。
以下實例採用這個XML文件內容,例如(demo.xml)
<!-- 占用一個節點對象 -->
<province>
<city code="027">武漢</city>
<city code="0716">荊州</city>
<city code="0718">宜昌</city>
</province>
<!-- 占用第三個節點對象 -->
JAVA代碼如下:
//使用前請先導入sax.jar包。省略導入步驟。
//此處創建內部類重寫了DefaultHandler的startDocument(),endDocument(),startElement(),endElement() ,characters(),五種方法。
//註意,SAX解析時會將註釋部分和空格換行讀入子節點中。所以要check。
package com.phone1000.lq.xml_sax; import java.io.File; import java.io.FileInputStream; import java.util.ArrayList; import java.util.List; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; /** * @author lq *另一種XML解析方法,記憶體占用少 */ public class Xml_Sax { private static List<CityList> list=new ArrayList<>(); public static void execute() throws Exception{ FileInputStream fiin=new FileInputStream(new File("src/demo.xml")); SAXParserFactory saxF=SAXParserFactory.newInstance(); SAXParser saxP=saxF.newSAXParser(); saxP.parse(fiin, new myHandler()); for(CityList city:list){ System.out.println(city.getName()); } } static class myHandler extends DefaultHandler{ private CityList citylist; @Override public void startDocument() throws SAXException { System.out.println("開始標簽"); } @Override public void endDocument() throws SAXException { System.out.println("結束標簽"); } @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { String attr=attributes.getValue("code"); if("city".equals(qName)){ citylist=new CityList(); citylist.setCode(attr); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { if("city".equals(qName)){ list.add(citylist); } citylist=null; } @Override public void characters(char[] ch, int start, int length) throws SAXException { String str=new String(ch,start,length); System.out.println(str); if(citylist != null){ citylist.setName(str); } } } }View Code
package com.phone1000.lq.xml_sax; public class CityList { String name; String code; public String getName() { return name; } public void setName(String name) { this.name = name; } public String getCode() { return code; } public void setCode(String code) { this.code = code; } public CityList(String name, String code) { super(); this.name = name; this.code = code; } public CityList() { super(); // TODO Auto-generated constructor stub } @Override public String toString() { return "CityList [name=" + name + ", code=" + code + "]"; } }View Code
package com.phone1000.lq.xml_sax; public class TsetSax { public static void main(String[] args) { try { Xml_Sax.execute(); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } }View Code
(3)JDOM解析XML
Java特定的文檔對象模型。自身不包含解析器,使用SAX
【優點】
①使用具體類而不是介面,簡化了DOM的API。
②大量使用了Java集合類,方便了Java開發人員。
【缺點】
①沒有較好的靈活性。
②性能較差。
以下實例採用這個XML文件內容,例如(demo2.xml)
<beans>
<bean name="demo">demo.java</bean>
<bean name="home">home.java</bean>
<bean name="index">index.java</bean>
</beans>
JAVA代碼如下:
//使用前請先導入jdom.jar包,省略導入步驟。
//註意,jdom解析時會跳過註釋部分和空格換行內容。
package com.phone1000.lq.jdom; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.util.List; import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; public class Xml_Jdom { public static void main(String[] args) { try { SAXBuilder builder=new SAXBuilder(false); FileInputStream fin=new FileInputStream(new File("src/demo2.xml")); Document doc=builder.build(fin); Element ele=doc.getRootElement(); String str=ele.getName(); System.out.println(str); @SuppressWarnings("unchecked") List<Element> list=ele.getChildren(); for (Element element : list) { System.out.println(element.getAttributeValue("name")+"\t"+element.getText()); } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (JDOMException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }View Code
(4)DOM4J解析XML
簡單易用,採用Java集合框架,並完全支持DOM、SAX和JAXP
【優點】
①大量使用了Java集合類,方便Java開發人員,同時提供一些提高性能的替代方法。
②支持XPath。
③有很好的性能。
【缺點】
①大量使用了介面,API較為複雜。
以下實例採用這個XML文件內容,例如(demo2.xml)
<beans>
<bean name="demo">demo.java</bean>
<bean name="home">home.java</bean>
<bean name="index">index.java</bean>
</beans>
JAVA代碼如下:
//使用前請先導入dom4j.jar包,省略導入步驟。
//註意,dom4j解析時會跳過註釋部分和空格換行內容,直接獲得節點內容。
1 package com.phone1000.lq.dom4j; 2 3 import java.io.File; 4 import java.io.FileInputStream; 5 import java.io.FileNotFoundException; 6 import java.util.List; 7 8 import org.dom4j.Document; 9 import org.dom4j.DocumentException; 10 import org.dom4j.Element; 11 import org.dom4j.io.SAXReader; 12 13 public class Xml_dom4j { 14 public static void main(String[] args) { 15 try { 16 SAXReader sax=new SAXReader(); 17 FileInputStream fin=new FileInputStream(new File("src/demo2.xml")); 18 Document doc=sax.read(fin); 19 Element ele=doc.getRootElement(); 20 String str=ele.getName(); 21 System.out.println(str); 22 @SuppressWarnings("unchecked") 23 List<Element> list=ele.elements(); 24 for (Element element : list) { 25 System.out.println(element.attributeValue("name")+"\t"+element.getText()); 26 } 27 } catch (FileNotFoundException | DocumentException e) { 28 e.printStackTrace(); 29 } 30 } 31 }View Code
附加StAX解析XML
流模型中的拉模型分析方式。提供基於指針和基於迭代器兩種方式的支持,JDK1.6新特性
【和推式解析相比的優點】
①在拉式解析中,事件是由解析應用產生的,因此拉式解析中向客戶端提供的是解析規則,而不是解析器。
②同推式解析相比,拉式解析的代碼更簡單,而且不用那麼多庫。
③拉式解析客戶端能夠一次讀取多個XML文件。
④拉式解析允許你過濾XML文件和跳過解析事件。
【簡介】
StAX API的實現是使用了Java Web服務開發(JWSDP)1.6,並結合了Sun Java流式XML分析器(SJSXP)-它位於
javax.xml.stream包中。XMLStreamReader介面用於分析一個XML文檔,而XMLStreamWriter介面用於生成一個
XML文檔。XMLEventReader負責使用一個對象事件迭代子分析XML事件-這與XMLStreamReader所使用的游標機制
形成對照。