JavaWeb學習日記----XML的解析_ZenDei技術網路在線

JavaWeb學習日記----XML的解析

-Advertisement-

XML的解析簡介：在學習JavaScript時，我們用的DOM來解析HEML文檔，根據HTML的層級結構在記憶體中分配一個樹形結構，把HTML的標簽啊，屬性啊和文本之類的都封裝成對象。比如：document對象，element對象，屬性對象，文本對象，Node結點對象我們通常有兩種方式來解析XM ...

XML的解析簡介：

　　在學習JavaScript時，我們用的DOM來解析HEML文檔，根據HTML的層級結構在記憶體中分配一個樹形結構，把HTML的標簽啊，屬性啊和文本之類的都封裝成對象。

　　比如：document對象，element對象，屬性對象，文本對象，Node結點對象

我們通常有兩種方式來解析XML：DOM和SAX

　　DOM解析方式：

　　　　其實跟HTML差不多的，也是根據XML的層級結構在記憶體中分配一個樹形結構，把XML的標簽，屬性和文本都封裝成對象。

　　　　缺點：如果文件過大的話，就和造成記憶體溢出。

　　　　優點：可以很方便實現增刪改操作。

　　SAX解析方式：

　　　　採用事件驅動，從上到下，一行一行的解析，邊讀邊解析。解析到某一個對象時，返回對象名稱。

　　　　缺點：不能實現增刪改操作

　　　　優點：不會記憶體溢出，可以方便實現查詢操作。

解析器：

　　在解析XML時，需要解析器。針對DOM和SAX，不同的公司和組織向我們提供了不同的解析器。

　　SUN公司： jaxp

　　dom4j組織： dom4j

　　jdom組織： jdom

　　在實際開發中，dom4j用的最多

jaxp:

　　jaxp解析器在JDK的javax.xml.parsers包裡面。針對dom和sax分別提供瞭解析器：

　　　　dom:　　DocumentBuilder:　　解析器類

　　　　　　　　DocumentBuilderFactory:　　解析器工廠類

　　　　sax:　　SAXParser:　　解析器類

　　　　　　　　SAXParserFactory:　　解析器工廠類

那麼我們具體獲得JAXP中的DOM解析器的方法如下：

　　調用DocumentBuilderFactory.newInstance()方法得到創建DOM解析器的工廠。

　　調用工廠對象的newDocumentBuilder()方法得到解析器對象。

　　調用解析器對象的parse()方法解析XML文檔，該方法的參數為XML文檔的URL或者封裝了XML路徑的文件對象。即：parse(String uri)　　parse(File f)

　　示例：

　　　　　// 創建解析器工廠
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        // 獲得解析器
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

通過上述步驟我們就能得到代表整個文檔的Document對象，就可以利用DOM特性對整個XML文檔進行操縱了。

　　Document介面中常用的方法：

 NodeList getElementsByTagName(String tagname)     按文檔順序返回包含在文檔中且具有給定標記名稱的所Element的 NodeList。 
 Element createElement(String tagName)     　　　　 創建指定類型的元素。     
 Text createTextNode(String data)     　　　　　　   創建給定指定字元串的 Text 節點。

　　Document的父介面Node中常用的方法：

Node appendChild(Node newChild) 
          將節點 newChild 添加到此節點的子節點列表的末尾。 
Node removeChild(Node oldChild) 
          從子節點列表中移除 oldChild 所指示的子節點，並將其返回。 
 Node getParentNode() 
          此節點的父節點。

String getTextContent() 
          此屬性返回此節點及其後代的文本內容。 
void setTextContent(String textContent) 
          此屬性返回此節點及其後代的文本內容。

　　在得到的NodeList集合中有下列方法可以實現遍歷：

int getLength() 
          列表中的節點數。 
 Node item(int index) 
          返回集合中的第 index 個項。

在對Document對象進行更新操作時，都是在記憶體中進行的。如果想要更直觀地顯示在XML文檔中，需要進行回寫操作。即：把Document對象又重新寫入到XML文件中。

示例：

現有一個XML文檔內容如下：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>貝多芬</音樂家>
        
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

需求：將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克

代碼如下：

package com.alex;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

/*
 * 將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克
 */
public class OnePieceTest3 {
    public static void main(String[] args) throws Exception {
        // 創建解析器
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

        // 獲得目標元素集合
        NodeList list = document.getElementsByTagName("草帽海賊團");

        Node node = list.item(0);
        NodeList childNodes = node.getChildNodes();
        for (int j = 0; j < childNodes.getLength(); j++) {
            Node node2 = childNodes.item(j);
            String nodeName = node2.getNodeName();
            if (nodeName.equals("音樂家"))
                node2.setTextContent("布魯克");
        }
        // 回寫
        // 創建轉換器
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));
    }
}

修改後XML文檔內容如下：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>布魯克</音樂家>
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

2019-04-05

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

java--變數，常量，數據類型的聲明及使用

一、概念：變數是指記憶體中的一個存儲區域，該區域要有自己的名稱（變數名）、類型（數據類型），該區域的數據可以在同一數據類型的範圍內不斷變化值；二、變數的使用註意事項： 1、Java中的變數必須聲明後才能進行使用。 2、變數的作用域：在一對｛｝中為有效區間。 3、需要進行初始化後才能使用變數。三、 ...
Rabbit安裝(windows)

安裝rabbit後，啟動服務，瀏覽器打開控制台找不到。查百度說是要裝插件。翻了好幾篇都是互相抄，沒有能用到。多翻了幾篇終於找到一個靠譜的。可以打開控制台了。記錄下：首先要安裝Erlang語言支持，我用的是安裝完Erlang後，需要配置環境變數再配置path變數安裝rabbit。安裝路徑不要 ...
Springboot項目redisTemplate實現輕量級消息隊列

背景公司項目有個需求, 前端上傳excel文件, 後端讀取數據、處理數據、返回錯誤數據, 最簡單的方式同步處理, 客戶端上傳文件後一直阻塞等待響應, 但用戶體驗無疑很差, 處理數據可能十分耗時, 沒人願意傻等, 由於項目暫未使用ActiveMQ等消息隊列中間件, 而redis的lpush和rpop ...
Java 集合系列（四）—— ListIterator 源碼分析

以腦圖的形式來展示Java集合知識，讓零碎知識點形成體系 Iterator 對比 Iterator（迭代器）是一種設計模式，是一個對象，用於遍歷集合中的所有元素。 Iterator 包含四個方法，分別是：next()、hasNext()、remove()、forEachRemaining(Consu ...
php基礎知識考察點：正則表達式

1.正則表達式的作用：分割，查找，匹配，替換字元串 2.分隔符：正斜線（/）,hash符（#）以及取反符號（~）。 3.通用原子：\d \D \s \S \w \W 4.原子符 5. 模式修正符 6.後向引用 7.貪婪模式 8.正則表達式PCRE函數 prge_match(), preg_matc ...
#leetcode刷題之路44-通配符匹配

給定一個字元串 (s) 和一個字元模式 (p) ，實現一個支持 '?' 和 '*' 的通配符匹配。'?' 可以匹配任何單個字元。'*' 可以匹配任意字元串（包括空字元串）。兩個字元串完全匹配才算匹配成功。說明:s 可能為空，且只包含從 a-z 的小寫字母。p 可能為空，且只包含從 a-z 的小寫字 ...
最新的dubbo和zookeeper整合的問題

最新的dubbo和zookeeper整合的問題生活本不易，流人遂自安博主最新在做小項目練手，在進行dubbo和zookeeper整合的時候遇到了一些問題，在這裡這些問題做個小總結吧。首先需要說明的是，這次使用的都是最新的版本。過一下我自己的配置，dubbo 2.6.6，zookeeper ...
分分鐘鐘學會Python - 數據類型（列表、元祖）

第四節數據類型（列表、元祖）今日內容列表元祖 1、列表 1.格式 2.公共方法 1.len 計算長度 2.索引輸出某一個元素 3.切片輸出某一段元素 4.修改（字元串/數字/布爾除外） 5.步長選取列表中第幾個元素 6.for迴圈註意：for和while的應用場景：有窮盡優先使用f ...