JavaWeb學習日記----XML的解析

来源:https://www.cnblogs.com/fxxk/archive/2019/04/05/10660291.html
-Advertisement-
Play Games

XML的解析簡介: 在學習JavaScript時,我們用的DOM來解析HEML文檔,根據HTML的層級結構在記憶體中分配一個樹形結構,把HTML的標簽啊,屬性啊和文本之類的都封裝成對象。 比如:document對象,element對象,屬性對象,文本對象,Node結點對象 我們通常有兩種方式來解析XM ...


XML的解析簡介:

  在學習JavaScript時,我們用的DOM來解析HEML文檔,根據HTML的層級結構在記憶體中分配一個樹形結構,把HTML的標簽啊,屬性啊和文本之類的都封裝成對象。

  比如:document對象,element對象,屬性對象,文本對象,Node結點對象

我們通常有兩種方式來解析XML:DOM和SAX

  DOM解析方式:

    其實跟HTML差不多的,也是根據XML的層級結構在記憶體中分配一個樹形結構,把XML的標簽,屬性和文本都封裝成對象。

    缺點:如果文件過大的話,就和造成記憶體溢出。

    優點:可以很方便實現增刪改操作。

  SAX解析方式:

    採用事件驅動,從上到下,一行一行的解析,邊讀邊解析。解析到某一個對象時,返回對象名稱。

    缺點:不能實現增刪改操作

    優點:不會記憶體溢出,可以方便實現查詢操作。

解析器:

  在解析XML時,需要解析器。針對DOM和SAX,不同的公司和組織向我們提供了不同的解析器。

  SUN公司:      jaxp

  dom4j組織:    dom4j 

  jdom組織 :     jdom

  在實際開發中,dom4j用的最多

jaxp:

  jaxp解析器在JDK的javax.xml.parsers包裡面。針對dom和sax分別提供瞭解析器:

    dom:  DocumentBuilder:  解析器類

        DocumentBuilderFactory:  解析器工廠類

    sax:  SAXParser:  解析器類

        SAXParserFactory:  解析器工廠類

那麼我們具體獲得JAXP中的DOM解析器的方法如下:

  調用DocumentBuilderFactory.newInstance()方法得到創建DOM解析器的工廠。

  調用工廠對象的newDocumentBuilder()方法得到解析器對象。

  調用解析器對象的parse()方法解析XML文檔,該方法的參數為XML文檔的URL或者封裝了XML路徑的文件對象。即:parse(String uri)  parse(File f)

  示例:

     // 創建解析器工廠
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        // 獲得解析器
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

通過上述步驟我們就能得到代表整個文檔的Document對象,就可以利用DOM特性對整個XML文檔進行操縱了。

  Document介面中常用的方法:

  

 NodeList getElementsByTagName(String tagname)     按文檔順序返回包含在文檔中且具有給定標記名稱的所Element的 NodeList。 
 Element createElement(String tagName)          創建指定類型的元素。     
 Text createTextNode(String data)              創建給定指定字元串的 Text 節點。 

  Document的父介面Node中常用的方法:

Node appendChild(Node newChild) 
          將節點 newChild 添加到此節點的子節點列表的末尾。 
Node removeChild(Node oldChild) 
          從子節點列表中移除 oldChild 所指示的子節點,並將其返回。 
 Node getParentNode() 
          此節點的父節點。
String getTextContent() 
          此屬性返回此節點及其後代的文本內容。 
void setTextContent(String textContent) 
          此屬性返回此節點及其後代的文本內容。 


  在得到的NodeList集合中有下列方法可以實現遍歷:

int getLength() 
          列表中的節點數。 
 Node item(int index) 
          返回集合中的第 index 個項。 

 在對Document對象進行更新操作時,都是在記憶體中進行的。如果想要更直觀地顯示在XML文檔中,需要進行回寫操作。即:把Document對象又重新寫入到XML文件中。

示例:

現有一個XML文檔內容如下:

 

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>貝多芬</音樂家>
        
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

 

 

 

需求:將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克

代碼如下:

package com.alex;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

/*
 * 將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克
 */
public class OnePieceTest3 {
    public static void main(String[] args) throws Exception {
        // 創建解析器
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

        // 獲得目標元素集合
        NodeList list = document.getElementsByTagName("草帽海賊團");

        Node node = list.item(0);
        NodeList childNodes = node.getChildNodes();
        for (int j = 0; j < childNodes.getLength(); j++) {
            Node node2 = childNodes.item(j);
            String nodeName = node2.getNodeName();
            if (nodeName.equals("音樂家"))
                node2.setTextContent("布魯克");
        }
        // 回寫
        // 創建轉換器
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));
    }
}

 修改後XML文檔內容如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>布魯克</音樂家>
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

 

2019-04-05

   


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、概念: 變數是指記憶體中的一個存儲區域,該區域要有自己的名稱(變數名)、類型(數據類型),該區域的數據可以在同一數據類型的範圍內不斷變化值; 二、變數的使用註意事項: 1、Java中的變數必須聲明後才能進行使用。 2、變數的作用域:在一對{}中為有效區間。 3、需要進行初始化後才能使用變數。 三、 ...
  • 安裝rabbit後,啟動服務,瀏覽器打開控制台找不到。查百度說是要裝插件。翻了好幾篇都是互相抄,沒有能用到。 多翻了幾篇終於找到一個靠譜的。可以打開控制台了。記錄下: 首先要安裝Erlang語言支持,我用的是 安裝完Erlang後,需要配置環境變數 再配置path變數 安裝rabbit。安裝路徑不要 ...
  • 背景 公司項目有個需求, 前端上傳excel文件, 後端讀取數據、處理數據、返回錯誤數據, 最簡單的方式同步處理, 客戶端上傳文件後一直阻塞等待響應, 但用戶體驗無疑很差, 處理數據可能十分耗時, 沒人願意傻等, 由於項目暫未使用ActiveMQ等消息隊列中間件, 而redis的lpush和rpop ...
  • 以腦圖的形式來展示Java集合知識,讓零碎知識點形成體系 Iterator 對比 Iterator(迭代器)是一種設計模式,是一個對象,用於遍歷集合中的所有元素。 Iterator 包含四個方法,分別是:next()、hasNext()、remove()、forEachRemaining(Consu ...
  • 1.正則表達式的作用:分割,查找,匹配,替換 字元串 2.分隔符:正斜線(/),hash符(#)以及取反符號(~)。 3.通用原子:\d \D \s \S \w \W 4.原子符 5. 模式修正符 6.後向引用 7.貪婪模式 8.正則表達式PCRE函數 prge_match(), preg_matc ...
  • 給定一個字元串 (s) 和一個字元模式 (p) ,實現一個支持 '?' 和 '*' 的通配符匹配。'?' 可以匹配任何單個字元。'*' 可以匹配任意字元串(包括空字元串)。兩個字元串完全匹配才算匹配成功。 說明:s 可能為空,且只包含從 a-z 的小寫字母。p 可能為空,且只包含從 a-z 的小寫字 ...
  • 最新的dubbo和zookeeper整合的問題 生活本不易,流人遂自安 博主最新在做小項目練手,在進行dubbo和zookeeper整合的時候遇到了一些問題,在這裡這些問題做個小總結吧。 首先需要說明的是,這次使用的都是 最新的版本 。過一下我自己的配置,dubbo 2.6.6,zookeeper ...
  • 第四節 數據類型(列表、元祖) 今日內容 列表 元祖 1、列表 1.格式 2.公共方法 1.len 計算長度 2.索引 輸出某一個元素 3.切片 輸出某一段元素 4.修改(字元串/數字/布爾除外) 5.步長 選取列表中第幾個元素 6.for迴圈 註意:for和while的應用場景: 有窮盡優先使用f ...
一周排行
    -Advertisement-
    Play Games
  • 前言 本文介紹一款使用 C# 與 WPF 開發的音頻播放器,其界面簡潔大方,操作體驗流暢。該播放器支持多種音頻格式(如 MP4、WMA、OGG、FLAC 等),並具備標記、實時歌詞顯示等功能。 另外,還支持換膚及多語言(中英文)切換。核心音頻處理採用 FFmpeg 組件,獲得了廣泛認可,目前 Git ...
  • OAuth2.0授權驗證-gitee授權碼模式 本文主要介紹如何筆者自己是如何使用gitee提供的OAuth2.0協議完成授權驗證並登錄到自己的系統,完整模式如圖 1、創建應用 打開gitee個人中心->第三方應用->創建應用 創建應用後在我的應用界面,查看已創建應用的Client ID和Clien ...
  • 解決了這個問題:《winForm下,fastReport.net 從.net framework 升級到.net5遇到的錯誤“Operation is not supported on this platform.”》 本文內容轉載自:https://www.fcnsoft.com/Home/Sho ...
  • 國內文章 WPF 從裸 Win 32 的 WM_Pointer 消息獲取觸摸點繪製筆跡 https://www.cnblogs.com/lindexi/p/18390983 本文將告訴大家如何在 WPF 裡面,接收裸 Win 32 的 WM_Pointer 消息,從消息裡面獲取觸摸點信息,使用觸摸點 ...
  • 前言 給大家推薦一個專為新零售快消行業打造了一套高效的進銷存管理系統。 系統不僅具備強大的庫存管理功能,還集成了高性能的輕量級 POS 解決方案,確保頁面載入速度極快,提供良好的用戶體驗。 項目介紹 Dorisoy.POS 是一款基於 .NET 7 和 Angular 4 開發的新零售快消進銷存管理 ...
  • ABP CLI常用的代碼分享 一、確保環境配置正確 安裝.NET CLI: ABP CLI是基於.NET Core或.NET 5/6/7等更高版本構建的,因此首先需要在你的開發環境中安裝.NET CLI。這可以通過訪問Microsoft官網下載並安裝相應版本的.NET SDK來實現。 安裝ABP ...
  • 問題 問題是這樣的:第三方的webapi,需要先調用登陸介面獲取Cookie,訪問其它介面時攜帶Cookie信息。 但使用HttpClient類調用登陸介面,返回的Headers中沒有找到Cookie信息。 分析 首先,使用Postman測試該登陸介面,正常返回Cookie信息,說明是HttpCli ...
  • 國內文章 關於.NET在中國為什麼工資低的分析 https://www.cnblogs.com/thinkingmore/p/18406244 .NET在中國開發者的薪資偏低,主要因市場需求、技術棧選擇和企業文化等因素所致。歷史上,.NET曾因微軟的閉源策略發展受限,儘管後來推出了跨平臺的.NET ...
  • 在WPF開發應用中,動畫不僅可以引起用戶的註意與興趣,而且還使軟體更加便於使用。前面幾篇文章講解了畫筆(Brush),形狀(Shape),幾何圖形(Geometry),變換(Transform)等相關內容,今天繼續講解動畫相關內容和知識點,僅供學習分享使用,如有不足之處,還請指正。 ...
  • 什麼是委托? 委托可以說是把一個方法代入另一個方法執行,相當於指向函數的指針;事件就相當於保存委托的數組; 1.實例化委托的方式: 方式1:通過new創建實例: public delegate void ShowDelegate(); 或者 public delegate string ShowDe ...