JavaWeb學習日記----XML的解析

来源:https://www.cnblogs.com/fxxk/archive/2019/04/05/10660291.html
-Advertisement-
Play Games

XML的解析簡介: 在學習JavaScript時,我們用的DOM來解析HEML文檔,根據HTML的層級結構在記憶體中分配一個樹形結構,把HTML的標簽啊,屬性啊和文本之類的都封裝成對象。 比如:document對象,element對象,屬性對象,文本對象,Node結點對象 我們通常有兩種方式來解析XM ...


XML的解析簡介:

  在學習JavaScript時,我們用的DOM來解析HEML文檔,根據HTML的層級結構在記憶體中分配一個樹形結構,把HTML的標簽啊,屬性啊和文本之類的都封裝成對象。

  比如:document對象,element對象,屬性對象,文本對象,Node結點對象

我們通常有兩種方式來解析XML:DOM和SAX

  DOM解析方式:

    其實跟HTML差不多的,也是根據XML的層級結構在記憶體中分配一個樹形結構,把XML的標簽,屬性和文本都封裝成對象。

    缺點:如果文件過大的話,就和造成記憶體溢出。

    優點:可以很方便實現增刪改操作。

  SAX解析方式:

    採用事件驅動,從上到下,一行一行的解析,邊讀邊解析。解析到某一個對象時,返回對象名稱。

    缺點:不能實現增刪改操作

    優點:不會記憶體溢出,可以方便實現查詢操作。

解析器:

  在解析XML時,需要解析器。針對DOM和SAX,不同的公司和組織向我們提供了不同的解析器。

  SUN公司:      jaxp

  dom4j組織:    dom4j 

  jdom組織 :     jdom

  在實際開發中,dom4j用的最多

jaxp:

  jaxp解析器在JDK的javax.xml.parsers包裡面。針對dom和sax分別提供瞭解析器:

    dom:  DocumentBuilder:  解析器類

        DocumentBuilderFactory:  解析器工廠類

    sax:  SAXParser:  解析器類

        SAXParserFactory:  解析器工廠類

那麼我們具體獲得JAXP中的DOM解析器的方法如下:

  調用DocumentBuilderFactory.newInstance()方法得到創建DOM解析器的工廠。

  調用工廠對象的newDocumentBuilder()方法得到解析器對象。

  調用解析器對象的parse()方法解析XML文檔,該方法的參數為XML文檔的URL或者封裝了XML路徑的文件對象。即:parse(String uri)  parse(File f)

  示例:

     // 創建解析器工廠
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        // 獲得解析器
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

通過上述步驟我們就能得到代表整個文檔的Document對象,就可以利用DOM特性對整個XML文檔進行操縱了。

  Document介面中常用的方法:

  

 NodeList getElementsByTagName(String tagname)     按文檔順序返回包含在文檔中且具有給定標記名稱的所Element的 NodeList。 
 Element createElement(String tagName)          創建指定類型的元素。     
 Text createTextNode(String data)              創建給定指定字元串的 Text 節點。 

  Document的父介面Node中常用的方法:

Node appendChild(Node newChild) 
          將節點 newChild 添加到此節點的子節點列表的末尾。 
Node removeChild(Node oldChild) 
          從子節點列表中移除 oldChild 所指示的子節點,並將其返回。 
 Node getParentNode() 
          此節點的父節點。
String getTextContent() 
          此屬性返回此節點及其後代的文本內容。 
void setTextContent(String textContent) 
          此屬性返回此節點及其後代的文本內容。 


  在得到的NodeList集合中有下列方法可以實現遍歷:

int getLength() 
          列表中的節點數。 
 Node item(int index) 
          返回集合中的第 index 個項。 

 在對Document對象進行更新操作時,都是在記憶體中進行的。如果想要更直觀地顯示在XML文檔中,需要進行回寫操作。即:把Document對象又重新寫入到XML文件中。

示例:

現有一個XML文檔內容如下:

 

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>貝多芬</音樂家>
        
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

 

 

 

需求:將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克

代碼如下:

package com.alex;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

/*
 * 將第一個<草帽海賊團>下麵的<音樂家>內容貝多芬改為布魯克
 */
public class OnePieceTest3 {
    public static void main(String[] args) throws Exception {
        // 創建解析器
        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
        // 解析目標XML文件
        Document document = documentBuilder.parse("src/OnePiece.xml");

        // 獲得目標元素集合
        NodeList list = document.getElementsByTagName("草帽海賊團");

        Node node = list.item(0);
        NodeList childNodes = node.getChildNodes();
        for (int j = 0; j < childNodes.getLength(); j++) {
            Node node2 = childNodes.item(j);
            String nodeName = node2.getNodeName();
            if (nodeName.equals("音樂家"))
                node2.setTextContent("布魯克");
        }
        // 回寫
        // 創建轉換器
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));
    }
}

 修改後XML文檔內容如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海賊王>
    <草帽海賊團>
        <船長>路飛</船長>
        <廚師>山治</廚師>
        <航海士>娜美</航海士>
        <船醫>喬巴</船醫>
        <音樂家>布魯克</音樂家>
    </草帽海賊團>
    <草帽海賊團>
        <副船長>索隆</副船長>
        <考古學家>羅賓</考古學家>
        <狙擊手>烏索普</狙擊手>
        <船工>弗蘭奇</船工>
    </草帽海賊團>
</海賊王>

 

2019-04-05

   


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、概念: 變數是指記憶體中的一個存儲區域,該區域要有自己的名稱(變數名)、類型(數據類型),該區域的數據可以在同一數據類型的範圍內不斷變化值; 二、變數的使用註意事項: 1、Java中的變數必須聲明後才能進行使用。 2、變數的作用域:在一對{}中為有效區間。 3、需要進行初始化後才能使用變數。 三、 ...
  • 安裝rabbit後,啟動服務,瀏覽器打開控制台找不到。查百度說是要裝插件。翻了好幾篇都是互相抄,沒有能用到。 多翻了幾篇終於找到一個靠譜的。可以打開控制台了。記錄下: 首先要安裝Erlang語言支持,我用的是 安裝完Erlang後,需要配置環境變數 再配置path變數 安裝rabbit。安裝路徑不要 ...
  • 背景 公司項目有個需求, 前端上傳excel文件, 後端讀取數據、處理數據、返回錯誤數據, 最簡單的方式同步處理, 客戶端上傳文件後一直阻塞等待響應, 但用戶體驗無疑很差, 處理數據可能十分耗時, 沒人願意傻等, 由於項目暫未使用ActiveMQ等消息隊列中間件, 而redis的lpush和rpop ...
  • 以腦圖的形式來展示Java集合知識,讓零碎知識點形成體系 Iterator 對比 Iterator(迭代器)是一種設計模式,是一個對象,用於遍歷集合中的所有元素。 Iterator 包含四個方法,分別是:next()、hasNext()、remove()、forEachRemaining(Consu ...
  • 1.正則表達式的作用:分割,查找,匹配,替換 字元串 2.分隔符:正斜線(/),hash符(#)以及取反符號(~)。 3.通用原子:\d \D \s \S \w \W 4.原子符 5. 模式修正符 6.後向引用 7.貪婪模式 8.正則表達式PCRE函數 prge_match(), preg_matc ...
  • 給定一個字元串 (s) 和一個字元模式 (p) ,實現一個支持 '?' 和 '*' 的通配符匹配。'?' 可以匹配任何單個字元。'*' 可以匹配任意字元串(包括空字元串)。兩個字元串完全匹配才算匹配成功。 說明:s 可能為空,且只包含從 a-z 的小寫字母。p 可能為空,且只包含從 a-z 的小寫字 ...
  • 最新的dubbo和zookeeper整合的問題 生活本不易,流人遂自安 博主最新在做小項目練手,在進行dubbo和zookeeper整合的時候遇到了一些問題,在這裡這些問題做個小總結吧。 首先需要說明的是,這次使用的都是 最新的版本 。過一下我自己的配置,dubbo 2.6.6,zookeeper ...
  • 第四節 數據類型(列表、元祖) 今日內容 列表 元祖 1、列表 1.格式 2.公共方法 1.len 計算長度 2.索引 輸出某一個元素 3.切片 輸出某一段元素 4.修改(字元串/數字/布爾除外) 5.步長 選取列表中第幾個元素 6.for迴圈 註意:for和while的應用場景: 有窮盡優先使用f ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...