XML處理

来源:http://www.cnblogs.com/ysp99/archive/2017/05/09/6832354.html
-Advertisement-
Play Games

1)CDATA部分用<![CDATA[和]]>來限定其界限,它們是字元數據的一種特殊形式,可用使用它們來囊括那些含有<、>,&之類字元的字元串,而不必將它們解釋為標記例如:<![CDATA[<]]>,另外需要註意的是CDATA部分不能包含字元串]]>。 2)處理指令(processing instr ...


1)CDATA部分用<![CDATA[和]]>來限定其界限,它們是字元數據的一種特殊形式,可用使用它們來囊括那些含有<、>,&之類字元的字元串,而不必將它們解釋為標記例如:<![CDATA[<]]>,另外需要註意的是CDATA部分不能包含字元串]]>。

2)處理指令(processing instruction)專門處理XML文檔的應用程式中使用的指令,它們用<?和?>來限定其界限。例如:<?xml version="1.0"?>。

3)註釋 使用<!--和-->限定其界限。

4)解析XML文檔有兩種類型的解析器一種是樹形解析器(DOM),另外一種流機制解析器(SAX),首先介紹樹形解析器。

包名:org.w3c.dom

DOM解析器的介面已經被W3C標準化,org.w3c.dom包包含瞭解析時用各種對象以及方法。解析xml文檔首先要創建Document對象,如何創建請看例子:

        DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
        DocumentBuilder builder=factory.newDocumentBuilder();
        Document doc=builder.parse(f);

parse方法中的參數可以是文件或者是流,可以通過調用getDocumentElement方法獲取xml文檔的根元素,調用getTagName()獲取元素的名字,getChildNodes()獲取節點列表NodeList,調用getTextContent()獲取元素的文本值。

例子:

        //根元素
        Element root=doc.getDocumentElement();
        // 返回節點的集合
        NodeList nodeList=root.getChildNodes();
        // 返回集合中子節點數
        int count=nodeList.getLength();
        //獲取元素的名字
        String rootName=root.getTagName();
        //獲取元素的文本值包括其子元素
        String rootText=root.getTextContent();

可用instanceof判斷節點是否是元素,由於Text類型的節點是終結節點,可以用getData獲取Text節點中的字元串,對getData返回的值最好調用trim方法,過濾掉空字元。

        for (int i = 0; i < nodeList.getLength(); i++) {
            //獲取單個節點
            Node childNode = nodeList.item(i);
            //判斷是否是元素,
            if (childNode instanceof Element) {
                Element element = (Element) childNode;
                //childNode只有一個子節點且子節點是Text類型的 例子:<name>zhangsan<name>
                //Text節點是指的"zhangsan"節點
                Text textNode = (Text) element.getFirstChild();
                //調用getData獲取其文本值
                String textString = textNode.getData().trim();
            }
            else{
                // TODO 其他處理
            }

5)XPath定位信息

包名:javax.xml.xpath.XPath

獲取XML文檔中某一節點的值,如果遍歷整個DOM樹的節點來查找比較麻煩的,但是使用XPath語言可以輕鬆的得到指定的節點值或屬性值。

XPath可以描述XML文檔中一個節點的集,例如,XPath:/gridbag/row,描述了根元素gridbag的子元素中所有的row元素,可以用[]操作符來選擇特定的元素:/gridbag/row[1]這表示的是第一行(索引號從1開始),使用@操作符可以獲得屬性值,例如:/gridbag/row[1]/@anchor,獲取第一行row元素屬性anchor的值。

XPath表達式是如何創建和使用的,接下來看一段代碼就會明白了:

        XPathFactory xPathFactory=XPathFactory.newInstance();
        XPath xPath=xPathFactory.newXPath();
        //evaluate 返回的是字元串,所以很適合用來獲取文本值
        String value= xPath.evaluate("/gridbag/row[1]", doc);

evaluate第一個參數XPath表達式,第二參數是DOM對象。

6)流機制解析器

包名:javax.xml.stream

StAX解析器是一種“拉解析器(pull parser)”,使用下麵的基本迴圈來迭代所有的事件即可:

        InputStream in=new FileInputStream("G:\\test.xml");
        XMLInputFactory factory=XMLInputFactory.newInstance();
        XMLStreamReader parser=factory.createXMLStreamReader(in);
        while (parser.hasNext()) {
            // event 對應事件的值
            int event=parser.next();
            // 元素 處理
            if (event==XMLStreamConstants.START_ELEMENT) {
         String elementNameString=parser.getLocalName();// 元素名稱
         String elementValueString=parser.getText();// 元素值
// TODO
            }
            // Call parser methods obtain event details            
        }

7)生成XML文檔

//TODO...


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 與順序表相同,鏈表也是一種線性表,它的數據邏輯組織形式是一維的。而與順序表不同的是,鏈表的物理存儲結構是用一組地址任意的存儲單元存儲數據的。也就是說,它不像鏈表一樣占據一段連續的記憶體空間,而是將存儲單元分散在記憶體的任意地址上。在鏈表結構中,每一個數據元素記錄都存放在鏈表的一個結點中(node),而每 ...
  • 泛型特性(小篇幅) 1. 補充介紹一些常見的泛型特性: 類型參數T可以是recursive(類似遞歸性),它的邊界可以是類型參數是自身的介面或類。 如我實現尋找最大值的方法,可以這麼寫: 泛型多邊界(Multiple Bounds) 2. Bridges特性 對於泛型介面而言,如Comparable ...
  • You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a conca... ...
  • 資料庫連接池: 負責分配、管理和釋放資料庫連接,它允許應用程式重覆使用一個現有的資料庫連接,而再不是重新建立一個;釋放空閑時間超過最大空閑時間的資料庫連接來避免因為沒有釋放資料庫連接而引起的資料庫連接遺漏;資料庫連接池原理: 連接池基本的思想是在系統初始化的時候,將資料庫連接作為對象存儲在記憶體中,當 ...
  • 題目描述 如題,給定一棵有根多叉樹,請求出指定兩個點直接最近的公共祖先。 輸入輸出格式 輸入格式: 第一行包含三個正整數N、M、S,分別表示樹的結點個數、詢問的個數和樹根結點的序號。 接下來N-1行每行包含兩個正整數x、y,表示x結點和y結點之間有一條直接連接的邊(數據保證可以構成樹)。 接下來M行 ...
  • a='我很好' ####python3 預設的編碼為unicode###unicode>gb2312unicode_gb2312=a.encode('gb2312') ###因為預設是unicode所以不需要decode(),直接encode成想要轉換的編碼如gb2312print('我的gb231 ...
  • 預處理語句是由一系列和預處理相關的命令符組成的.預處理語句以#作為起始標記,其後緊跟預處理命令關鍵字,之後是空格,空格之後是預處理命令的內容.C++提供多種預處理功能,如巨集定義,文件包括,條件編譯等. #define 在這個教程的開頭我們已經提到了一種預處理指令: #define ,可以被用來生成巨集 ...
  • spring為開發者提供了一個名為spring boot devtools的模塊來使Spring Boot應用支持熱部署,提高開發者的開發效率,無需手動重啟Spring Boot應用。 devtools的原理 深層原理是使用了兩個ClassLoader,一個Classloader載入那些不會改變的類 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...