XML處理_ZenDei技術網路在線

XML處理

-Advertisement-

1）CDATA部分用<![CDATA[和]]>來限定其界限，它們是字元數據的一種特殊形式，可用使用它們來囊括那些含有<、>，&之類字元的字元串，而不必將它們解釋為標記例如：<![CDATA[<]]>，另外需要註意的是CDATA部分不能包含字元串]]>。 2）處理指令（processing instr ...

1）CDATA部分用<![CDATA[和]]>來限定其界限，它們是字元數據的一種特殊形式，可用使用它們來囊括那些含有<、>，&之類字元的字元串，而不必將它們解釋為標記例如：<![CDATA[<]]>，另外需要註意的是CDATA部分不能包含字元串]]>。

2）處理指令（processing instruction）專門處理XML文檔的應用程式中使用的指令，它們用<?和?>來限定其界限。例如：<?xml version="1.0"?>。

3）註釋 使用限定其界限。

4）解析XML文檔有兩種類型的解析器一種是樹形解析器（DOM），另外一種流機制解析器（SAX），首先介紹樹形解析器。

包名：org.w3c.dom

DOM解析器的介面已經被W3C標準化，org.w3c.dom包包含瞭解析時用各種對象以及方法。解析xml文檔首先要創建Document對象，如何創建請看例子：

        DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
        DocumentBuilder builder=factory.newDocumentBuilder();
        Document doc=builder.parse(f);

parse方法中的參數可以是文件或者是流，可以通過調用getDocumentElement方法獲取xml文檔的根元素，調用getTagName()獲取元素的名字，getChildNodes()獲取節點列表NodeList，調用getTextContent()獲取元素的文本值。

例子：

        //根元素
        Element root=doc.getDocumentElement();
        // 返回節點的集合
        NodeList nodeList=root.getChildNodes();
        // 返回集合中子節點數
        int count=nodeList.getLength();
        //獲取元素的名字
        String rootName=root.getTagName();
        //獲取元素的文本值包括其子元素
        String rootText=root.getTextContent();

可用instanceof判斷節點是否是元素，由於Text類型的節點是終結節點，可以用getData獲取Text節點中的字元串，對getData返回的值最好調用trim方法，過濾掉空字元。

        for (int i = 0; i < nodeList.getLength(); i++) {
            //獲取單個節點
            Node childNode = nodeList.item(i);
            //判斷是否是元素，
            if (childNode instanceof Element) {
                Element element = (Element) childNode;
                //childNode只有一個子節點且子節點是Text類型的 例子：<name>zhangsan<name>
                //Text節點是指的"zhangsan"節點
                Text textNode = (Text) element.getFirstChild();
                //調用getData獲取其文本值
                String textString = textNode.getData().trim();
            }
            else{
                // TODO 其他處理
            }

5）XPath定位信息

包名：javax.xml.xpath.XPath

獲取XML文檔中某一節點的值，如果遍歷整個DOM樹的節點來查找比較麻煩的，但是使用XPath語言可以輕鬆的得到指定的節點值或屬性值。

XPath可以描述XML文檔中一個節點的集，例如，XPath：/gridbag/row，描述了根元素gridbag的子元素中所有的row元素，可以用[]操作符來選擇特定的元素：/gridbag/row[1]這表示的是第一行（索引號從1開始），使用@操作符可以獲得屬性值，例如：/gridbag/row[1]/@anchor，獲取第一行row元素屬性anchor的值。

XPath表達式是如何創建和使用的，接下來看一段代碼就會明白了：

        XPathFactory xPathFactory=XPathFactory.newInstance();
        XPath xPath=xPathFactory.newXPath();
        //evaluate 返回的是字元串，所以很適合用來獲取文本值
        String value= xPath.evaluate("/gridbag/row[1]", doc);

evaluate第一個參數XPath表達式，第二參數是DOM對象。

6）流機制解析器

包名：javax.xml.stream

StAX解析器是一種“拉解析器（pull parser）”，使用下麵的基本迴圈來迭代所有的事件即可：

        InputStream in=new FileInputStream("G:\\test.xml");
        XMLInputFactory factory=XMLInputFactory.newInstance();
        XMLStreamReader parser=factory.createXMLStreamReader(in);
        while (parser.hasNext()) {
            // event 對應事件的值
            int event=parser.next();
            // 元素 處理
            if (event==XMLStreamConstants.START_ELEMENT) {
　　　　　　　　　String elementNameString=parser.getLocalName();// 元素名稱
　　　　　　　　　String elementValueString=parser.getText();// 元素值
// TODO

            }
            // Call parser methods obtain event details            
        }

7）生成XML文檔

//TODO...

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

鏈表

與順序表相同，鏈表也是一種線性表，它的數據邏輯組織形式是一維的。而與順序表不同的是，鏈表的物理存儲結構是用一組地址任意的存儲單元存儲數據的。也就是說，它不像鏈表一樣占據一段連續的記憶體空間，而是將存儲單元分散在記憶體的任意地址上。在鏈表結構中，每一個數據元素記錄都存放在鏈表的一個結點中（node）,而每 ...
java泛型探索——小特性

泛型特性（小篇幅） 1. 補充介紹一些常見的泛型特性：類型參數T可以是recursive（類似遞歸性），它的邊界可以是類型參數是自身的介面或類。如我實現尋找最大值的方法，可以這麼寫: 泛型多邊界（Multiple Bounds） 2. Bridges特性對於泛型介面而言，如Comparable ...
Leetcode: 30. Substring with Concatenation of All Words

You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a conca... ...
資料庫連接池兩種配置方式詳解

資料庫連接池: 負責分配、管理和釋放資料庫連接，它允許應用程式重覆使用一個現有的資料庫連接，而再不是重新建立一個；釋放空閑時間超過最大空閑時間的資料庫連接來避免因為沒有釋放資料庫連接而引起的資料庫連接遺漏；資料庫連接池原理: 連接池基本的思想是在系統初始化的時候，將資料庫連接作為對象存儲在記憶體中，當 ...
P3379 【模板】最近公共祖先（LCA）

題目描述如題，給定一棵有根多叉樹，請求出指定兩個點直接最近的公共祖先。輸入輸出格式輸入格式：第一行包含三個正整數N、M、S，分別表示樹的結點個數、詢問的個數和樹根結點的序號。接下來N-1行每行包含兩個正整數x、y，表示x結點和y結點之間有一條直接連接的邊（數據保證可以構成樹）。接下來M行 ...
python3中各個字元編碼的轉換

a='我很好' ####python3 預設的編碼為unicode###unicode>gb2312unicode_gb2312=a.encode('gb2312') ###因為預設是unicode所以不需要decode()，直接encode成想要轉換的編碼如gb2312print('我的gb231 ...
C++預處理命令

預處理語句是由一系列和預處理相關的命令符組成的.預處理語句以#作為起始標記,其後緊跟預處理命令關鍵字,之後是空格,空格之後是預處理命令的內容.C++提供多種預處理功能,如巨集定義,文件包括,條件編譯等. #define 在這個教程的開頭我們已經提到了一種預處理指令： #define ，可以被用來生成巨集 ...
SpringBoot配置devtools實現熱部署

spring為開發者提供了一個名為spring boot devtools的模塊來使Spring Boot應用支持熱部署，提高開發者的開發效率，無需手動重啟Spring Boot應用。 devtools的原理深層原理是使用了兩個ClassLoader，一個Classloader載入那些不會改變的類 ...