XML總結_ZenDei技術網路在線

1. XML 基本概念擴展標記語言 (Extensible Markup Language, XML) ，用於標記電子文件使其具有結構性的標記語言，可以用來標記數據、定義數據類型，是一種允許用戶對自己的標記語言進行定義的源語言。格式統一，跨平臺和語言，早已成為業界公認的標準。 *xml數據（文檔） ...

1. XML 基本概念

擴展標記語言 (Extensible Markup Language, XML) ，用於標記電子文件使其具有結構性的標記語言，可以用來標記數據、定義數據類型，是一種允許用戶對自己的標記語言進行定義的源語言。格式統一，跨平臺和語言，早已成為業界公認的標準。

*xml數據（文檔）自上而下的樹形結構

*<root>.....</root>（一個完整的節點),root節點的名稱(標題) 中間的(....)為節點的內容

*每個xml文檔只有一個根節點(樹形結構中最外層的節點)

*xml文檔（數據）由多個節點組成(根節點->子節點->子節點....)

2. 與JSON的比較

JSON(JavaScript Object Notation)一種輕量級的數據交換格式，具有良好的可讀和便於快速編寫的特性。可在不同平臺之間進行數據交換。

A. XML 格式統一，符合標準，可讀性強；JSON 格式簡單，一般都是壓縮的，可讀性差些。

B. XML 文件龐大，占用帶寬多；JSON 因是壓縮的格式，帶寬少；

C. XML解析需要花較多的資源和時間；JSON 易於解析。

目前大部分的應用中採用JSON傳輸數據較多。

3. XML 解析

解析 XML 通常有兩種方式，DOM 和 SAX：

DOM解析XML時，讀入整個XML文檔並構建一個駐留記憶體的樹結構（節點樹），通過遍歷樹結構可以檢索任意XML節點，讀取它的屬性和值。而且通常情況下，可以藉助XPath，直接查詢XML節點。
SAX解析XML，是基於事件通知的模式，一邊讀取XML文檔一邊處理，不必等整個文檔載入完之後才採取操作，當在讀取解析過程中遇到需要處理的對象，會發出通知對其進行處理。

——————————————————————————————————————

XPath即為XML路徑語言，它是一種用來確定xml文檔中某部分位置的語言。XPath基於XML的樹狀結構，提供在數據結構樹中找尋節點的能力。

節點（Node）

在 XPath 中，有七種類型的節點：元素、屬性、文本、命名空間、處理指令、註釋以及文檔（根）節點。XML 文檔是被作為節點樹來對待的。樹的根被稱為文檔節點或者根節點。

請看下麵這個 XML 文檔：

<?xml version="1.0" encoding="ISO-8859-1"?>

<book>

<title lang="中文">ios開髮指南r</title>

</book>

<book>

<title lang="中文">ios開髮指南r</title>

</book>

</bookstore>

<otherroot>……這裡絕對不能有第二個根節點</otherroot>

上面的XML文檔中的節點例子：

<bookstore> （文檔節點,也叫根節點）

<author>北京</author> （元素節點）

lang="en" （屬性節點）

基本值（或稱原子值，Atomic value）

基本值是無父或無子的節點。

基本值的例子：

北京

"中文"

項目（Item）

項目是基本值或者節點。

節點關係

父（Parent）

每個元素以及屬性都有一個父。

在下麵的例子中，book 元素是 title、author、year 以及 price 元素的父：

<book>

<title lang="中文">ios開髮指南r</title>

</book>

子（Children）

元素節點可有零個、一個或多個子。

在下麵的例子中，title、author、year 以及 price 元素都是 book 元素的子：

<book>

<title lang="中文">ios開髮指南r</title>

</book>

同胞/兄弟（Sibling）

擁有相同的父的節點

在下麵的例子中，title、author、year 以及 price 元素都是同胞：

<book>

<title lang="中文">ios開髮指南r</title>

</book>

先輩（Ancestor）

某節點的父、父的父，等等。

在下麵的例子中，title 元素的先輩是 book 元素和 bookstore 元素：

<book>

<title lang="中文">ios開髮指南r</title>

</book>

</bookstore>

後代（Descendant）

某個節點的子，子的子，等等。

在下麵的例子中，bookstore 的後代是 book、title、author、year 以及 price 元素：

<book>

<title lang="中文">ios開髮指南r</title>

</book>

</bookstore>

//xPath語法

XML 實例文檔

我們將在下麵的例子中使用這個 XML 文檔。

<?xml version="1.0" encoding="ISO-8859-1"?>

<book>

<title lang="eng">Harry Potter</title>

</book>

<book>

<title lang="eng">Learning XML</title>

</book>

<title lang="eng">Learning XML</title>

</bookstore>

選取節點

XPath 使用路徑表達式在 XML 文檔中選取節點。節點是通過沿著路徑或者 step 來選取的。

下麵列出了最有用的路徑表達式：

表達式描述

nodename 選取此節點的所有子節點。

/ 從根節點選取。

// 從匹配選擇的當前節點選擇文檔中的節點，而不考慮它們的位置。

. 選取當前節點。

.. 選取當前節點的父節點。

@ 選取屬性。

實例

在下麵的表格中，我們已列出了一些路徑表達式以及表達式的結果：

路徑表達式結果

bookstore 選取 bookstore 元素的所有子節點。

/bookstore 選取根元素 bookstore。

註釋：假如路徑起始於正斜杠( / )，則此路徑始終代表到某元素的絕對路徑！

bookstore/book 選取屬於 bookstore 的子元素的所有 book 元素。

//book 選取所有 book 子元素，而不管它們在文檔中的位置。

bookstore//book 選擇屬於 bookstore 元素的後代的所有 book 元素，而不管它們位於 bookstore 之下的什麼位置。

//@lang 選取名為 lang 的所有屬性。

謂語（Predicates）

謂語用來查找某個特定的節點或者包含某個指定的值的節點。

謂語被嵌在方括弧中。

實例

在下麵的表格中，我們列出了帶有謂語的一些路徑表達式，以及表達式的結果：

路徑表達式結果

/bookstore/book[1] 選取屬於 bookstore 子元素的第一個 book 元素。

/bookstore/book[last()] 選取屬於 bookstore 子元素的最後一個 book 元素。

/bookstore/book[last()-1] 選取屬於 bookstore 子元素的倒數第二個 book 元素。

/bookstore/book[position()<3] 選取最前面的兩個屬於 bookstore 元素的子元素的 book 元素。

//title[@lang] 選取所有擁有名為 lang 的屬性的 title 元素。

//title[@lang='eng'] 選取所有 title 元素，且這些元素擁有值為 eng 的 lang 屬性。

/bookstore/book[price>35.00] 選取 bookstore 元素的所有 book 元素，且其中的 price 元素的值須大於 35.00。

/bookstore/book[price>35.00]/title 選取 bookstore 元素中的 book 元素的所有 title 元素，且其中的 price 元素的值須大於 35.00。

選取未知節點

XPath 通配符可用來選取未知的 XML 元素。

通配符描述

* 匹配任何元素節點。

@* 匹配任何屬性節點。

node() 匹配任何類型的節點。

實例

在下麵的表格中，我們列出了一些路徑表達式，以及這些表達式的結果：

路徑表達式結果

/bookstore/* 選取 bookstore 元素的所有子元素。

//* 選取文檔中的所有元素。

//title[@*] 選取所有帶有屬性的 title 元素。

//節點中的屬性不能有重名的

選取若幹路徑

通過在路徑表達式中使用“|”運算符，您可以選取若幹個路徑。

實例

在下麵的表格中，我們列出了一些路徑表達式，以及這些表達式的結果：

路徑表達式結果

//book/title | //book/price 選取 book 元素的所有 title 和 price 元素。

//title | //price 選取文檔中的所有 title 和 price 元素。

/bookstore/book/title | //price 選取屬於 bookstore 元素的 book 元素的所有 title 元素，以及文檔中所有的 price 元素。

—————————————————————————————————————

－XML 解析庫

－－iOS 自帶的兩種：

NSXMLParser -Sax方式解析，需實現其代理協議方法，較為簡單。

libxml2 底層庫，可邊讀邊解析，基於c,同時支持DOM,SAX, 解析效率高。

－－常用第三方庫：

KissXML, GDataXML