XML.01-語法簡介 文檔聲明 元素(標簽) 屬性 註釋 特殊字元 CDATA區域 處理指令 啥是XML? xml (Extensible Markup Language)可擴展的標記語言,顧名思義,XML最重要的兩個因素: 可擴展 標簽,可以自定義的標簽 XML可以看作是HTML的一個超集,但是 ...
啥是XML?
xml (Extensible Markup Language)可擴展的標記語言,顧名思義,XML最重要的兩個因素:
- 可擴展
- 標簽,可以自定義的標簽
XML可以看作是HTML的一個超集,但是,兩者設計的目的是不一樣的. HTML的設計目的是顯示信息,而XML的設計目的是傳輸信息.
XML幹啥使
- 用來結構化描述有關係的數據
- XML可以用來把數據從HTML中分離出來
- XML可以更好的在異構系統之間傳輸數據
- XML還大量的被應用於軟體的配置文件
XML現有版本
XML目前有1.0 和1.1 兩個版本,但是1.1不向後相容1.0,所以大家基本還是在用1.0
XML文件可以分為以下幾部分內容:
- 文檔聲明
- 元素
- 屬性
- 註釋
- CDATA區
- 處理指令(PI)
文檔聲明
<?xml version="1.0" encoding="UFT-8" ?>
- 文檔聲明必須出現在xml的第一行位置.
- 屬性:
- version=”1.0” xml的版本
- encoding=”UTF-8” 編碼集
- standalone=”[yes|no]” 代表xml是否可以獨立,其實也不寫都可以引入外部文件.
亂碼問題,要保證保存和打開的編碼方式一致(我一直的解決方案就是永遠UTF-8…)
元素(標簽)
元素指的是XML文件中出現的標簽,標簽分為起始和結束.
- 開始和結束標簽
- 包含標簽主體:
<abc>文本</abc>
- 不包含標簽主體:
<abc/>
- 包含標簽主體:
- 標簽不能交叉嵌套
- 只能有且必須有一個根元素
元素的命名規範:
- 大小寫敏感
- 不能以數字或-開頭
- 不能以xml開頭
- 不能有空格和冒號
- 不可以包含冒號和空格
- 不能以xml開頭(大小寫都不行)
屬性
一個元素可以有多個屬性,屬性應該有自己的名字和值.比如<mytag name="value">
- 在同一元素上不能有相同的屬性
- 屬性必須用引號(單引號或者雙引號)
- 屬性可以自定義,並且命名規範與元素一致
XML中的屬性很多時候是可以被轉換成元素的. 比如
<person sex="male">
<name>Brady</name>
</person>
完全可以寫成
<person>
<sex>male</sex>
<name>Brady</name>
</person>
那麼,什麼時候使用屬性,什麼時候使用標簽呢? W3Cschool上那大哥說,儘量把看起來像數據的都用標簽表示.為什麼呢?
- 屬性無法包含多重值(複雜結構),BUT!!!元素可以!!!
- 屬性不能描述樹狀結構,BUT!!!元素可以!!!
- 屬性不易擴展,BUT!!!元素可以!!!
- 屬性難以閱讀和維護,BUT!!!元素可以!!!
看一個例子,比如要修改下麵這個XML,使它更合理,那麼有三種寫法
<note date="08/08/2008">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
普通寫法:
<note>
<date>08/08/2008</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
文藝寫法:
<note>
<date>
<day>08</day>
<month>08</month>
<year>2008</year>
</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
二逼寫法:
<note day="08" month="08" year="2008"
to="George" from="John" heading="Reminder"
body="Don't forget the meeting!">
</note>
上面說把所有看起來像數據的都用標簽,那我看起來所有玩意兒都像數據咋整…
看下麵這個例子:
<messages>
<note id="501">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
<note id="502">
<to>John</to>
<from>George</from>
<heading>Re: Reminder</heading>
<body>I will not</body>
</note>
</messages>
這裡就是用了id來作為屬性. 所以這麼說,元數據(用於修飾數據的數據)應當作為屬性來使用,而數據本身應該存儲為元素.
註釋
- 和HTML的註釋,一毛一樣
<!-- -->
- 註釋不能嵌套
特殊字元
- <
<
- >
>
- &
&
- ”
quot;
- ’
'
CDATA區域
PCDATA區域值的是被解析的字元數據,(Parsed Character Data)
CDATA區域中的文本會被解析器忽略,也就是說CDATA區域的字元串僅僅就是個字元串不會被作為XML解析.
<![CDATA[
內容會被看作字元串
]]>
CDATA區域的作用:
在XML中的< 和&是非法的,可以通過轉義字元來解決,但是如果一個文本區域出現大量的類似字元,轉義字元就很麻煩.
這時候可以使用CDATA區域來解決這個問題.
處理指令
處理指令,簡稱PI(Processing Instruction),是用來指揮軟體如何解析XML文檔的.被<? ?>
包裹起來的就是PI,比如前面說到的XML文檔聲明其實就是一個PI.
這個貌似用處不是很大…不想看了