XML.01-語法簡介

来源:http://www.cnblogs.com/thecatcher/archive/2016/12/25/6220675.html
-Advertisement-
Play Games

XML.01-語法簡介 文檔聲明 元素(標簽) 屬性 註釋 特殊字元 CDATA區域 處理指令 啥是XML? xml (Extensible Markup Language)可擴展的標記語言,顧名思義,XML最重要的兩個因素: 可擴展 標簽,可以自定義的標簽 XML可以看作是HTML的一個超集,但是 ...


 

 

 

啥是XML?
xml (Extensible Markup Language)可擴展的標記語言,顧名思義,XML最重要的兩個因素:

  • 可擴展
  • 標簽,可以自定義的標簽

XML可以看作是HTML的一個超集,但是,兩者設計的目的是不一樣的. HTML的設計目的是顯示信息,而XML的設計目的是傳輸信息.

XML幹啥使

  • 用來結構化描述有關係的數據
  • XML可以用來把數據從HTML中分離出來
  • XML可以更好的在異構系統之間傳輸數據
  • XML還大量的被應用於軟體的配置文件

XML現有版本
XML目前有1.0 和1.1 兩個版本,但是1.1不向後相容1.0,所以大家基本還是在用1.0

XML文件可以分為以下幾部分內容:

  • 文檔聲明
  • 元素
  • 屬性
  • 註釋
  • CDATA區
  • 處理指令(PI)

文檔聲明

  • <?xml version="1.0" encoding="UFT-8" ?>
  • 文檔聲明必須出現在xml的第一行位置.
  • 屬性:
    • version=”1.0” xml的版本
    • encoding=”UTF-8” 編碼集
    • standalone=”[yes|no]” 代表xml是否可以獨立,其實也不寫都可以引入外部文件.

亂碼問題,要保證保存和打開的編碼方式一致(我一直的解決方案就是永遠UTF-8…)

 

元素(標簽)

元素指的是XML文件中出現的標簽,標簽分為起始和結束.

  • 開始和結束標簽
    • 包含標簽主體:<abc>文本</abc>
    • 不包含標簽主體: <abc/>
  • 標簽不能交叉嵌套
  • 只能有且必須有一個根元素

元素的命名規範:

  • 大小寫敏感
  • 不能以數字或-開頭
  • 不能以xml開頭
  • 不能有空格和冒號
  • 不可以包含冒號和空格
  • 不能以xml開頭(大小寫都不行)

屬性

一個元素可以有多個屬性,屬性應該有自己的名字和值.比如<mytag name="value">

  • 在同一元素上不能有相同的屬性
  • 屬性必須用引號(單引號或者雙引號)
  • 屬性可以自定義,並且命名規範與元素一致

XML中的屬性很多時候是可以被轉換成元素的. 比如

<person sex="male">
<name>Brady</name>
</person>

完全可以寫成

<person>
<sex>male</sex>
<name>Brady</name>
</person>

那麼,什麼時候使用屬性,什麼時候使用標簽呢? W3Cschool上那大哥說,儘量把看起來像數據的都用標簽表示.為什麼呢?

  • 屬性無法包含多重值(複雜結構),BUT!!!元素可以!!!
  • 屬性不能描述樹狀結構,BUT!!!元素可以!!!
  • 屬性不易擴展,BUT!!!元素可以!!!
  • 屬性難以閱讀和維護,BUT!!!元素可以!!!

看一個例子,比如要修改下麵這個XML,使它更合理,那麼有三種寫法

<note date="08/08/2008">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

普通寫法:

<note>
<date>08/08/2008</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

文藝寫法:

<note>
<date>
<day>08</day>
<month>08</month>
<year>2008</year>
</date>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

二逼寫法:

<note day="08" month="08" year="2008"
to="George" from="John" heading="Reminder"
body="Don't forget the meeting!">

</note>

上面說把所有看起來像數據的都用標簽,那我看起來所有玩意兒都像數據咋整…

看下麵這個例子:

<messages>
<note id="501">
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
<note id="502">
<to>John</to>
<from>George</from>
<heading>Re: Reminder</heading>
<body>I will not</body>
</note>
</messages>

這裡就是用了id來作為屬性. 所以這麼說,元數據(用於修飾數據的數據)應當作為屬性來使用,而數據本身應該存儲為元素.

註釋

  • 和HTML的註釋,一毛一樣 <!-- -->
  • 註釋不能嵌套

特殊字元

  • < &lt;
  • > &gt;
  • & &amp;
  • quot;
  • &apos;

CDATA區域

PCDATA區域值的是被解析的字元數據,(Parsed Character Data)
CDATA區域中的文本會被解析器忽略,也就是說CDATA區域的字元串僅僅就是個字元串不會被作為XML解析.

<![CDATA[
內容會被看作字元串
]]>

CDATA區域的作用:
在XML中的< 和&是非法的,可以通過轉義字元來解決,但是如果一個文本區域出現大量的類似字元,轉義字元就很麻煩.
這時候可以使用CDATA區域來解決這個問題.

處理指令

處理指令,簡稱PI(Processing Instruction),是用來指揮軟體如何解析XML文檔的.被<? ?>包裹起來的就是PI,比如前面說到的XML文檔聲明其實就是一個PI.
這個貌似用處不是很大…不想看了

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 概要:在使用storm分散式計算框架進行數據處理時,如何保證進入storm的消息的一定會被處理,且不會被重覆處理。這個時候僅僅開啟storm的ack機制並不能解決上述問題。那麼該如何設計出一個好的方案來解決上述問題? 現有架構背景:本人所在項目組的實時系統負責為XXX的實時產生的交易記錄進行處理,根 ...
  • 圖片素材: ...
  • E瀏覽器不相容的時候 註意:當在IE中時,日期會錯位一行,解決:帶有span的日期放在新聞標題的前面; 即原來新聞題目hfdfdj2014-5-30, 改成2014-5-30新聞題目hfdfdj 浮動元素先寫在前面,以免元素錯位一行 ...
  • 對象: 一切皆為對象。對象包括兩部分內容:屬性(名詞形容詞),行為(動詞)。對象和對象之間是有關係的: 派生,關聯,依賴。 類: 對同一類別的眾多對象的一種抽象。類,還是用來生成對象的一種模板,對象是類的一種具體化的表現。 面向對象的三大特性:封裝,繼承,多態。 class 類名{訪問修飾符 成員變 ...
  • Python內嵌的集合類型有list、tuple、set、dict。 列表list:看似數組,但比數組強大,支持索引、切片、查找、增加等功能。 元組tuple:功能跟list差不多,但一旦生成,長度及元素都不可變(元素的元素還是可變),似乎就是一更輕量級、安全的list。 字典dict:鍵值對結構哈 ...
  • 流程式控制制 --道心 輸入用戶名,進行判斷 name=input("請輸入用戶名:") #值對比,記憶體地址對比(值相同,記憶體不必相同) if name =="daoxin": print("登陸成功") else: print("登陸失敗") 輸入用戶名和密碼進行判斷: import getpass ...
  • 信號與槽可以通過使用手寫代碼顯式的實現關聯 ,也可以運用 QMetaObject 類規定的槽 函數命名範式來實現自動關聯。 我們只需按照下麵的標準格式定 義槽函數,這之後,uic 將會根據 QMetaObject 類制定的規則,生成界面實體類的 setupUi() 函數的內容,並完成信號與槽的關聯... ...
  • 我們都知道,申請的資源,使用完畢後要釋放。但是這個釋放動作,一定要註意。 舉個例子,很多人動態分配的資源,在使用之後,往往直接調用了delete,而不管申請資源的時候用的是new還是new[]。 如下: #include using namespace std; int main(){ int *p... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...