XML Schema描述了 XML 文檔的結構。XML Schema語言也稱為 XML Schema Definition(XSD)。 <?xml version="1.0"?> <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"> <xs: ...
XML Schema描述了 XML 文檔的結構。XML Schema語言也稱為 XML Schema Definition(XSD)。
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
XML Schema的目的是定義 XML 文檔的合法構建塊
- 可以出現在文檔中的元素和屬性
- 子元素的數量(和順序)
- 元素和屬性的數據類型
- 元素和屬性的預設和固定值
為什麼要學習 XML Schema
在 XML 世界中,每天都在使用數百種標準化的 XML 格式。其中許多 XML 標準是由 XML Schema 定義的。XML Schema 是 DTD 的基於 XML 的(更強大的)替代品。
XML Schema支持數據類型
XML Schema的最大優勢之一是對數據類型的支持。
- 更容易描述文檔內容的合法性
- 更容易驗證數據的正確性
- 更容易定義數據約束(對數據的限制)
- 更容易定義數據模式(數據格式)
- 更容易在不同數據類型之間轉換數據
XML Schema使用 XML 語法
XML Schema的另一個強大之處在於它們是用 XML 編寫的。
- 無需學習新語言
- 可以使用 XML DOM 操縱模式
- 可以使用 XSLT 轉換模式
XML Schema是可擴展的,因為它們是用 XML 編寫的。使用可擴展的模式定義,您可以:
- 在其他模式中重用模式
- 從標準類型派生自己的數據類型
- 在同一文檔中引用多個模式
XML Schema保障數據通信
從發送方發送數據到接收方時,必須確保兩者對內容有相同的“期望”。使用 XML Schema,發送方可以以接收方能理解的方式描述數據。
例如,日期“03-11-2004”在某些國家可能被解釋為11月3日,在其他國家可能被解釋為3月11日。然而,具有這樣數據類型的 XML 元素:
<date type="date">2004-03-11</date>
確保了對內容的相互理解,因為 XML 數據類型“date”要求使用“YYYY-MM-DD”格式。
僅僅是格式正確是不夠的
格式良好的 XML 文檔是符合 XML 語法規則的文檔,例如:
- 必須以 XML 聲明開頭
- 必須有一個唯一的根元素
- 開始標簽必須有匹配的結束標簽
- 元素區分大小寫
- 所有元素必須關閉
- 所有元素必須正確嵌套
- 所有屬性值必須用引號括起來
- 特殊字元必須使用實體
即使文檔格式良好,它們仍然可能包含錯誤,而這些錯誤可能會產生嚴重的後果。考慮以下情況:您訂購了5大毛的激光印表機,而不是5台激光印表機。使用 XML Schema,大多數這類錯誤可以被驗證軟體捕捉到。
XSD如何使用
XML 文檔可以引用 DTD 或 XML Schema。
簡單的 XML 文檔
考慮這個簡單的 XML 文檔,名為"note.xml":
<?xml version="1.0"?>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
下麵的例子是一個名為"note.dtd"的 DTD 文件,定義了上面 XML 文檔("note.xml")的元素:
<!ELEMENT note (to, from, heading, body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
XML Schema
下麵的例子是一個名為"note.xsd"的 XML Schema 文件,定義了上面 XML 文檔("note.xml") 的元素:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="note">
<xs:complexType>
<xs:sequence>
<xs:element name="to" type="xs:string"/>
<xs:element name="from" type="xs:string"/>
<xs:element name="heading" type="xs:string"/>
<xs:element name="body" type="xs:string"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
note 元素是一個複雜類型,因為它包含其他元素。其他元素(to, from, heading, body)是簡單類型,因為它們不包含其他元素。
對 DTD 的引用
這個 XML 文檔引用了一個 DTD:
<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
對 XML Schema 的引用
XSD - <schema>
元素
<schema>
元素是每個 XML Schema 的根元素。
<schema>
元素
<schema>
元素是每個 XML Schema 的根元素:
指示 XML 實例文檔中使用的任何在此模式中聲明的元素必須是命名空間限定的。
在 XML 文檔中引用模式
這個 XML 文檔引用了一個 XML Schema:
<?xml version="1.0"?>
<note xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="note.xsd">
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
指定了預設命名空間聲明。該聲明告訴模式驗證器
一旦有了 XML Schema Instance 命名空間:
您就可以使用 schemaLocation
屬性。此屬性有兩個值,用空格分隔。第一個值是要使用的命名空間。第二個值是要用於該命名空間的 XML 模式的位置:
XSD 簡單元素
XML 模式定義了 XML 文件中的元素。
簡單元素是僅包含文本的 XML 元素。它不能包含任何其他元素或屬性。
什麼是簡單元素
簡單元素是僅包含文本的 XML 元素。它不能包含任何其他元素或屬性。
然而,“僅文本”限制相當具有誤導性。文本可以是許多不同類型之一。它可以是 XML 模式定義中包含的類型之一(布爾值、字元串、日期等),或者它可以是您自己定義的自定義類型。
您還可以向數據類型添加限制(facet)以限制其內容,或者您可以要求數據匹配特定模式
定義簡單元素的語法為
<xs:element name="xxx" type="yyy"/>
其中 xxx 是元素的名稱,yyy 是元素的數據類型。
XML 模式具有許多內置數據類型。最常見的類型包括:
xs:string
xs:decimal
xs:integer
xs:boolean
xs:date
示例
以下是一些 XML 元素
<lastname>Refsnes</lastname>
<age>36</age>
<dateborn>1970-03-27</dateborn>
以下是相應的簡單元素定義:
<xs:element name="lastname" type="xs:string"/>
<xs:element name="age" type="xs:integer"/>
<xs:element name="dateborn" type="xs:date"/>
簡單元素的預設值和固定值
簡單元素可以具有指定的預設值或固定值。
當未指定其他值時,預設值會自動分配給元素
在以下示例中,預設值為 "red":
<xs:element name="color" type="xs:string" default="red"/>
固定值也會自動分配給元素,並且您無法指定其他值。
在以下示例中,固定值為 "red":
<xs:element name="color" type="xs:string" fixed="red"/>
XSD 屬性
所有屬性都聲明為簡單類型
簡單元素不能具有屬性。如果一個元素具有屬性,則被視為複雜類型。但是屬性本身始終被聲明為簡單類型。
如何定義屬性
定義屬性的語法為
<xs:attribute name="xxx" type="yyy"/>
其中 xxx
是屬性的名稱,yyy
指定了屬性的數據類型。
XML 模式具有許多內置數據類型。最常見的類型包括:
xs:string
xs:decimal
xs:integer
xs:boolean
xs:date
xs:time
示例, 以下是具有屬性的 XML 元素
<lastname lang="EN">Smith</lastname>
以下是相應的屬性定義
<xs:attribute name="lang" type="xs:string"/>
屬性的預設值和固定值
屬性可以具有指定的預設值或固定值。
當未指定其他值時,預設值會自動分配給屬性。
在以下示例中,預設值為 "EN":
<xs:attribute name="lang" type="xs:string" default="EN"/>
固定值也會自動分配給屬性,並且您無法指定其他值。
在以下示例中,固定值為 "EN":
<xs:attribute name="lang" type="xs:string" fixed="EN"/>
可選和必需的屬性
屬性預設為可選。要指定屬性為必需的,請使用 "use" 屬性:
<xs:attribute name="lang" type="xs:string" use="required"/>
對內容的限制
當 XML 元素或屬性具有定義的數據類型時,它會對元素或屬性的內容施加限制。
如果 XML 元素的類型為 "xs:date",並包含類似 "Hello World" 的字元串,則該元素將無法驗證。
使用 XML 模式,您還可以向 XML 元素和屬性添加自定義限制。這些限制稱為 facets。您可以在下一章中瞭解更多關於 facets 的信息。
XSD 限制/約束
限制用於定義 XML 元素或屬性的可接受值。對 XML 元素的限制稱為 facets。
對值的限制
以下示例定義了一個名為 "age" 的元素,並施加了限制。age 的值不能小於 0 或大於 120:
<xs:element name="age">
<xs:simpleType>
<xs:restriction base="xs:integer">
<xs:minInclusive value="0"/>
<xs:maxInclusive value="120"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
對一組值的限制要將 XML 元素的內容限製為一組可接受的值,我們將使用枚舉約束
以下示例定義了一個名為 "car" 的元素,並施加了限制。唯一可接受的值是:Audi、Golf、BMW
<xs:element name="car">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:enumeration value="Audi"/>
<xs:enumeration value="Golf"/>
<xs:enumeration value="BMW"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
上述示例也可以這樣寫:
<xs:element name="car" type="carType"/>
<xs:simpleType name="carType">
<xs:restriction base="xs:string">
<xs:enumeration value="Audi"/>
<xs:enumeration value="Golf"/>
<xs:enumeration value="BMW"/>
</xs:restriction>
</xs:simpleType>
註意:在這種情況下,類型 "carType" 可以被其他元素使用,因為它不是 "car" 元素的一部分。
對一系列值的限制
要將 XML 元素的內容限製為定義的一系列數字或字母,我們將使用模式約束。
以下示例定義了一個名為 "letter" 的元素,並施加了限制。唯一可接受的值是小寫字母 a 到 z 中的任意一個:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "initials" 的元素,並施加了限制。唯一可接受的值是小寫或大寫字母 a 到 z 中的三個:
<xs:element name="initials">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[A-Z][A-Z][A-Z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例也定義了一個名為 "initials" 的元素,並施加了限制。唯一可接受的值是小寫或大寫字母 a 到 z 中的三個:
<xs:element name="initials">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-zA-Z][a-zA-Z][a-zA-Z]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "choice" 的元素,並施加了限制。唯一可接受的值是以下字母中的一個:x、y 或 z:
<xs:element name="choice">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[xyz]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "prodid" 的元素,並施加了限制。唯一可接受的值是一個連續的五位數字,每個數字必須在 0 到 9 的範圍內:
<xs:element name="prodid">
<xs:simpleType>
<xs:restriction base="xs:integer">
<xs:pattern value="[0-9][0-9][0-9][0-9][0-9]"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
以下示例定義了一個名為 "letter" 的元素,並施加了限制。可接受的值是小寫字母 a 到 z 的零個或多個實例:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="([a-z])*"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例也定義了一個名為 "letter" 的元素,並施加了限制。可接受的值是一個或多個成對的字母,每個成對由一個小寫字母後跟一個大寫字母組成。例如,"sToP" 將通過此模式驗證,但 "Stop"、"STOP" 或 "stop" 不會:
<xs:element name="letter">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="([a-z][A-Z])+"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
下一個示例定義了一個名為 "gender" 的元素,並施加了限制。唯一可接受的值是 male 或 female:
<xs:element name="gender">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="male|female"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
以下示例定義了一個名為 "password" 的元素,並施加了限制。必須連續存在八個字元,這些字元必須是小寫或大寫字母 a 到 z 中的一個,或者數字 0 到 9:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:pattern value="[a-zA-Z0-9]{8}"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
要指定如何處理空白字元,我們將使用 whiteSpace 約束。
以下示例定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設置為 "preserve",這意味著 XML 處理器不會移除任何空白字元:
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="preserve"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例也定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設置為 "replace",這意味著 XML 處理器將替換所有空白字元(換行符、製表符、空格和回車)為空格:
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="replace"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例也定義了一個名為 "address" 的元素,並施加了限制。whiteSpace 約束設置為 "collapse",這意味著 XML 處理器將移除所有空白字元(換行符、製表符、空格和回車被替換為空格,前導和尾隨空格被移除,多個空格被減少為單個空格):
<xs:element name="address">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:whiteSpace value="collapse"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
長度限制
要限制元素中值的長度,我們將使用 length、maxLength 和 minLength 約束。
以下示例定義了一個名為 "password" 的元素,並施加了限制。值必須正好為八個字元:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:length value="8"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
這個示例定義了另一個名為 "password" 的元素,並施加了限制。值必須至少五個字元,最多八個字元:
<xs:element name="password">
<xs:simpleType>
<xs:restriction base="xs:string">
<xs:minLength value="5"/>
<xs:maxLength value="8"/>
</xs:restriction>
</xs:simpleType>
</xs:element>
數據類型的限制
約束 描述
enumeration 定義可接受值列表
fractionDigits 指定允許的最大小數位數。必須大於或等於零
length 指定允許的精確字元數或列表項數。必須大於或等於零
maxExclusive 指定數值的上界(值必須小於此值)
maxInclusive 指定數值的上限(值必須小於或等於此值)
maxLength 指定允許的最大字元數或列表項數。必須大於或等於零
minExclusive 指定數值的下界(值必須大於此值)
minInclusive 指定數值的下限(值必須大於或等於此值)
minLength 指定允許的最小字元數或列表項數。必須大於或等於零
pattern 定義可接受的確切字元序列
totalDigits 指定允許的精確數字數。必須大於零
whiteSpace 指定如何處理空白字元(換行符、製表符、空格和回車)
最後
為了方便其他設備和平臺的小伙伴觀看往期文章:
微信公眾號搜索:Let us Coding
,關註後即可獲取最新文章推送
看完如果覺得有幫助,歡迎點贊、收藏、關註