javaScript和HTML支持的字元集 JavaScript是支持unicode的。 現代的瀏覽器在網頁中都支持ASCII字元集、ISO字元集、數學符號、希臘字母、其他符號。HTML5預設使用UTF-8。讀者可以點擊這兒查看ASCII、unicode和utf-8的關係。 javaScript和H ...
javaScript和HTML支持的字元集
JavaScript是支持unicode的。
現代的瀏覽器在網頁中都支持ASCII字元集、ISO字元集、數學符號、希臘字母、其他符號。HTML5預設使用UTF-8。讀者可以點擊這兒查看ASCII、unicode和utf-8的關係。
javaScript和HTML如何表現unicode字元集
HTML頁面使用的是網頁文檔對象,它是通過轉義字元串來表現unicode字元集,語法規則為:“第一部分是一個&符號,英文叫ampersand;第二部分是實體(Entity)名字或者是#加上實體(Entity)編號;第三部分是一個分號。”比如:字元“&”可以在HTML中表示為"&"、" &"或是"&"點擊這兒查看詳情。
javaScript使用的是瀏覽器系統對象,是十六進位的。它同HTML表現unicode字元集不一樣,他有自己的轉義字元,javaScript的轉義字元表:
Unicode 字元值 | 轉義序列 | 含義 | 類別 |
---|---|---|---|
\u0008 | \b | Backspace | |
\u0009 | \t | Tab | 空白 |
\u000A | \n | 換行符(換行) | 行結束符 |
\u000B | \v | 垂直製表符 | 空白 |
\u000C | \f | 換頁 | 空白 |
\u000D | \r | 回車 | 行結束符 |
\u0020 | 空格 | 空白 | |
\u0022 | \" | 雙引號 (") | |
\u0027 | \' | 單引號 (') | |
\u005C | \\ | 反斜杠 (\) | |
\u00A0 | 不間斷空格 | 空白 | |
\u2028 | 行分隔符 | 行結束符 | |
\u2029 | 段落分隔符 | 行結束符 | |
\uFEFF | 位元組順序標記 | 空白 |
讀者可以打開電腦自帶的字元映射表,在裡面可以找到unicode代碼,比如:
在宋體欄目一行中的unicode轉到中輸入字元串“FE6A”,就會自動跳到百分號,並且在最下麵顯示“U+FE6A”。
讀者可以在html中寫出如下測試代碼:
<!DOCTYPE html>
<html>
<head>
<title>test.html</title>
<meta name="content-type" content="text/html; charset=UTF-8">
</head>
<body>
<script>
document.write("\ufe6a﹪");
alert("\ufe6a");
</script>
<p>\ufe6a
<p>﹪
</body>
</html>
讀者可在瀏覽器上看到如下效果:
在document文檔中的“\ufe6a"和“﹪”都正常顯示出來了,這裡讀者需要註意,前者是javaScript認得到的,所以會被javaScript轉化,後者是HTML中的轉義字元,因此會原封不動的發給HTML文檔,由HTML來轉換。上面的代碼中有一個alert警告框,它都是支持unicode字元集的,如果在裡面寫上HTML的轉義字元串的話,由於alert的內容不是發送到HTML文檔對象中,因此轉義字元串將不會被轉化。
介紹了javaScript和html表現unicode的差別,如果需要某個符號的unicode代碼或是html的轉義字元串代碼挨著挨著在字元映射表中或是字元集中查找太麻煩了,這時候可以使用線上Unicode編碼轉換。在使用線上Unicode編碼轉換的時候,ASCII字元轉Unicode字元預設是HTML的轉義字元串形式,這也說明HTML的轉義字元串也是Unicode編碼的一部分,這時候讀者可以通過“中文轉Unicode”來實現十六進位。
參考文章
http://www.runoob.com/charsets/ref-html-utf8.html
本文為博主原創作品,如需轉載請註明出處