引言 JavaScript程式使用Unicode字元集編寫。Unicode是ASCII和Latin 1的超集,並支持地球上幾乎所有在使用的語言。ECMAScript3要求JavaScript的實現必須支持Unicode2.1及後續版本,ECMAScript5則要求支持Unicode3及後續版本。 區 ...
引言
JavaScript程式使用Unicode字元集編寫。Unicode是ASCII和Latin-1的超集,並支持地球上幾乎所有在使用的語言。ECMAScript3要求JavaScript的實現必須支持Unicode2.1及後續版本,ECMAScript5則要求支持Unicode3及後續版本。
區分大小
JavaScript是區分大小寫的語言,也就是說,關鍵字、變數、函數名和所有的標識符(identifier)都必須採取一致的大小寫的形式。但是需要註意的是,HTML並不區分大小寫(儘管XHTML區分大小寫)。
空格、換行符和格式控制符
JavaScript會忽略程式中標識(token)之間的空格,多數情況下同樣會忽略換行符。
由於可以在代碼中隨意使用空格和換行,因此可以採用整齊、一致的縮進來進行統一的編碼風格,從而提高代碼的可讀性。
JavaScript可以識別的空格符:
- 普通空格符 \u0020
- 水平製表符 \u0009
- 垂直製表符 \u000B
- 換頁符 \u000C
- 不中斷空白符 \u00A0
- 位元組序標記 \uFEFF
- 在Unicode中所有Zs類別的字元
JavaScript將如下字元識別為行結束符:
- 換行符 \u000A
- 回車符 \u000D
- 行分割符 \uz0z8
段分隔符 \u2029
回車符加換行符在一起被解析成一個單行結束符
Unicode轉義序列
在有些電腦硬體和軟體里,無法顯示或輸入Unicode字元全集。為了相容,JavaScript定義了一種特殊序列,使用6個ASCII字元來代表任意16位Unicode內碼。這些Unicode轉義序列均以\u為首碼,其後跟隨4個十六進位數(使用數數字以及大寫或小寫的字母A~F表示),可以用於JavaScript直接量、正則表達式和標識符中(關鍵字除外)。