HTML Entity 字元實體(字元轉義)

来源:http://www.cnblogs.com/polk6/archive/2017/11/29/html-entity.html
-Advertisement-
Play Games

在編寫HTML頁面時,需要用到"<"、">"、"空格"等符號,直接輸入這些符號時,會錯誤的把它們與標記混在一起,非常不利於編碼。 那麼就需要把這些字元進行轉義,以另一種方式抒寫,以相同的形式展現。 在HTML中,這些字元可稱為HTML Entity,即HTML 字元實體。一個HTML Entity... ...


目錄

1. HTML Entity

2. 字元與Entity Name的互相轉換

3. 字元與Entity Number的互相轉換

 

1. HTML Entity

1.1 介紹

在編寫HTML頁面時,需要用到"<"、">"、"空格"等符號,直接輸入這些符號時,會錯誤的把它們與標記混在一起,非常不利於編碼。

那麼就需要把這些字元進行轉義,以另一種方式抒寫,以相同的形式展現。

在HTML中,這些字元可稱為HTML Entity,即HTML 字元實體。一個HTML Entity都含有2種轉義格式:Entity Name 和 Entity Number。

可參考MDN關於HTML Entity的解釋 :https://developer.mozilla.org/en-US/docs/Glossary/Entity

 

1.1.1 Entity Name

格式 &entityName; 

說明:"&"開頭,";"結尾,以語義的形式描述字元。如字元"<",英文名稱為"less than",Entity Name為"&lt;",取自"less than"2個單詞的首字母。

 

1.1.2 Entity Number

格式 &#entityNumber; 

說明:"&#"開頭,";"結尾,以編號的形式描述字元。此編號可以為十進位或十六進位(以"&#x"開頭)等數字格式。

 

1.1.3 示例

<p>字元 :<</p>
<p>Entity Name :&lt;</p>
<p>Entity Number(十進位) :&#60;</p>
<p>Entity Number(十六進位) :&#x3c;</p>

可看到Entity Name、 Entity Number都在頁面顯示為"<"字元。

 

1.2 HTML Entity包括哪些字元呢?

包括但不限於以下字元:ASCII Characters(可見部分)、ISO 8859-1 Characters、ISO 8859-1 Symbols、Math Symbols、Greek Letters、Miscellaneous HTML entities。

在實際編碼時不是所有字元都要轉義的,比如a-z、A-Z等是沒必要轉義的。

 

2. 字元與Entity Name的互相轉換

Entity Name 與 字元的互相轉換隻能依靠字元對照表轉換。更多字元對照表可參考:https://www.freeformatter.com/html-entities.html 

2.1 ASCII 字元列表:

Character Entity Name Entity Number(十進位)
      &nbsp; &#32;
!     &excl; &#33;
"     &quot; &#34;
#     &num; &#35;
$     &dollar; &#36;
%     &percnt; &#37;
&     &amp; &#38;
'     &apos; &#39;
(     &lpar; &#40;
)     &rpar; &#41;
*     &ast; &#42;
+     &plus; &#43;
,     &comma;  &#44;
-     &hyphen;  &#45;
.     &period; &#46;
/     &sol;  &#47;
:     &colon; &#58;
;     &semi; &#59;
<     &lt; &#60;
=     &equals; &#61;
>     &gt; &#62;
?     &quest; &#63;
@     &commat;  &#64;
[     &lsqb;  &#91;
\     &bsol;  &#92;
]     &rsqb; &#93;
^     &circ; &#94;
_     &lowbar; &#95;
`     &grave; &#96;
{     &lcub; &#123;
|     &verbar; &#124;
}     &rcub; &#125;
~     &tilde; &#126;

 

2.2 字元轉換為Entity Name

// ASCII字元集:char 2 entityName
var asciiChartSet_c2en = {
    ' ': '&nbsp;',
    '!': '&excl;',
    '"': '&quot;',
    '#': '&num;',
    '$': '&dollar;',
    '%': '&percnt;',
    '&': '&amp;',
    '\'': '&apos;',
    '(': '&lpar;',
    ')': '&rpar;',
    '*': '&ast;',
    '+': '&plus;',
    ',': '&comma;',
    '-': '&hyphen;',
    '.': '&period;',
    '/': '&sol;',
    ':': '&colon;',
    ';': '&semi;',
    '<': '&lt;',
    '=': '&equals;',
    '>': '&gt;',
    '?': '&quest;',
    '@': '&commat;',
    '[': '&lsqb;',
    '\\': '&bsol;',
    ']': '&rsqb;',
    '^': '&circ;',
    '_': '&lowbar;',
    '`': '&grave;',
    '{': '&lcub;',
    '|': '&verbar;',
    '}': '&rcub;',
    '~': '&tilde;'
}

// e.g. 字元轉換為Entity Name
var oldStr = '(中文)';
var newStr = oldStr.replace(/(\D{1})/g, function(matched) {
    var rs = asciiChartSet_c2en[matched];
    return rs == undefined ? matched : rs;
});
console.log(newStr); // => &lpar;中文&rpar;

 

2.3 Entity Name轉換為字元

// ASCII字元集:entityName 2 char
var asciiChartSet_en2c = {
    '&nbsp;': ' ',
    '&excl;': '!',
    '&quot;': '"',
    '&num;': '#',
    '&dollar;': '$',
    '&percnt;': '%',
    '&amp;': '&',
    '&apos;': '\'',
    '&lpar;': '(',
    '&rpar;': ')',
    '&ast;': '*',
    '&plus;': '+',
    '&comma;': ',',
    '&hyphen;': '-',
    '&period;': '.',
    '&sol;': '/',
    '&colon;': ':',
    '&semi;': ';',
    '&lt;': '<',
    '&equals;': '=',
    '&gt;': '>',
    '&quest;': '?',
    '&commat;': '@',
    '&lsqb;': '[',
    '&bsol;': '\\',
    '&rsqb;': ']',
    '&circ;': '^',
    '&lowbar;': '_',
    '&grave;': '`',
    '&lcub;': '{',
    '&verbar;': '|',
    '&rcub;': '}',
    '&tilde;': '~',
}

// e.g. Entity Name轉換為字元
var oldStr = '&lpar;中文&rpar;';
var newStr = oldStr.replace(/(&.+?;)/g, function(matched) {
    var rs = asciiChartSet_en2c[matched];
    return rs == undefined ? matched : rs;
});
console.log(newStr); // => (中文)

 

3. 字元與Entity Number的互相轉換

3.1 字元轉換為Entity Number

String的實例方法 charCodeAt() 可把指定字元轉換為編碼:

var charCode = '('.charCodeAt(0); // => 40
var entityNumber = '&#' + charCode + ';' // => (

 

3.2  Entity Number轉換為字元

String的靜態方法 fromCharCode() 可把指定編碼轉換為字元,而Entity Number的編碼可以為十進位或16進位,所以轉換時進行分別處理:

/**
 * Entity Number轉換為字元
 * @param {String} entityNumber entityNumber
 */
var getCharByEntityNumber = function(entityNumber) {
    var num = entityNumber.replace('&#', '').replace(';', '');
    if (num.indexOf('x') == 0) {
        num = Number.parseInt(num, 16); // 16進位轉換為10進位
    } else {
        num = Number.parseInt(num); // 10進位
    }
    var char = String.fromCharCode(num);
    return char;
}

// e.g.
var oldStr = '&#40;中文&#41;';
var newStr = oldStr.replace(/(&#\d+;)/g, function(matched) {
    return getCharByEntityNumber(matched);
});
console.log(newStr); // => (中文)

 

==================================系列文章==========================================

本篇文章:1.8 HTML Entity 字元實體(字元轉義)

Web開發之路系列文章

 
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • HTML頁面跳轉: window.open(url, "", "width=600,height=400"); 第二個參數:_self,在當前視窗打開視窗;_blank(預設值),在另外的新建視窗打開新視窗; window.location.href="http://www.jb51.net"; / ...
  • 問題如下圖所示: 一般處理此類問題都會有一個屬性:”event.preventDefault()”,但是如果直接使用會導致頁面的內部滾動也失效導致不能滾動,我所處理的方式也與其類似。 因為滑動區域是向走的,所以滑動塊的頂部到瀏覽器頂部的距離最大為0(其餘為負值[$('#bodycthead').of ...
  • 1.JavaScript中的註釋方式有以下兩種 // This is an in-line comment. /* This is a multi-line comment */ 2.avaScript提供七種不同的data types(數據類型), undefined(未定義) null(空) b ...
  • HTML5樣式、鏈接和表格HTML5列表<ol> 有序列表<ul> 無序列表<li> 列表項 <dl> 列表<dt> 列表項<dd> 描述 1.無序列表 使用<ul>、<li> 屬性:disc、circle、square2.有序列表 使用<ol>、<li> 屬性:A、a、I、i、start3.嵌套列 ...
  • css3選擇器是在css2.0的基礎上的修改創新。他增加了一些UI元素狀態偽類選擇器、結構偽類選擇器、屬性選擇器等。 ...
  • 知識點一: CSS概念:CSS 指層疊樣式表 (Cascading Style Sheets)(級聯樣式表) Css是用來美化html標簽的,相當於頁面化妝。 知識點二: 選擇器格式與部分屬性: 寫法: 選擇器是一個選擇(一/多個)標簽的過程。 對應的屬性與值表: Width:20px; 寬 Hei ...
  • Vue2自定義指令改變DOM值後未刷新data中綁定屬性的值. ...
  • 知識點一:HTML Hyper Text Markup Language 超文本標記語言。 HTML標準結構: 尾碼名:Html與htm是一樣的, 尾碼名不能決定文件格式,只能決定打開文件的方式。 HTML標簽的分類: 基礎標簽: 知識點二: 路徑: 相對路徑: 相對於文件本身出發的路徑,如果在當前 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...