關於C#開發中那些編碼問題

来源:http://www.cnblogs.com/yilong-blog/archive/2017/11/03/aboutencoding.html
-Advertisement-
Play Games

最近一直在搞各種編碼問題,略有心得,與大家分享一番。 System.Text提供了Encoding的抽象類,這個類提供字元串編碼的方法。常用的編碼方式主要有ASCII,Unicode,UTF8(Unicode編碼的一種)。 Unicode有四種編碼格式,UTF-8, UTF-16,UTF-32,UT ...


最近一直在搞各種編碼問題,略有心得,與大家分享一番。

System.Text提供了Encoding的抽象類,這個類提供字元串編碼的方法。常用的編碼方式主要有ASCII,Unicode,UTF8(Unicode編碼的一種)。

Unicode有四種編碼格式,UTF-8, UTF-16,UTF-32,UTF-7。

字元編碼類,ASCIIEncoding ,UTF7Encoding,UnicodeEncoding,UTF32Encoding。

下麵對ASCII和Unicode編碼進行對比,廢話不說,先上代碼:

這是ASCII編碼、解碼。

 1         static void Main(string[] args)
 2         {
 3             string temp = "Hello World!";
 4             Console.WriteLine("Original String:{0}", temp);
 5             
 6             byte[] tempBytes = System.Text.Encoding.ASCII.GetBytes(temp);
 7             Console.WriteLine("Bytes Array:{0}", BitConverter.ToString(tempBytes));
 8 
 9             BigInteger integer = new BigInteger(tempBytes);
10             Console.WriteLine("BigInteger:{0}", integer);
11 
12             string res = System.Text.Encoding.ASCII.GetString(tempBytes);
13             Console.WriteLine("Convert Back String:{0}", res);
14             Console.ReadKey();
15         }
View Code

運行結果如下:

Original String:Hello World!
Bytes Array:48-65-6C-6C-6F-20-57-6F-72-6C-64-21
BigInteger:10334410032597741434076685640
Convert Back String:Hello World!

 很正常,對吧?但是,如果輸入的字元串是中文(或者其他非ASCII表中的字元),情況會怎麼樣呢?

改變上面的程式代碼

string temp = "你好,世界!";

運行結果如下:

Original String:你好,世界!
Bytes Array:3F-3F-3F-3F-3F-3F
BigInteger:69540876599103
Convert Back String:??????

 如果把編碼格式換成UTF8,依然重覆上面的測試過程。

 1         static void Main(string[] args)
 2         {
 3             string temp = "你好,世界!";
 4             Console.WriteLine("Original String:{0}", temp);
 5             
 6             byte[] tempBytes = System.Text.Encoding.UTF8.GetBytes(temp);
 7             Console.WriteLine("Bytes Array:{0}", BitConverter.ToString(tempBytes));
 8 
 9             BigInteger integer = new BigInteger(tempBytes);
10             Console.WriteLine("BigInteger:{0}", integer);
11 
12             string res = System.Text.Encoding.UTF8.GetString(tempBytes);
13             Console.WriteLine("Convert Back String:{0}", res);
14             Console.ReadKey();
15         }
View Code

運行結果如下:

Original String:你好,世界!
Bytes Array:E4-BD-A0-E5-A5-BD-EF-BC-8C-E4-B8-96-E7-95-8C-EF-BC-81
BigInteger:-10998968812899434720462615123889939386679836
Convert Back String:你好,世界!

 

Original String:Hello World!
Bytes Array:48-65-6C-6C-6F-20-57-6F-72-6C-64-21
BigInteger:10334410032597741434076685640
Convert Back String:Hello World!

 通過對比,我們發現除了相容中文和其他語言外,似乎沒有太大區別。如果把編碼集換成Unicode,中英文字元編碼的不同就會很容易看出來了。

Original String:Hello World!
Bytes Array:48-00-65-00-6C-00-6C-00-6F-00-20-00-57-00-6F-00-72-00-6C-00-64-00-21-00
BigInteger:3160918205608148134863399242437668999277801104545742920
Convert Back String:Hello World!

 

Original String:你好,世界!
Bytes Array:60-4F-7D-59-0C-FF-16-4E-4C-75-01-FF
BigInteger:-307722159543719876182061216
Convert Back String:你好,世界!

如果不考慮其他情況。通過對比結果,我們發現:

1、ASCII只能處理英文和英文符號,具體請參考ASCII字元表

2、Unicode可以處理全球所有語言符號

3、Unicode處理英文時,會在每個位元組後面加一個位元組0x00,比ASCII多出一倍的長度;處理中文時,編碼較短。

4、UTF8處理中文時比Unicode編碼長,處理英文時與ASCII一樣。

結論,由於現在存儲介質越來越不值錢,在處理有非英文字元時,編碼格式應該選擇Unicode(或其子集UTF8等的任意一種編碼格式),只有在確定程式只會處理英文的時候,才能選擇ASCII編碼。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Hashtable 在System.Collection是命名空間李Hashtable是程式員經常用到的類,它以快速檢索著稱,是研發人員開發當中不可缺少的利器。 Hashtable表示鍵/值對的集合,這些鍵/值對根據鍵的哈希代碼進行組織。Hashtable的鍵必須是唯一的,沒有有效的排序,他進行的是 ...
  • 回到目錄 有時我們的請求頭為ContentEncoding添加了gzip進行了壓縮,而服務端返回數據時也會對它進行gzip壓縮,如果在這種情況下,你直接頭響應流會是亂碼,而必須先進行壓縮,大叔將這塊的邏輯進行了抽取,它把抽取到了方法里,自動使用這個功能! 在GET,POST,PUT,DELETE方法 ...
  • 首先要下載該控制項的包,下載地址:http://pan.baidu.com/s/1Aa5gk 動態變數表 註意 :'5$' 表示以 5 結尾 註意 $ 的用法 在.NET中使用以上控制項只需為控制項添加一個runat=”server” 屬性即可! ...
  • 昨晚有教一個網友在ASP.NET MVC里,創建Web API和在MVC視圖中應用此API。 可以在ASP.NET MVC中,創建程式的model: namespace Insus.NET.Models { public class Weather { private int _Month; pub ...
  • 前面隨筆介紹了請假申請單和報銷申請單兩個不同的業務表單的流程處理,一個是單表信息,一個包含明細的主從表信息,後者包含了條件流程的處理,在流程審批中,一般還有一種流程處理就是會簽的操作,會簽處理是幾個審批步驟中審批人同時處理是否通過的,一般同時通過即為通過。本篇隨筆介紹工作流中的會簽處理過程。 ...
  • 從去年伊始,國內外一些大公司都先後推出了面向物聯網領域的平臺產品,如微軟 Azure 平臺的 IoT Hub、阿裡雲平臺的物聯網開發套件、百度雲平臺的物接入 IoT Hub、物解析 IoT Parser 和物管理 IoT Device 等等,但上述公司的產品從平臺特色和技術角度來看,相對比較適合一些 ...
  • 更多的演示 可以下載近乎源碼詳細查看體驗:www.jinhusns.com ...
  • 關於演示產品下載:www.jinhusns.com ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...