【手記】註意BinaryWriter寫string的小坑——會在string前加上長度首碼length-prefixed

-Advertisement-

之前以為BinaryWriter寫string會嚴格按構造時指定的編碼（不指定則是無BOM的UTF8）寫入string的二進位，如下麵的代碼：因為字母a的utf8編碼是97，所以我預期data只有1個元素且值為97，而實際上，data有兩個元素，依次為1、97，顯然97代表a，但前面的1是什麼鬼， ...

之前以為BinaryWriter寫string會嚴格按構造時指定的編碼（不指定則是無BOM的UTF8）寫入string的二進位，如下麵的代碼：

//將字元串"a"寫入流，再拿到流的位元組組data
using (var ms = new MemoryStream())
{
    using (var bw = new BinaryWriter(ms))
    {
        bw.Write("a");
    }
    byte[] data = ms.ToArray();
}

因為字母a的utf8編碼是97，所以我預期data只有1個元素且值為97，而實際上，data有兩個元素，依次為1、97，顯然97代表a，但前面的1是什麼鬼，再試其它字元串，仍然會在前面多出1個甚至多個位元組，值也比較漂浮，總之就是bw並沒有原原本本的寫入string的二進位，而是加了些料，這在嚴格要求位元組正確的場景會出問題，如http請求體，伺服器會對這些多出來的位元組表示懵逼。遂搜索一番，發現MSDN、stackoverflow早有提到，前面多出來的位元組實際上是表示string的長度，叫長度首碼（length-prefixed），據SO某答主的說法，這是供BinaryReader的ReadString方法用，知道長度，它才知道要讀取到哪裡。所以如果流的讀取方不是BinaryReader，這些長度首碼就是多餘甚至是有害的，這種情況下就不能使用BinaryWriter.Write(string)方法，要寫入乾凈的string二進位，可以這樣：

bw.Write(Encoding.UTF8.GetBytes("a"));//按需選用正確的編碼

即先用具體編碼得到string的位元組組，再用BinaryWriter.Write(byte[])寫入該位元組組。

-文畢-

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

WPF 捕獲鍵盤輸入事件

最近修改的一個需求要求捕獲鍵盤輸入的 Text，包括各種標點符合。最開始想到的是 PreviewKeyDown 或者 PreviewKeyUp 這樣的鍵盤事件。但是這兩個事件的對象 KeyEventArgs 不夠用，得依靠判斷 Key 來判斷輸入了什麼，然後再根據判斷寫死一個相應鍵位的 Text ...
基於Composer Player 模型載入和相關屬性設置

主要是基於達索軟體Composer Player、的基礎上做些二次開發。 public class ComposerToolBarSetting { public bool AntiAliasingOnIdle { get; set; }//抗鋸齒化 public bool AssySelectio ...
WPF CheckBox 樣式

...
利用Select2優化@Html.ListBoxFor顯示，學會用MultiSelectList

最近需要用到多選框，Asp.Net MVC自帶的@Html.ListBox或@Html.ListBoxFor的顯示效果太差，於是找到了Select2進行優化，並正式瞭解了多選框的操作方法。首先介紹多選框的操作方法；一、定義一個MultipleSelectModel 二、在Controller中實 ...
ASP.NET MVC——模型綁定

這篇文章我們來講講模型綁定（Model Binding），其實在初步瞭解ASP.NET MVC之後，大家可能都會產生一個疑問，為什麼URL片段最後會轉換為例如int型或者其他類型的參數呢？這裡就不得不說模型綁定了。模型綁定是指，用瀏覽器以HTTP請求方式發送的數據來創建.NET對象的過程。每當定義具 ...
C#泛型詳解（轉）

初步理解泛型： http://www.cnblogs.com/wilber2013/p/4291435.html 泛型中的類型約束和類型推斷 http://www.cnblogs.com/wilber2013/p/4292240.html 深入理解C#泛型（泛型工作機制） http://www.cn ...
在你的ASP.NET MVC中使用查找功能

在程式中，使用查找功能是少之不了。今天在ASP.NET環境下演示一回。在cshtml視圖中，有三個文本框，讓用戶輸入關鍵詞，然後點擊最右連的“搜索”銨鈕，如果有結果將顯示於下麵。 Html: 表格放2行。一行是標題，一行作為輸入框。jQuery代碼： controller: 處理好條件，傳入資料庫 ...
C#多線程之線程池篇1

在C#多線程之線程池篇中，我們將學習多線程訪問共用資源的一些通用的技術，我們將學習到以下知識點：線上程池中調用委托線上程池中執行非同步操作線程池和並行度實現取消選項使用等待句柄和超時使用計時器使用後臺工作組件在前面的“C#多線程之基礎篇”以及“C#多線程之線程同步篇”中，我們學習瞭如何 ...