理解 nodeJS 中的 buffer,stream

来源:https://www.cnblogs.com/zhangmao/archive/2020/01/11/12180956.html
-Advertisement-
Play Games

在Node.js開發中,當遇到 buffer,stream,和二進位數據處理時,你是否像我一樣,總是感到困惑?這種感覺是否會讓你認為不瞭解它們,以為它們不適合你,認為而這些是Node.js作者們的事情? 確實,這些東西可能非常令人生畏,尤其是當你在缺乏電腦底層基礎知識,進行相關的開發。 可悲的是, ...


在Node.js開發中,當遇到 buffer,stream,和二進位數據處理時,你是否像我一樣,總是感到困惑?這種感覺是否會讓你認為不瞭解它們,以為它們不適合你,認為而這些是Node.js作者們的事情?

確實,這些東西可能非常令人生畏,尤其是當你在缺乏電腦底層基礎知識,進行相關的開發。

 可悲的是,許多教程和書籍直接告訴你如何使用 Node.js 包開發 Web 應用程式,而沒有讓你瞭解 Node.js 的核心功能以及它們存在的原因,有些人會地告訴你,你不需要瞭解它們,因為你可能永遠不會直接用到這些。

沒錯,如果你選擇做一名普通開發人員,可能永遠不會用到他們。

如果你對這些內容存在疑問,你想理解 Node.js 的許多核心功能,比如 buffer...這就是我寫本篇文章的原因,這是為了幫助我們揭開其中一些功能的神秘面紗,並使我們對 Node.js 的學習更上一層樓。

 官方的 Node.js 文檔部分說明:

 JavaScript 語言沒有讀取或操作二進位數據流的機制。 Buffer 類被引入作為 Node.js API 的一部分,使其可以在 TCP 流或文件系統操作等場景中處理二進位數據流。

嗯,除非你對上述句子中的描述有相關的知識和經驗,否則它們可能只是一堆術語。

我們簡化一下這些解釋,以便我們可以更好的理解他們,官方的描述可以總結為一句話:buffer 能夠與二進位數據流進行交互操作。

但是 buffer,stream,二進位數據,仍然有很多不理解的地方。 好吧,我們嘗試解決這些重要的問題。

 二進位數據是什麼?

 你可能已經知道電腦是以二進位形式存儲和表示數據,二進位只是一個1或0的集合。例如,以下是五個不同的二進位文件,5個不同的1和0集:

10,01,001,1110,00101011

 二進位中的每個數字,0或1叫做位(bit),也就是Binary digIT 的縮寫。

為了能夠存儲和表示這些數據,電腦需要將數據轉換為二進位形式。比如,要存儲數字12,電腦需要將12轉化為二進位 1100

電腦怎麼知道要如何去轉換?這就完全是一個數學問題了。電腦是知道怎麼去處理的,有興趣的可以自己查閱。

但是我們日常工作的數據類型不僅僅是數字,我們還有字元串,圖像,視頻...電腦知道如何用二進位表示所有類型的數據的,讓我們以字元串為例。電腦如何用二進位表示字元串“ L”?為了將字元存儲為二進位形式,電腦首先將該字元轉換為數字,然後將該數字轉換為二進位表示,因此,對於字元串“ L”, 電腦首先將L轉換為代表L的數字,讓我們看如何操作:

打開瀏覽器控制台,粘貼以下代碼段:"L".charCodeAt(0),按 Enter,你看到了什麼?數字76?這就是字母L的數字編碼,但是電腦怎麼知道具體哪個數字代表那個字母呢?如何知道數字76表示L?

 字元集

字元集是已經定義的一套規則,明確指出每個數字代表的字元,這些規則有不同的定義,流行的規則包括 Unicode 和 ASCII,JavaScript 在 Unicode 字元集方面的表現非常好,實際上,在瀏覽器中,它是 Unicode(可以嘗試其他字元集),指出76表示大寫“L”。

我們已經瞭解了電腦如何用數字表示字元,現在,電腦將依次將數字76表示為其二進位形式,你可能會認為,只需將76轉換為以2為底的數字系統,沒那麼快!

 字元編碼

 就像字元集規則定義那些數字代表那些字元一樣,也有一些規則定義瞭如何使用二進位形式中表示該數字,具體來說,就是使用多少位來表示數字,這就是字元編碼。

我們常見字元編碼之一是 UTF-8,UTF-8 規定字元以位元組表示,一個位元組是8位(bit),即8個1和0表示一個位元組,所以,用8個1和0組成的二進位序列,來表示和存儲任意的一個字元。

為了更好的理解,舉個例子: 比如之前提到的12的二進位表示是1100。 所以,使用 UTF-8 的格式來表示,應該使用一個位元組,也就是8位來完整表示,也即00001100, 沒有錯吧?

因此,76在電腦中的存儲形式應該是01001100。

 

這就是電腦將字元存儲成二進位的方式。當然,電腦也有一些特殊規則,將圖片、視頻等存儲為二進位的,總之,電腦會將無論圖片、視頻或其他數據都轉換為二進位並存儲,這就是我們說的二進位數據。

如果你對字元編碼非常感興趣,那你可以參考一下這篇文章

 Stream

 在Node.js中,流(stream)就是一系列從A點到B點移動的數據,完整點的說,就是當你有一個很大的數據需要傳輸、搬運時,你不需要等待所有數據都傳輸完成才開始下一步工作。

實際上,大型數據會被分割成小塊(chunks)進行傳輸。所以,buffer 的原始定義中所說的(“streams of binary data… in the context of… file system”)意思就是說二進位數據在文件系統中的傳輸。比如,將 file1.txt 的文字存儲到 file2.txt 中。

但是,buffer 到底在流(stream)中,是如何操作二進位數據的?buffer 到底是什麼呢?

 Buffer

 我們已經知道數據流(stream of data)是從一個地方向另一個地方傳輸數據的過程,但是這個具體是怎麼樣的一個過程?

通常情況下,我們傳輸數據往往是為了讀取它,處理它,或者基於這些數據做一些其他操作,但是,在每次傳輸過程中,有一個數據量的問題。因此當獲取到數據的時間比處理數據理的時間快時,我們處理數據就需要等待了。

這個”等待區域”就是 buffer! 它是電腦上的一個很小的物理地址,一般在記憶體中,數據在這裡暫時存儲,等待,最後在流(stream)中,發送出去並處理,比如說和顯卡相關的 webgl 處理就是一個例子。

我們可以把整個流(stream)和 buffer 的配合過程看作公交站。在一些公交站,公車在沒有裝滿乘客前是不會發車的,或者在特定的時刻才會發車。當然,乘客也可能在不同的時間,人流量大小也會有所不同,有人多的時候,有人少的時候,乘客或公交站都無法控制人流量。

 

不論何時,早到的乘客都必須等待,直到公車接到指令可以發車。當乘客到站,發現公車已經裝滿,或者已經開走,他就必須等待下一班車次。

總之,這裡總會有一個等待的地方,這個等待的區域就是 Node.js 中的 Buffer,Node.js 不能控制數據什麼時候傳輸過來,傳輸速度,就好像公交車站無法控制人流量一樣。他只能決定什麼時候發送數據。如果時間還不到,那麼 Node.js 就會把數據放入 buffer(等待區域)中,一個在記憶體中的地址,直到把他們發送出去進行處理。

 

一個關於 buffer 很典型的例子,就是你線上看視頻的時候。如果你的網路足夠快,數據流(stream)就可以足夠快,可以讓 buffer 迅速填滿然後發送和處理,然後處理另一個,再發送,再另一個,再發送,然後整個 stream 完成。

但是當你網路連接很慢,當處理完當前的數據後,你的播放器就會暫停,或出現”緩衝”(buffer)字樣,意思是正在收集更多的數據,或者等待更多的數據到來,才能下一步處理。當buffer裝滿並處理好,播放器就會顯示數據,也就是播放視頻了。在播放當前內容的時候,更多的數據也會源源不斷的傳輸、到達和在 buffer 等待。

 這就是 buffer!

 從原始的定義,我們知道,buffer 可以在 stream 中與二進位數據進行交互和操作。那麼到底可以進行什麼樣的操作呢?在 Node.js 中又應該如何進行剛纔所描述的一些東西呢?我們來瞧一瞧。

與 buffer 交互

你可以創建自己的緩衝區!在 stream 中,Node.js 會自動幫你創建 buffer 之外,你可以創建自己的 buffer 並操作它,是不是很有趣? 我們來創建一個!

根據不同的需求,可以使用不同的方法來創建緩衝區。

// 創建一個大小為 10 的空 buffer
// 這個 buffer 只能承載10個位元組的內容

const buf1 = Buffer.alloc(10);

// 根據內容直接創建 buffer
const buf2 = Buffer.from("hello buffer");

創建緩衝區後,就可以操作了

// 檢查下buffer的結構

buf1.toJSON()
// { type: 'Buffer', data: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0] }

// 一個空的 buffer
buf2.toJSON()

// { type: 'Buffer', data: [104, 101, 108, 108, 111, 32, 98, 117, 102, 102, 101, 114] }
// the toJSON() 方法可以將數據進行 Unicode 編碼並展示

// 檢查 buffer 的大小

buf1.length // 10

buf2.length // 12 根據數據自動填充並創建

// 寫入數據到 buffer
buf1.write("Buffer really rocks!")

// 解碼buffer

buf1.toString() // 'Buffer rea'

// 對不起,因為buf1只能承載10個位元組的內容,所有多處的東西會被截斷

我們可以使用 buffer 進行更多操作,前往官方文檔,進一步瞭解這些方法。

最後,我將面臨這個小挑戰:仔細閱讀 Node.js 的核心庫之一 zlib.js 的源代碼,以瞭解它如何利用 buffer 的功能來操作二進位數據流,處理後,最後變成gziped文件。 當你在閱讀的時候,記錄下你的學習經歷併在評論中分享下來吧。

希望本文能幫助你更好地瞭解 Node.js Buffer。

如果你覺得這篇文章不錯,而其他人也有機會看到這一點,點個贊吧,以幫助其他人更好地理解 Buffer。

原文


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1、不要取出全部列,取出全部列,會讓優化器無法完成索引覆蓋掃描這類優化,還會為伺服器帶來額外的I/O、記憶體和CPU的消耗。應該嚴格禁止SELECT * 的寫法。MySQL使用如下三種方式應用WHERE條件,從好到壞依次為: 1.1 在索引中使用WHERE條件來過濾不匹配的記錄。這是在存儲引擎層完成的 ...
  • 一. 測試背景開發一個項目,資料庫用的是sqlserver。帳號表數據有一兩百萬,不算大,也不算小。在考慮是否要使用視圖,擔心效率,百度了下資料,眾說紛紜,好吧,實踐是最好的證明,那麼我們就來測試吧。 二. 測試環境WIN8系統,記憶體8G,普通磁碟,sqlserver2012 。 三. 表和視圖結構 ...
  • 開發人員有時候使用類似下麵SQL將字元串轉換為日期時間類型,乍一看,這樣的SQL的寫法是沒有什麼問題的。但是這樣的SQL其實有時候就是一個定時炸彈,隨時可能出現問題(),下麵簡單對這種情況進行一個簡單概括。 SELECT CONVERT(DATETIME, '2020-01-13 6:46:42')... ...
  • 場景 Android中四種補間動畫。 透明度漸變動畫 旋轉動畫 縮放動畫 平移動畫 註: 博客: https://blog.csdn.net/badao_liumang_qizhi 關註公眾號 霸道的程式猿 獲取編程相關電子書、教程推送與免費下載。 實現 透明度漸變動畫 首先在佈局文件中添加一個Im ...
  • 場景 Android中的逐幀動畫,就是由連續的一張張照片組成的動畫。 效果 註: 博客: https://blog.csdn.net/badao_liumang_qizhi 關註公眾號 霸道的程式猿 獲取編程相關電子書、教程推送與免費下載。 實現 首先準備一組不同表情的照片,放在res/drawab ...
  • 如果你在2019年8月之前將Flutter添加到現有iOS項目,本文值得你一看。 在2019年7月30日,合併合併請求flutter / flutter#36793之前Flutter 1.8.4-pre.21, 將Flutter添加到現有的iOS應用程式需要更改Podfile, 併在現有Xcode項 ...
  • 1.安裝一款安卓模擬器 ​ 本例使用網易MuMu模擬器,因為目前網路上這類模擬器只有mumu的安卓版本是最新的,為6.0,安卓自帶的Virtual Device雖然有很新的版本,但如果pc配置不是很高的話還是比較卡的,不同的模擬器需要連接的埠不同,後面會用到關於端號,具體請百度。 2.設置MuMu ...
  • 插件下載地址及文檔說明 1.引入必要的js和css核心文件 <link rel="stylesheet" href="../css/cropper.css"> <script src="../js/cropper.js"></script> <script src="https://cdn.stat ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...