零拷貝並非萬能解決方案:重新定義數據傳輸的效率極限

来源:https://www.cnblogs.com/guoxiaoyu/archive/2023/09/16/17698096.html
-Advertisement-
Play Games

本文討論了零拷貝在優化數據傳輸效率方面的局限性。儘管零拷貝技術在減少數據傳輸過程中的記憶體拷貝次數方面有很大的優勢,但它並非適用於所有情況。文章介紹了一些其他的優化方法,如非同步I/O和直接I/O的組合、根據文件大小選擇不同的優化方式。至此,我們的電腦基礎專欄就結束了,不知道大家有沒有發現,操作系統底... ...


PageCache有什麼作用?

在我們前面講解零拷貝的內容時,我們瞭解到一個重要的概念,即內核緩衝區。那麼,你可能會好奇內核緩衝區到底是什麼?這個專有名詞就是PageCache,也被稱為磁碟高速緩存。也可以看下windows下的緩存區:如圖所示:

image

零拷貝進一步提升性能的原因在於 PageCache 技術的使用。接下來,我們將詳細探討 PageCache 技術是如何實現這一目標的。

讀寫磁碟相比讀寫記憶體的速度慢太多了,但我們可以採取一種方法來改善這個問題,即將磁碟數據部分緩存到內核中,也就是將其存儲在PageCache緩存區中。這個過程實際上是通過DMA(直接記憶體訪問)控制器將磁碟數據拷貝到內核緩衝區中。

然而,需要註意的是,由於記憶體空間較磁碟空間有限,因此存在一系列演算法來確保pageCache占用的記憶體空間不過大。我們在程式運行時都知道存在一種「局部性」,即剛剛被訪問的數據在短時間內很可能再次被訪問到,概率很高。因此,pageCache被用作緩存最近訪問的數據。可以將pageCache看作是Redis,而磁碟則類似於MySQL。此外,pageCache還使用了記憶體淘汰機制,在記憶體空間不足時,會淘汰最近最久未被訪問的緩存。

當在項目中使用 Redis 時,你一定知道如何使用它。和 Redis 類似, PageCache 的工作原理也是一樣的。在進程需要訪問數據時,它會首先檢查 PageCache 是否已經存儲了所需的數據。如果數據已經存在於 PageCache 中,內核會直接返回數據;如果數據未被緩存,則會從磁碟讀取並將數據緩存到 PageCache 中,以備下次查詢時使用。這種方式可以有效提高訪問效率。

然而,pageCache還具有另一個優點,即預讀功能。當訪問並讀取磁碟數據時,實際上需要定位磁碟中的位置。對於機械硬碟而言,這意味著磁頭必須旋轉到數據所在的扇區位置,然後開始順序讀取數據。然而,旋轉磁頭這種物理操作對電腦而言非常耗時。為了降低其影響,就出現了預讀功能。通過預讀功能,可以提前預讀下一扇區的數據,減少等待磁頭旋轉的時間。

比如read方法需要讀取32KB的位元組的數據,使其在讀取32KB位元組數據後,繼續讀取後面的32-64KB,並將這一塊數據一起緩存到pageCache緩衝區。這樣做的好處在於,如果後續讀取需要的數據在這塊緩存中命中,那麼讀取成本會大幅降低。可以類比於redis中提前緩存一部分分散式唯一id用於插入資料庫時的分配操作,這樣就無需每次插入前都去獲取一遍id。然而,一般情況下,為了避免可能出現的"毛刺"現象,我們通常會使用雙緩存機制來處理。這個雙緩存機制可以進一步優化讀取操作的效果。

因此,PageCache的優點主要包括兩個方面:首先,它能夠將數據緩存到PageCache中;其次,它還利用了數據的預讀功能。這兩個操作極大地增強了讀寫磁碟時的性能。

但是,你可以想象一下如果你在傳輸大文件時比如好幾個G的文件,如果還是使用零拷貝技術,內核還是會把他們放入pageCache緩存區,那這樣不就產生問題了嗎?你也可以想一下如果你往redis緩存中放了一個還幾個G大小的value,而且還知道緩存了也沒用,那不就相當於redis形同虛設了嗎?把其他熱點數據也弄沒了,所以pageCache也有這樣的一個問題,一是大文件搶占了pageCache的記憶體大小,這樣做會導致其他熱點數據無法存儲在pageCache緩衝區中,從而降低磁碟的讀寫性能。此外,由於pageCache無法享受到緩存的好處,還會產生一個DMA數據拷貝的過程。

因此,最佳的優化方法是針對大文件傳輸時不使用pageCache,也就是不使用零拷貝技術。這是因為零拷貝技術會占用大量的記憶體空間,影響其他熱點數據的訪問優化。在高併發環境下,這幾乎肯定會導致嚴重的性能問題。

大文件傳輸用什麼方式實現?

那針對大文件的傳輸,我們應該使用什麼方式呢?

讓我們首先來觀察最初的示例。當調用read方法讀取文件時,進程實際上會被阻塞在read方法的調用處,因為它需要等待磁碟數據的返回。如下圖所示:

image

在沒有使用零拷貝技術的情況下,我們的用戶進程使用同步IO的方式,它會一直阻塞等待系統調用返回數據。讓我們回顧一下之前的具體流程:

  1. 應用程式發起read系統調用,用戶進程開始進行阻塞等待結果返回。
  2. 此時內核會向磁碟發起I/O請求,磁碟收到請求後,開始定址。當磁碟數據準備好後,就會向內核發起I/O中斷,告知內核磁碟數據已經準備好。
  3. 內核收到中斷信號後,將數據從磁碟控制器緩存區拷貝到pageCache緩衝區。
  4. 最後,內核會將pageCache中的數據再次拷貝到用戶緩衝區,也就是用戶態的記憶體中,然後read調用返回。

我們知道,既然有同步IO,就一定有非同步IO來解決阻塞的問題。非同步IO的工作方式如下圖所示:

image

它將讀操作分為兩個部分:

  1. 第一部分是用戶進程發起IO請求給內核,然後進程就不再關心該IO操作,而是繼續處理其他任務。
  2. 第二部分是當內核接收到中斷信號後,將數據直接拷貝到用戶緩衝區,並通知用戶進程操作成功。然後用戶進程開始處理數據。

我們發現在這個過程中,並沒有涉及到將數據拷貝到pageCache中,因此使用非同步方式繞開了pageCache。直接IO是指繞過pageCache的IO請求,而緩存IO是指使用pageCache的IO請求。通常,對於磁碟而言,非同步IO只支持直接IO。

正如前面所提到的,對於大文件的傳輸,不應該使用PageCache,因為這可能會導致PageCache被大文件占據,從而使得"熱點"小文件無法充分利用PageCache的優勢。

因此,在高併發的場景下,對於大文件傳輸,我們應該採用"非同步I/O + 直接I/O"的方式來代替零拷貝技術。

直接I/O有兩種常見的應用場景:

  1. 首先,如果應用程式已經實現了磁碟數據的緩存,就不需要再次使用PageCache進行緩存,這樣可以減少額外的性能損耗。例如,在MySQL資料庫中,可以通過參數設置來開啟直接I/O,避免重覆的緩存操作,預設情況下是不開啟的。
  2. 其次,在傳輸大文件時,由於大文件很難命中PageCache的緩存,而且會占滿PageCache導致"熱點"文件無法充分利用緩存,增加了性能開銷。因此,在這種情況下,應該使用直接I/O來繞過PageCache的緩存,以提高性能。

需要註意的是,直接I/O繞過了PageCache,因此無法享受內核的兩項優化。

  1. 首先,內核的I/O調度演算法會在PageCache中緩存儘可能多的I/O請求,然後將它們合併成一個更大的I/O請求發送給磁碟,以減少磁碟的定址操作。
  2. 其次,內核會預讀後續的I/O請求並將其放入PageCache中,同樣是為了減少對磁碟的操作。這些優化在直接I/O中無法享受到。

於是,當我們需要傳輸大文件時,我們可以利用非同步I/O和直接I/O的組合來實現無阻塞的文件讀取。這種方式可以有效避免PageCache的影響,提高文件傳輸的效率。

因此,在文件傳輸過程中,我們可以根據文件的大小來選擇不同的優化方式,以提高傳輸效率。對於大文件,使用非同步I/O和直接I/O可以避免PageCache的影響;而對於小文件,則可以使用零拷貝技術來減少數據拷貝次數,提高傳輸速度。

在Nginx中,我們可以通過以下配置來根據文件的大小選擇不同的優化方式:

location /video/ { 
    sendfile on; 
    aio on; 
    directio 1024m; 
}

在這個配置中,我們開啟了sendfile選項,這允許Nginx使用零拷貝技術來傳輸文件。同時,我們也啟用了aio選項,這使得Nginx可以使用非同步I/O來提高文件傳輸的效率。

而通過設置directio參數為1024m,我們告訴Nginx當文件大小超過1024MB時,使用直接I/O來進行文件傳輸。這意味著在傳輸大文件時,Nginx將使用非同步I/O和直接I/O的組合來實現無阻塞的文件讀取,避免了PageCache的影響。而對於小文件,Nginx將繼續使用零拷貝技術,以減少數據拷貝次數,提高傳輸速度。

總結

至此,我們的電腦基礎專欄就結束了,不知道大家有沒有發現,操作系統底層提供了豐富的解決方案來支持應用程式的複雜性和可擴展性。對於任何工作中遇到的問題,我們都可以從操作系統的角度尋找解決方法。

今天這一篇其實就是來打破零拷貝的方案神話的,沒有一種技術是最好的,只有最合適的方法。我們需要根據具體的需求和情況來選擇適合的解決方案,以提高應用程式的性能和可擴展性。謝謝大家的閱讀和關註,希望這個專欄能對大家有所啟發和幫助!

也請期待我的下一個專欄:【電腦網路篇】


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.什麼是迴圈依賴? 迴圈依賴是指一個或多個對象之間存在直接或間接的依賴關係,這種依賴關係構成一個環形調用 , 舉個例子 : A 依賴B , B依賴C , C依賴A , 這樣就形成了迴圈依賴; 2.spring對迴圈依賴的處理有三種情況: ①構造器的迴圈依賴:這種依賴spring是處理不了的,直接拋 ...
  • JavaSe 變數和運算符: 基本數據類型介紹 java中浮點數精度怎麼解決,有瞭解過實現嗎,為什麼有精度問題 BigDecimal,如何判斷BigDecimal是否相等。如何進行計算、怎麼四捨五入 基本類型幾種,分別占用空間 int和Integer區別--包裝類,int有幾個位元組。 包裝類常量池 ...
  • 今天在看開源項目的時候發現了這樣一句代碼 import static com.abin.mallchat.common.common.service.frequencycontrol.FrequencyControlStrategyFactory.TOTAL_COUNT_WITH_IN_FIX_TI ...
  • 背景 在分散式系統中,經常需要用到全局唯一ID發生器,標識需要存儲的數據。我們需要什麼樣的ID生成器? ID生成器除了是數據的唯一標識以外,一般需要在系統中承擔更多的責任,概括起來有以下幾點: 唯一性:“全局唯一” vs “業務唯一”? 分散式系統使用唯一的ID生成器,會有非常嚴重的申請互斥問題。互 ...
  • IAT(Import Address Table)Hook是一種針對Windows操作系統的API Hooking 技術,用於修改應用程式對動態鏈接庫(DLL)中導入函數的調用。IAT是一個數據結構,其中包含了應用程式在運行時使用的導入函數的地址。IAT Hook的原理是通過修改IAT中的函數指針,... ...
  • 假設你有一行 String condition = "A or B and C"; 語句,請問怎麼做才能變成一行真正的邏輯表達式(能在電腦中運行計算)? Resolution 聲明一個List<List<String>>結構; 先分割 or ; 變成 [ A, B and C ] 不包含and的, ...
  • 前言 插件式架構,一種全新的、開放性的、高擴展性的架構體系。插件式架構設計好處很多,把擴展功能從框架中剝離出來,降低了框架的複雜度,讓框架更容易實現。擴展功能與框架以一種很松的方式耦合,兩者在保持介面不變的情況下,可以獨立變化和發佈。基於插件設計並不神秘,相反它比起一團泥的設計更簡單,更容易理解。 ...
  • 以下內容均來自Gitee的開源倉庫,具體的使用請移步Gitee:https://gitee.com/pojianbing/lazy-captcha 以下是我自己使用的具體方式 首先安裝NuGet包: Microsoft.Extensions.Caching.StackExchangeRedis La ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...