Rust的Cow類型有什麼用?詳解Cow及其用途

来源:https://www.cnblogs.com/cinea/p/18040997
-Advertisement-
Play Games

Rust的智能指針有哪些?大多數人都能馬上答出Box<T>、Rc<T>和Arc<T>、Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>。 什麼是COW(Copy-On-Write ...


Rust的智能指針有哪些?大多數人都能馬上答出Box<T>Rc<T>Arc<T>Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>

什麼是COW(Copy-On-Write)?

在開始之前,有必要先介紹一下COW(Copy-On-Write,寫時複製)的概念。COW是一種用於資源管理的優化策略,在操作系統中應用非常廣泛。COW的核心思想是當多個任務需要讀取同一個資源(比如記憶體中的數據、文件)的時候,它們會共用同一份資源副本,而不是為每個任務複製一份資源副本。只有當某個任務需要修改這個資源時,才會為這個任務創建一份資源副本。

需要註意的是,上述的整個過程對任務(也就是程式員編寫的用戶程式)來說都是不可見的;對程式員來說,他並不知道他所使用的資源在發生寫操作時才被真正地複製了一份,自始至終他仿佛就像在獨占整份資源一樣。

COW在文件系統、虛擬記憶體管理中都有非常成熟的應用;在編程語言中,也被廣泛應用於優化字元串、集合的處理。

Cow:定義

Rust的Cow<B>是一個枚舉類型,包含兩個成員:BorrowedOwned。不過,我們幾乎不會直接用到它的成員,因為Cow<B>實現了Deref特征,這使得我們可以通過Deref轉換這一語法糖來便捷地直接使用Cow<B>中的內容。有關Deref轉換可以閱讀我之前的文章。

pub enum Cow<'a, B>
where
    B: 'a + ToOwned + ?Sized,
{
    Borrowed(&'a B),
    Owned(<B as ToOwned>::Owned),
}

需要註意一下Cow的模板參數。Cow接受一個生命周期和一個類型B,其中類型B需要實現ToOwned特征;ToOwned特征的介紹可以看之前的文章,這裡僅僅提一下所有實現了Clone的類型都會自動實現ToOwned自身。除此以外,成員Owned的內容類型不是類型B本身,而是類型BToOwned的目標類型(例如對str來說,這個類型是String)。

使用方法

這裡是一段Cow<B>的簡單使用範例:

use std::borrow::Cow;

fn main() {
    let foo = "Hello World";
    let mut bar: Cow<str> = Cow::from(foo);
    println!("{bar}");      // 這裡沒有發生複製
    
    bar.to_mut().push_str(" Rust");  // 這裡發生了複製
    println!("{bar}");
    
    println!("{foo}");      // 原來的字元串foo仍然可用,而且沒有變化
}

Cow的構造

Cow<B>是一個枚舉,所以首先它是可以直接從它的成員BorrowedOwned來構造的:

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::Borrowed(str_);
    let bar: Cow<str> = Cow::Owned(string);
    
    // 這裡string不再可用
    // println!("{string}");
}

除此以外,標準庫中的五對實現了ToOwned的類型(str/String[T]/Vec<T>CStr/CStringOsStr/OsStringPath/PathBuf)也可以使用From::from來構造Cow<B>

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::from(str_);	// from -> Borrowed
    let bar: Cow<str> = Cow::from(string);	// from -> Owned
    
    // 這裡string不再可用
    // println!("{string}");
}

使用From::from時,Rust會自動為我們匹配正確的類型(&'a str/String等),一般情況下推薦使用from來構造Cow,而不是手動指定Borrowed/Owned

deref和to_mut

前面提到過,Cow<B>實現了Deref<B>特征,這意味著我們不需要做任何操作就可以享受Deref轉換的語法糖:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    let str2: &str = &cow;  // 註意看,我們把&Cow<str>賦給了&str
    
    println!("{str2}"); // Hello World
    println!("{cow}");  // Hello World
    println!("{str1}"); // Hello World
}
use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    
    cow.split(" ").for_each(|s|println!("{s}"));	// 使用str的方法split也不在話下
}

不過,Cow<B>並沒有實現DerefMut;這意味著我們對Cow的修改不會影響到底層的內容,相反地,當我們試圖修改Cow時,Cow會生成一個副本,並且修改這個擁有所有權的副本:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow += " World";
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

我們可以多加一點輸出代碼,來看看具體發生了什麼:

#![feature(cow_is_borrowed)]
use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello, borrowed = true
    
    cow += " World";
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello World, borrowed = false
    println!("str1 = {str1}");									// str1 = Hello
}

修改了cow變數後,它不再處於借用狀態,而是擁有了這段字元串的所有權——這也是它能夠安全地修改這段字元串的關鍵。


除了直接對Cow<str>使用str中實現的方法來修改字元串之外,還可以使用to_mut()來獲取&String來使用String中實現的方法來修改字元串:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

再重覆一遍:使用to_mut()修改和直接修改Cow<B>的不同在於,to_mut()返回的是&mut <B as ToOwned>::Owned(例如String),可以使用BOwned類型(例如String)中額外實現的方法(例如String::push_str);修改Cow<B>的時候,只能使用B中實現的方法(例如上面的+=,也就是str::add_assign)。

消費Cow

在不再需要使用Cow,或者想要完整取得Cow中的對象的所有權的時候,我們可以使用Cow::into_owned方法來消費掉Cow。方法返回的是BOwned類型(例如String)。

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    let owned: String = cow.into_owned();
    
    println!("{owned}");    // Hello World
    println!("{str1}");	    // Hello 
}

在消費掉Cow之後,Cow將不再可用,但它之前借用的原數據不受影響。

用途

說了這麼多,Cow到底有什麼用呢?少複製幾次數據真的那麼重要嗎?讓我們看看標準庫中的String::from_utf8_lossy方法吧。

String::from_utf8_lossy是一個把一個位元組切片(&[u8])按照UTF-8轉換成&str的方法,並且會用“�”字元來替換掉位元組切片中UTF-8不支持的字元。舉個例子:

// 不包含錯誤位元組的情況
fn main() {
    let hello = vec![72, 69, 76, 76, 79];
    let hello = String::from_utf8_lossy(&hello);
    assert_eq!("HELLO", hello);
}

以及:

// 包含錯誤位元組的情況
fn main() {
    let input = b"Hello \xF0\x90\x80World";
    let output = String::from_utf8_lossy(input);
    assert_eq!("Hello �World", output);
}

現在假設我們是Rust標準庫API的設計師,我們要為from_utf8_lossy方法選擇一個恰當的返回類型。

返回&str可以嗎?

最直接的想法就是返回一個&str,就像這樣:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> &'a str {
   todo!()
}

這種方案可以嗎?仔細想想,當位元組切片中有UTF-8中不支持的錯誤字元時,錯誤字元需要被替換成“�”;直接返回&str的話是做不了對字元串內容的修改的。

返回String呢?

順著剛纔的思路,因為我們可能需要修改字元串,所以我們就需要返回&str的棧上類型String,合情合理:

fn from_utf8_lossy(v: &[u8]) -> String {
   todo!()
}

不過,另一個問題冒出來了:雖然返回String完美地解決了修改字元串之後會導致新字元串無處存放的問題,但是如果舊的字元串(位元組切片)不需要修改的話,也需要被覆制到String中,這無形中增加了很多不必要的消耗;而且,位元組切片中有錯誤字元是概率很小的事件,為了小概率事件影響拖累大概率發生的正常情況的性能,這值得嗎?

這時,我一拍大腿:在需要修改時返回String,不需要修改時返回&str不就好了?

返回(Option<&str>, Option<String>)(或者Either<&str, String>

這樣,上面所描述的性能和功能矛盾就解決了:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> (Option<&'a str>, Option<String>) {
   todo!()
}

但這種解決方式也不是沒問題的:太複雜了……而且需要用戶判斷返回的是&str還是String。不過,這個要麼返回借用的&str、要麼返回有所有權的String的東西,是不是感覺有點眼熟?

這不就是Cow<str>嘛!

最終方案:返回Cow<str>

經過一番艱難而複雜的思考,我們最終得到了最恰當的結果:

fn from_utf8_lossy(v: &[u8]) -> Cow<'_, str> {
    todo!()
}

使用了Cow<str>之後,它不僅可以在需要修改字元串時克隆並返回新數據,更可以在絕大多數普通情況之下直接借用數據;更妙的是,它可以享受Deref轉換的語法糖,可謂十分完美!

總結

Cow是Rust中非常有用的一個類型,雖然日常開發中幾乎用不到它,但是某些性能敏感的場景下善用Cow說不定會有奇效喔~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 一、錯誤類型 任何一個框架,對於錯誤的處理都是一種必備的能力 在Vue 中,則是定義了一套對應的錯誤處理規則給到使用者,且在源代碼級別,對部分必要的過程做了一定的錯誤處理。 主要的錯誤來源包括: 後端介面錯誤 代碼中本身邏輯錯誤 二、如何 ...
  • accent-color 是從 Chrome 93 開始被得到支持的一個不算太新屬性。之前一直沒有好好介紹一下這個屬性。直到最近在給一些系統整體切換主題色的時候,更深入的瞭解了一下這個屬性。 簡單而言,CSS accent-color 支持使用幾行簡單的 CSS 為表單元素著色,是的,只需幾行代碼就 ...
  • 寫在前面 我知道自己現在的狀態很不好,以為放個假能好好放鬆下心情,結果昨晚做夢還在工作,調試代碼,和領導彙報工作。 天吶,明明是在放假,可大腦還在考慮工作的事,我的天那,這是怎麼了? Vue頁面參數傳遞 1、任務拆解 頁面跳轉時帶上當前電子書id參數ebookId 新增/編輯文檔時,讀取電子書id參 ...
  • 1. 有人說 Python 性能沒那麼 Low? 這個我用 pypy 2.7 確認了下,確實沒那麼差, 如果用 NumPy 或其他版本 Python 的話,性能更快。但 pypy 還不完善,pypy3 在 beta, 所以一般情況,我是說一般情況下,這點比較讓人不爽。 2. 有人說怎麼沒有 C#、R ...
  • 歡迎來到從零開始學Spring Boot的旅程!在Spring Boot中,返回JSON數據是很常見的需求,特別是當我們構建RESTful API時。我們對上一篇的Hello World進行簡單的修改。 添加依賴 首先,確保你的build.gradle文件中已經包含了Spring Web的依賴,因為 ...
  • 現在免費證書只能申請三個月(之前還能申請十二個月),擁有acme能力對於小的站點來說就比較需要,可以比較好的部署也不用關心TLS帶來的煩惱。 ...
  • ORM,全稱為Object-Relational Mapping,即對象關係映射,是一種程式技術,用於實現面向對象編程語言里不同類型系統的數據之間的轉換。從效果上說,它其實是創建了一個可在編程語言里使用的“虛擬對象資料庫”。 ORM技術位於應用和資料庫之間,作為一層中間件,用於實體對象(例如 POJ ...
  • Java 包和 API Java 中的包 用於將相關的類分組在一起。可以將其視為文件目錄中的一個文件夾。我們使用包來避免名稱衝突,並編寫更易於維護的代碼。 包分為兩類: 內置包(來自 Java API 的包) 用戶定義的包(創建自己的包) 內置包 Java API 是一個預先編寫的類庫,可以在 Ja ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...