Rust的Cow類型有什麼用?詳解Cow及其用途

来源:https://www.cnblogs.com/cinea/p/18040997
-Advertisement-
Play Games

Rust的智能指針有哪些?大多數人都能馬上答出Box<T>、Rc<T>和Arc<T>、Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>。 什麼是COW(Copy-On-Write ...


Rust的智能指針有哪些?大多數人都能馬上答出Box<T>Rc<T>Arc<T>Ref<T>和在非同步編程中很常見的Pin<P>等等。不過,有一個可能經常被大多數人遺忘的類型,它功能強大,利用好了可以節省很多複製開銷;它就是這篇文章的主角:Cow<B>

什麼是COW(Copy-On-Write)?

在開始之前,有必要先介紹一下COW(Copy-On-Write,寫時複製)的概念。COW是一種用於資源管理的優化策略,在操作系統中應用非常廣泛。COW的核心思想是當多個任務需要讀取同一個資源(比如記憶體中的數據、文件)的時候,它們會共用同一份資源副本,而不是為每個任務複製一份資源副本。只有當某個任務需要修改這個資源時,才會為這個任務創建一份資源副本。

需要註意的是,上述的整個過程對任務(也就是程式員編寫的用戶程式)來說都是不可見的;對程式員來說,他並不知道他所使用的資源在發生寫操作時才被真正地複製了一份,自始至終他仿佛就像在獨占整份資源一樣。

COW在文件系統、虛擬記憶體管理中都有非常成熟的應用;在編程語言中,也被廣泛應用於優化字元串、集合的處理。

Cow:定義

Rust的Cow<B>是一個枚舉類型,包含兩個成員:BorrowedOwned。不過,我們幾乎不會直接用到它的成員,因為Cow<B>實現了Deref特征,這使得我們可以通過Deref轉換這一語法糖來便捷地直接使用Cow<B>中的內容。有關Deref轉換可以閱讀我之前的文章。

pub enum Cow<'a, B>
where
    B: 'a + ToOwned + ?Sized,
{
    Borrowed(&'a B),
    Owned(<B as ToOwned>::Owned),
}

需要註意一下Cow的模板參數。Cow接受一個生命周期和一個類型B,其中類型B需要實現ToOwned特征;ToOwned特征的介紹可以看之前的文章,這裡僅僅提一下所有實現了Clone的類型都會自動實現ToOwned自身。除此以外,成員Owned的內容類型不是類型B本身,而是類型BToOwned的目標類型(例如對str來說,這個類型是String)。

使用方法

這裡是一段Cow<B>的簡單使用範例:

use std::borrow::Cow;

fn main() {
    let foo = "Hello World";
    let mut bar: Cow<str> = Cow::from(foo);
    println!("{bar}");      // 這裡沒有發生複製
    
    bar.to_mut().push_str(" Rust");  // 這裡發生了複製
    println!("{bar}");
    
    println!("{foo}");      // 原來的字元串foo仍然可用,而且沒有變化
}

Cow的構造

Cow<B>是一個枚舉,所以首先它是可以直接從它的成員BorrowedOwned來構造的:

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::Borrowed(str_);
    let bar: Cow<str> = Cow::Owned(string);
    
    // 這裡string不再可用
    // println!("{string}");
}

除此以外,標準庫中的五對實現了ToOwned的類型(str/String[T]/Vec<T>CStr/CStringOsStr/OsStringPath/PathBuf)也可以使用From::from來構造Cow<B>

use std::borrow::Cow;

fn main() {
    let str_ = "Hello World";
    let string = String::from("Hello World!");
    
    let foo: Cow<str> = Cow::from(str_);	// from -> Borrowed
    let bar: Cow<str> = Cow::from(string);	// from -> Owned
    
    // 這裡string不再可用
    // println!("{string}");
}

使用From::from時,Rust會自動為我們匹配正確的類型(&'a str/String等),一般情況下推薦使用from來構造Cow,而不是手動指定Borrowed/Owned

deref和to_mut

前面提到過,Cow<B>實現了Deref<B>特征,這意味著我們不需要做任何操作就可以享受Deref轉換的語法糖:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    let str2: &str = &cow;  // 註意看,我們把&Cow<str>賦給了&str
    
    println!("{str2}"); // Hello World
    println!("{cow}");  // Hello World
    println!("{str1}"); // Hello World
}
use std::borrow::Cow;

fn main() {
    let str1 = "Hello World";
    let cow: Cow<str> = Cow::from(str1);
    
    cow.split(" ").for_each(|s|println!("{s}"));	// 使用str的方法split也不在話下
}

不過,Cow<B>並沒有實現DerefMut;這意味著我們對Cow的修改不會影響到底層的內容,相反地,當我們試圖修改Cow時,Cow會生成一個副本,並且修改這個擁有所有權的副本:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow += " World";
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

我們可以多加一點輸出代碼,來看看具體發生了什麼:

#![feature(cow_is_borrowed)]
use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello, borrowed = true
    
    cow += " World";
    
    println!("cow = {cow}, borrowed = {}", cow.is_borrowed());	// cow = Hello World, borrowed = false
    println!("str1 = {str1}");									// str1 = Hello
}

修改了cow變數後,它不再處於借用狀態,而是擁有了這段字元串的所有權——這也是它能夠安全地修改這段字元串的關鍵。


除了直接對Cow<str>使用str中實現的方法來修改字元串之外,還可以使用to_mut()來獲取&String來使用String中實現的方法來修改字元串:

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    println!("cow = {cow}");	// cow = Hello World
    println!("str1 = {str1}");	// str1 = Hello 
}

再重覆一遍:使用to_mut()修改和直接修改Cow<B>的不同在於,to_mut()返回的是&mut <B as ToOwned>::Owned(例如String),可以使用BOwned類型(例如String)中額外實現的方法(例如String::push_str);修改Cow<B>的時候,只能使用B中實現的方法(例如上面的+=,也就是str::add_assign)。

消費Cow

在不再需要使用Cow,或者想要完整取得Cow中的對象的所有權的時候,我們可以使用Cow::into_owned方法來消費掉Cow。方法返回的是BOwned類型(例如String)。

use std::borrow::Cow;

fn main() {
    let str1 = "Hello";
    let mut cow: Cow<str> = Cow::from(str1);
    
    cow.to_mut().push_str(" World");
    
    let owned: String = cow.into_owned();
    
    println!("{owned}");    // Hello World
    println!("{str1}");	    // Hello 
}

在消費掉Cow之後,Cow將不再可用,但它之前借用的原數據不受影響。

用途

說了這麼多,Cow到底有什麼用呢?少複製幾次數據真的那麼重要嗎?讓我們看看標準庫中的String::from_utf8_lossy方法吧。

String::from_utf8_lossy是一個把一個位元組切片(&[u8])按照UTF-8轉換成&str的方法,並且會用“�”字元來替換掉位元組切片中UTF-8不支持的字元。舉個例子:

// 不包含錯誤位元組的情況
fn main() {
    let hello = vec![72, 69, 76, 76, 79];
    let hello = String::from_utf8_lossy(&hello);
    assert_eq!("HELLO", hello);
}

以及:

// 包含錯誤位元組的情況
fn main() {
    let input = b"Hello \xF0\x90\x80World";
    let output = String::from_utf8_lossy(input);
    assert_eq!("Hello �World", output);
}

現在假設我們是Rust標準庫API的設計師,我們要為from_utf8_lossy方法選擇一個恰當的返回類型。

返回&str可以嗎?

最直接的想法就是返回一個&str,就像這樣:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> &'a str {
   todo!()
}

這種方案可以嗎?仔細想想,當位元組切片中有UTF-8中不支持的錯誤字元時,錯誤字元需要被替換成“�”;直接返回&str的話是做不了對字元串內容的修改的。

返回String呢?

順著剛纔的思路,因為我們可能需要修改字元串,所以我們就需要返回&str的棧上類型String,合情合理:

fn from_utf8_lossy(v: &[u8]) -> String {
   todo!()
}

不過,另一個問題冒出來了:雖然返回String完美地解決了修改字元串之後會導致新字元串無處存放的問題,但是如果舊的字元串(位元組切片)不需要修改的話,也需要被覆制到String中,這無形中增加了很多不必要的消耗;而且,位元組切片中有錯誤字元是概率很小的事件,為了小概率事件影響拖累大概率發生的正常情況的性能,這值得嗎?

這時,我一拍大腿:在需要修改時返回String,不需要修改時返回&str不就好了?

返回(Option<&str>, Option<String>)(或者Either<&str, String>

這樣,上面所描述的性能和功能矛盾就解決了:

fn from_utf8_lossy<'a>(v: &'a [u8]) -> (Option<&'a str>, Option<String>) {
   todo!()
}

但這種解決方式也不是沒問題的:太複雜了……而且需要用戶判斷返回的是&str還是String。不過,這個要麼返回借用的&str、要麼返回有所有權的String的東西,是不是感覺有點眼熟?

這不就是Cow<str>嘛!

最終方案:返回Cow<str>

經過一番艱難而複雜的思考,我們最終得到了最恰當的結果:

fn from_utf8_lossy(v: &[u8]) -> Cow<'_, str> {
    todo!()
}

使用了Cow<str>之後,它不僅可以在需要修改字元串時克隆並返回新數據,更可以在絕大多數普通情況之下直接借用數據;更妙的是,它可以享受Deref轉換的語法糖,可謂十分完美!

總結

Cow是Rust中非常有用的一個類型,雖然日常開發中幾乎用不到它,但是某些性能敏感的場景下善用Cow說不定會有奇效喔~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 一、錯誤類型 任何一個框架,對於錯誤的處理都是一種必備的能力 在Vue 中,則是定義了一套對應的錯誤處理規則給到使用者,且在源代碼級別,對部分必要的過程做了一定的錯誤處理。 主要的錯誤來源包括: 後端介面錯誤 代碼中本身邏輯錯誤 二、如何 ...
  • accent-color 是從 Chrome 93 開始被得到支持的一個不算太新屬性。之前一直沒有好好介紹一下這個屬性。直到最近在給一些系統整體切換主題色的時候,更深入的瞭解了一下這個屬性。 簡單而言,CSS accent-color 支持使用幾行簡單的 CSS 為表單元素著色,是的,只需幾行代碼就 ...
  • 寫在前面 我知道自己現在的狀態很不好,以為放個假能好好放鬆下心情,結果昨晚做夢還在工作,調試代碼,和領導彙報工作。 天吶,明明是在放假,可大腦還在考慮工作的事,我的天那,這是怎麼了? Vue頁面參數傳遞 1、任務拆解 頁面跳轉時帶上當前電子書id參數ebookId 新增/編輯文檔時,讀取電子書id參 ...
  • 1. 有人說 Python 性能沒那麼 Low? 這個我用 pypy 2.7 確認了下,確實沒那麼差, 如果用 NumPy 或其他版本 Python 的話,性能更快。但 pypy 還不完善,pypy3 在 beta, 所以一般情況,我是說一般情況下,這點比較讓人不爽。 2. 有人說怎麼沒有 C#、R ...
  • 歡迎來到從零開始學Spring Boot的旅程!在Spring Boot中,返回JSON數據是很常見的需求,特別是當我們構建RESTful API時。我們對上一篇的Hello World進行簡單的修改。 添加依賴 首先,確保你的build.gradle文件中已經包含了Spring Web的依賴,因為 ...
  • 現在免費證書只能申請三個月(之前還能申請十二個月),擁有acme能力對於小的站點來說就比較需要,可以比較好的部署也不用關心TLS帶來的煩惱。 ...
  • ORM,全稱為Object-Relational Mapping,即對象關係映射,是一種程式技術,用於實現面向對象編程語言里不同類型系統的數據之間的轉換。從效果上說,它其實是創建了一個可在編程語言里使用的“虛擬對象資料庫”。 ORM技術位於應用和資料庫之間,作為一層中間件,用於實體對象(例如 POJ ...
  • Java 包和 API Java 中的包 用於將相關的類分組在一起。可以將其視為文件目錄中的一個文件夾。我們使用包來避免名稱衝突,並編寫更易於維護的代碼。 包分為兩類: 內置包(來自 Java API 的包) 用戶定義的包(創建自己的包) 內置包 Java API 是一個預先編寫的類庫,可以在 Ja ...
一周排行
    -Advertisement-
    Play Games
  • 1、預覽地址:http://139.155.137.144:9012 2、qq群:801913255 一、前言 隨著網路的發展,企業對於信息系統數據的保密工作愈發重視,不同身份、角色對於數據的訪問許可權都應該大相徑庭。 列如 1、不同登錄人員對一個數據列表的可見度是不一樣的,如數據列、數據行、數據按鈕 ...
  • 前言 上一篇文章寫瞭如何使用RabbitMQ做個簡單的發送郵件項目,然後評論也是比較多,也是準備去學習一下如何確保RabbitMQ的消息可靠性,但是由於時間原因,先來說說設計模式中的簡單工廠模式吧! 在瞭解簡單工廠模式之前,我們要知道C#是一款面向對象的高級程式語言。它有3大特性,封裝、繼承、多態。 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 介紹 Nodify是一個WPF基於節點的編輯器控制項,其中包含一系列節點、連接和連接器組件,旨在簡化構建基於節點的工具的過程 ...
  • 創建一個webapi項目做測試使用。 創建新控制器,搭建一個基礎框架,包括獲取當天日期、wiki的請求地址等 創建一個Http請求幫助類以及方法,用於獲取指定URL的信息 使用http請求訪問指定url,先運行一下,看看返回的內容。內容如圖右邊所示,實際上是一個Json數據。我們主要解析 大事記 部 ...
  • 最近在不少自媒體上看到有關.NET與C#的資訊與評價,感覺大家對.NET與C#還是不太瞭解,尤其是對2016年6月發佈的跨平臺.NET Core 1.0,更是知之甚少。在考慮一番之後,還是決定寫點東西總結一下,也回顧一下.NET的發展歷史。 首先,你沒看錯,.NET是跨平臺的,可以在Windows、 ...
  • Nodify學習 一:介紹與使用 - 可樂_加冰 - 博客園 (cnblogs.com) Nodify學習 二:添加節點 - 可樂_加冰 - 博客園 (cnblogs.com) 添加節點(nodes) 通過上一篇我們已經創建好了編輯器實例現在我們為編輯器添加一個節點 添加model和viewmode ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...
  • 類型檢查和轉換:當你需要檢查對象是否為特定類型,並且希望在同一時間內將其轉換為那個類型時,模式匹配提供了一種更簡潔的方式來完成這一任務,避免了使用傳統的as和is操作符後還需要進行額外的null檢查。 複雜條件邏輯:在處理複雜的條件邏輯時,特別是涉及到多個條件和類型的情況下,使用模式匹配可以使代碼更 ...
  • 在日常開發中,我們經常需要和文件打交道,特別是桌面開發,有時候就會需要載入大批量的文件,而且可能還會存在部分文件缺失的情況,那麼如何才能快速的判斷文件是否存在呢?如果處理不當的,且文件數量比較多的時候,可能會造成卡頓等情況,進而影響程式的使用體驗。今天就以一個簡單的小例子,簡述兩種不同的判斷文件是否... ...
  • 前言 資料庫併發,數據審計和軟刪除一直是數據持久化方面的經典問題。早些時候,這些工作需要手寫複雜的SQL或者通過存儲過程和觸發器實現。手寫複雜SQL對軟體可維護性構成了相當大的挑戰,隨著SQL字數的變多,用到的嵌套和複雜語法增加,可讀性和可維護性的難度是幾何級暴漲。因此如何在實現功能的同時控制這些S ...