一: 背景 最近在看 C++ 的右值引用和移動構造函數,感覺這東西一時半會還挺難理解的,可能是沒踩過這方面的坑,所以沒有那麼大的深有體會,不管怎麼說,這一篇我試著聊一下。 二: 右值引用 1. 它到底解決了什麼問題? 在其他編程語言中,很少聽到 右值引用 這個詞,我個人感覺還是 C++ 這個 值類型 ...
一: 背景
最近在看 C++ 的右值引用和移動構造函數,感覺這東西一時半會還挺難理解的,可能是沒踩過這方面的坑,所以沒有那麼大的深有體會,不管怎麼說,這一篇我試著聊一下。
二: 右值引用
1. 它到底解決了什麼問題?
在其他編程語言中,很少聽到 右值引用
這個詞,我個人感覺還是 C++
這個 值類型
優先的語言基因決定的,我們都知道 值類型
作為方法參數或者返回值時會生成自身的副本,如果 值類型
很大,那一來一回生成若幹個深複製的 臨時對象 將會產生巨大的性能開銷。
總結一句話:
右值引用
就是儘可能的減少這中間臨時對象
個數,尤其是關聯到 heap 上的對象,僅此而已。
2. 右值引用是個什麼樣子?
說到 右值引用
得先說什麼是 右值,左值
, 左值
一般都是帶有記憶體地址的變數,而 右值
一般是立即數或者運算過程中的臨時對象,這種對象不會有地址值,是不是很繞,我舉個例子吧。
int main()
{
int i = 10;
int j = 11;
int sum = i + j;
}
- 10,11,(i+j)
屬於右值,因為它本身沒有記憶體地址,除非把它們放入到棧中或者堆中。
- i,j,sum
屬於左值,因為它們是線程棧上地址的標識符。
知道了 左右值
概念,接下來理解 左右值引用
就很簡單了,既然是 引用
,必然是多個變數指向同一個地址,對吧,修改下代碼如下:
int main()
{
int i = 10;
int& k = i; //左值引用
int&& m = 10; //右值引用
}
接下來看下彙編代碼:
33: int i = 10;
00FB182F mov dword ptr [ebp-0Ch],0Ah
34: int& k = i;
00FB182F mov dword ptr [ebp-0Ch],0Ah
00FB1836 lea eax,[ebp-0Ch]
00FB1839 mov dword ptr [ebp-18h],eax
36: int&& m = 10;
00FB183C mov dword ptr [ebp-30h],0Ah
00FB1843 lea eax,[ebp-30h]
00FB1846 mov dword ptr [ebp-24h],eax
從彙編代碼看,它們是一模一樣的,也就是說在彙編層面,其實並沒有 右值引用
和 左值引用
一說。
有了這些基礎,我們來看下更複雜的 class 結構。
三: 右值引用如何減少對象的創建
1. 簡要思路
其實仔細想一想,減少臨時對象的創建,無非就是在運算過程中復用一些對象,不需要每次都走賦值構造函數來進行深複製,畫個圖就像下麵這樣。
明白了這個思路,接下來我們舉一個例子說明。
2. 一個簡單的例子
C++ 最煩的地方就是有太多的構造函數
, 數不勝數,太尷尬了,這裡我做一個簡單的 +
操作例子。
#include <iostream>
#include <vector>
using namespace std;
class StringBuidler {
public:
char* str;
int length;
public:
StringBuidler() {}
StringBuidler(int len, char c) {
this->str = new char[len];
this->str[0] = c;
this->length = len;
}
StringBuidler(const StringBuidler& s) {
printf("StringBuidler:深複製 \n");
this->length = s.length;
this->str = new char[s.length];
for (size_t i = 0; i < length; i++)
{
this->str[i] = s.str[i];
}
}
StringBuidler operator+(const StringBuidler& p) {
StringBuidler tmp;
tmp.length = this->length + p.length;
tmp.str = new char[tmp.length];
int index = 0;
for (size_t i = 0; i < this->length; i++)
{
tmp.str[index++] = this->str[i];
}
for (size_t i = 0; i < p.length; i++)
{
tmp.str[index++] = p.str[i];
}
return tmp;
}
};
int main()
{
StringBuidler s1(10, 'a');
StringBuidler s2(5, 'b');
StringBuidler s3 = s1 + s2;
printf("s3.length=%d, s1.length=%d, s2.length=%d \n", s3.length, s1.length, s2.length);
}
從這個例子中可以看到,s1+s2
操作中出現了一次 深copy
,具體代碼出現在 return
處,彙編代碼如下:
因為是深複製,所以會再次生成一個 new char[]
,如果 new char[]
很大,那將會是不必要的性能開銷,能不能像我畫的圖一樣,將 s3 中的 str
指針直接指向 tmp 所持有的 heap 上的 char[]
數組來達到復用目的呢? 肯定是可以的。
3. 性能優化方案
這裡需要用 右值引用
+ 移動構造函數
讓 s3.str
指向 tmp.str
,從而避免複製構造函數,在 StringBuilder 類中加一個方法如下:
StringBuidler(StringBuidler&& s) {
this->str = s.str;
this->length = s.length;
s.str = nullptr;
}
然後把程式跑起來,截圖如下:
可以看到,深複製已經沒有了,這個過程會在 return
處被調用,編譯器會判斷如果是右值的話,自動走 移動構造函數
,沒有這個函數就會走 賦值構造函數
。
四: 總結
總之 右值引用
可以讓你儘可能的復用一些中間對象,達到一個性能上的提升,其實對 C# 程式員來說,這麼簡單的引用賦值,C++ 搞出了這麼多概念,真的很難理解,可能還是那句話,這是 C++ 的值類型優先的基因決定的。