基本類型 Rust 每個值都有其確切的數據類型,總的來說可以分為兩類:基本類型和複合類型。 基本類型意味著它們往往是一個最小化原子類型,無法解構為其它類型(一般意義上來說),由以下組成: 數值類型: 有符號整數 (i8, i16, i32, i64, isize)、 無符號整數 (u8, u16, ...
基本類型
Rust 每個值都有其確切的數據類型,總的來說可以分為兩類:基本類型和複合類型。 基本類型意味著它們往往是一個最小化原子類型,無法解構為其它類型(一般意義上來說),由以下組成:
- 數值類型: 有符號整數 (
i8
,i16
,i32
,i64
,isize
)、 無符號整數 (u8
,u16
,u32
,u64
,usize
) 、浮點數 (f32
,f64
)、以及有理數、複數 - 字元串:字元串字面量和字元串切片
&str
- 布爾類型:
true
和false
- 字元類型: 表示單個 Unicode 字元,存儲為 4 個位元組
- 單元類型: 即
()
,其唯一的值也是()
類型推導與標註
Rust 是一門靜態類型語言,也就是編譯器必須在編譯期知道我們所有變數的類型,但這不意味著你需要為每個變數指定類型,因為 Rust 編譯器可以根據變數的值和上下文中的使用方式來自動推導出變數的類型,但在某些情況下,它無法推導出變數類型,需要手動去給予一個類型標註
整數
整數是沒有小數部分的數字。之前使用過的 i32
類型,表示有符號的 32 位整數( i
是英文單詞 integer 的首字母,與之相反的是 u
,代表無符號 unsigned
類型)。下表顯示了 Rust 中的內置的整數類型:
長度 | 有符號類型 | 無符號類型 |
---|---|---|
8 位 | i8 | u8 |
16 位 | i16 | u16 |
32 位 | i32 | u32 |
64 位 | i64 | u64 |
128 位 | i128 | u128 |
視架構而定 | isize | usize |
類型定義的形式統一為:有無符號 + 類型大小(位數)
。無符號數表示數字只能取正數,而有符號則表示數字既可以取正數又可以取負數。就像在紙上寫數字一樣:當要強調符號時,數字前面可以帶上正號或負號;然而,當很明顯確定數字為正數時,就不需要加上正號了。有符號數字以補碼形式存儲。
每個有符號類型規定的數字範圍是 -(2n - 1) ~ 2n - 1 - 1,其中 n
是該定義形式的位長度。因此 i8
可存儲數字範圍是 -(27) ~ 27 - 1,即 -128 ~ 127。無符號類型可以存儲的數字範圍是 0 ~ 2n - 1,所以 u8
能夠存儲的數字為 0 ~ 28 - 1,即 0 ~ 255。
此外,isize
和 usize
類型取決於程式運行的電腦 CPU 類型: 若 CPU 是 32 位的,則這兩個類型是 32 位的,同理,若 CPU 是 64 位,那麼它們則是 64 位。
整形字面量可以用下表的形式書寫:
數字字面量 | 示例 |
---|---|
十進位 | 98_222 |
十六進位 | 0xff |
八進位 | 0o77 |
二進位 | 0b1111_0000 |
位元組 (僅限於 u8) | b'A' |
這麼多類型,有沒有一個簡單的使用準則?答案是肯定的, Rust 整型預設使用 i32
,例如 let i = 1
,那 i
就是 i32
類型,因此你可以首選它,同時該類型也往往是性能最好的isize
和 usize
的主要應用場景是用作集合的索引。
整型溢出
假設有一個 u8
,它可以存放從 0 到 255 的值。那麼當你將其修改為範圍之外的值,比如 256,則會發生整型溢出。關於這一行為 Rust 有一些有趣的規則:當在 debug 模式編譯時,Rust 會檢查整型溢出,若存在這些問題,則使程式在編譯時 panic(崩潰,Rust 使用這個術語來表明程式因錯誤而退出)。
在當使用 --release
參數進行 release 模式構建時,Rust 不檢測溢出。相反,當檢測到整型溢出時,Rust 會按照補碼迴圈溢出(two’s complement wrapping)的規則處理。簡而言之,大於該類型最大值的數值會被補碼轉換成該類型能夠支持的對應數字的最小值。比如在 u8
的情況下,256 變成 0,257 變成 1,依此類推。程式不會 panic,但是該變數的值可能不是你期望的值。依賴這種預設行為的代碼都應該被認為是錯誤的代碼。
要顯式處理可能的溢出,可以使用標準庫針對原始數字類型提供的這些方法:
- 使用
wrapping_*
方法在所有模式下都按照補碼迴圈溢出規則處理,例如wrapping_add
- 如果使用
checked_*
方法時發生溢出,則返回None
值 - 使用
overflowing_*
方法返回該值和一個指示是否存在溢出的布爾值 - 使用
saturating_*
方法使值達到最小值或最大值
浮點數
按照存儲大小,把浮點型劃分為 f32
和 f64
。其中 f64
是預設的浮點類型。
f32
又稱為 單精度浮點型。f64
又稱為 雙精度浮點型,它是 Rust 預設的浮點類型.
Rust 中不能將 0.0
賦值給任意一個整型,也不能將 0
賦值給任意一個浮點型。
fn main() {
let x = 2.0; // f64
let y: f32 = 3.0; // f32
}
_下劃線
當數字很大的時候,Rust 可以用 **(_下劃線) ** ,來讓數字變得可讀性更好。
PLAINTEXT
let price12 =1_000_000;
println!("price12 {}", price12); //輸出 price12 1000000
let price13 =1_000_000.666_123;
println!("price13 {}", price13);//輸出 price13 1000000.666123
浮點數陷阱
浮點數由於底層格式的特殊性,導致瞭如果在使用浮點數時不夠謹慎,就可能造成危險,有兩個原因:
- 浮點數往往是你想要數字的近似表達 浮點數類型是基於二進位實現的,但是我們想要計算的數字往往是基於十進位,例如
0.1
在二進位上並不存在精確的表達形式,但是在十進位上就存在。這種不匹配性導致一定的歧義性,更多的,雖然浮點數能代表真實的數值,但是由於底層格式問題,它往往受限於定長的浮點數精度,如果你想要表達完全精準的真實數字,只有使用無限精度的浮點數才行 - 浮點數在某些特性上是反直覺的 例如大家都會覺得浮點數可以進行比較,對吧?是的,它們確實可以使用
>
,>=
等進行比較,但是在某些場景下,這種直覺上的比較特性反而會害了你。因為f32
,f64
上的比較運算實現的是std::cmp::PartialEq
特征(類似其他語言的介面),但是並沒有實現std::cmp::Eq
特征,但是後者在其它數值類型上都有定義,說了這麼多,可能大家還是雲里霧裡,用一個例子來舉例:
Rust 的
HashMap
數據結構,是一個 KV 類型的 Hash Map 實現,它對於K
沒有特定類型的限制,但是要求能用作K
的類型必須實現了std::cmp::Eq
特征,因此這意味著你無法使用浮點數作為HashMap
的Key
,來存儲鍵值對,但是作為對比,Rust 的整數類型、字元串類型、布爾類型都實現了該特征,因此可以作為HashMap
的Key
。
為了避免上面說的兩個陷阱,你需要遵守以下準則:
- 避免在浮點數上測試相等性
- 當結果在數學上可能存在未定義時,需要格外的小心
fn main() {
let abc: (f32, f32, f32) = (0.1, 0.2, 0.3);
let xyz: (f64, f64, f64) = (0.1, 0.2, 0.3);
println!("abc (f32)");
println!(" 0.1 + 0.2: {:x}", (abc.0 + abc.1).to_bits());
println!(" 0.3: {:x}", (abc.2).to_bits());
println!();
println!("xyz (f64)");
println!(" 0.1 + 0.2: {:x}", (xyz.0 + xyz.1).to_bits());
println!(" 0.3: {:x}", (xyz.2).to_bits());
println!();
assert!(abc.0 + abc.1 == abc.2);
assert!(xyz.0 + xyz.1 == xyz.2);
}
輸出如下:
abc (f32)
0.1 + 0.2: 3e99999a
0.3: 3e99999a
xyz (f64)
0.1 + 0.2: 3fd3333333333334
0.3: 3fd3333333333333
thread 'main' panicked at 'assertion failed: xyz.0 + xyz.1 == xyz.2',
➥ch2-add-floats.rs.rs:14:5
note: run with `RUST_BACKTRACE=1` environment variable to display
➥a backtrace
對 f32
類型做加法時,0.1 + 0.2
的結果是 3e99999a
,0.3
也是 3e99999a
,因此 f32
下的 0.1 + 0.2 == 0.3
通過測試,但是到了 f64
類型時,結果就不一樣了,因為 f64
精度高很多,因此在小數點非常後面發生了一點微小的變化,0.1 + 0.2
以 4
結尾,但是 0.3
以結尾,這個細微區別導致 f64
下的測試失敗了,並且拋出了異常。
NaN
對於數學上未定義的結果,例如對負數取平方根 -42.1.sqrt()
,會產生一個特殊的結果:Rust 的浮點數類型使用 NaN
(not a number)來處理這些情況。
所有跟 NaN
交互的操作,都會返回一個 NaN
,而且 NaN
不能用來比較,下麵的代碼會崩潰:
fn main() {
let x = (-42.0_f32).sqrt();
assert_eq!(x, x);
}
出於防禦性編程的考慮,可以使用 is_nan()
等方法,可以用來判斷一個數值是否是 NaN
:
fn main() {
let x = (-42.0_f32).sqrt();
if x.is_nan() {
println!("未定義的數學行為")
}
}
數字運算
// 加法
let sum = 5 + 10;
// 減法
let difference = 95.5 - 4.3;
// 乘法
let product = 4 * 30;
// 除法
let quotient = 56.7 / 32.2;
// 求餘
let remainder = 43 % 5;
fn main() {
// 編譯器會進行自動推導,給予twenty i32的類型
let twenty = 20;
// 類型標註
let twenty_one: i32 = 21;
// 通過類型尾碼的方式進行類型標註:22是i32類型
let twenty_two = 22i32;
// 只有同樣類型,才能運算
let addition = twenty + twenty_one + twenty_two;
println!("{} + {} + {} = {}", twenty, twenty_one, twenty_two, addition);
// 對於較長的數字,可以用_進行分割,提升可讀性
let one_million: i64 = 1_000_000;
println!("{}", one_million.pow(2));
// 定義一個f32數組,其中42.0會自動被推導為f32類型
let forty_twos = [
42.0,
42f32,
42.0_f32,
];
// 列印數組中第一個值,並控制小數位為2位
println!("{:.2}", forty_twos[0]);
}
位運算
Rust的運算基本上和其他語言一樣
運算符 | 說明 |
---|---|
& 位與 | 相同位置均為1時則為1,否則為0 |
位或 | |
^ 異或 | 相同位置不相同則為1,相同則為0 |
! 位非 | 把位中的0和1相互取反,即0置為1,1置為0 |
<< 左移 | 所有位向左移動指定位數,右位補零 |
>> 右移 | 所有位向右移動指定位數,左位補零 |
fn main() {
// 二進位為00000010
let a:i32 = 2;
// 二進位為00000011
let b:i32 = 3;
println!("(a & b) value is {}", a & b);
// (a & b) value is 2
println!("(a | b) value is {}", a | b);
// (a | b) value is 3
println!("(a ^ b) value is {}", a ^ b);
// (a ^ b) value is 1
println!("(!b) value is {} ", !b);
// (!b) value is -4
println!("(a << b) value is {}", a << b);
// (a << b) value is 16
println!("(a >> b) value is {}", a >> b);
// (a >> b) value is 0
let mut a = a;
// 註意這些計算符除了!之外都可以加上=進行賦值 (因為!=要用來判斷不等於)
a <<= b;
println!("(a << b) value is {}", a);
// (a << b) value is 16
}
序列(Range)
Rust 提供了一個非常簡潔的方式,用來生成連續的數值,例如 1..5
,生成從 1 到 4 的連續數字,不包含 5 ;1..=5
,生成從 1 到 5 的連續數字,包含 5,它的用途很簡單,常常用於迴圈中:
for i in 1..=5 {
println!("{}",i);
}
最終程式輸出:
1
2
3
4
5
序列只允許用於數字或字元類型,原因是:它們可以連續,同時編譯器在編譯期可以檢查該序列是否為空,字元和數字值是 Rust 中僅有的可以用於判斷是否為空的類型。如下是一個使用字元類型序列的例子:
for i in 'a'..='z' {
println!("{}",i);
}
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
字元
下麵的代碼展示了幾個頗具異域風情的字元:
fn main() {
let c = 'z';
let z = 'ℤ';
let g = '國';
let heart_eyed_cat = '