Numpy的介紹 1. Ndarray:N-dimensional array, N維數組 2. 一種由相同類型的元素組成的多維數組,元素數量是事先指定好的 例:建立Ndarray多維數組 arr = np.array( [ [1,2,3,4], [2,3,4,5] ]) 這是一個二維數組arr.n ...
Numpy的介紹
1. Ndarray:N-dimensional array, N維數組
2. 一種由相同類型的元素組成的多維數組,元素數量是事先指定好的
例:建立Ndarray多維數組 ndarray父類實現矩陣的創建基本方式:
arr = np.array(
[
[1,2,3,4],
[2,3,4,5]
])
這是一個二維數組arr.ndim為2 這個數組的形狀arr.shape為(2, 4)即2行4列
這個數組的元素個數np.size為8個,這個數組的數據類型arr.dtype為int32
shape屬性-->幾行幾列
ndim屬性-->幾維度 向量-->1維度 矩陣-->二維度 數組-->3維度
size屬性-->數組元素的個數
dtype-->元素類型
1 # 矩陣的定義 2 import numpy as np 3 b = np.array([[1,2,3,4], [2,3,4,5]]) 4 print(b) 5 print(type(b)) 6 7 # 矩陣的性質幾行幾列 8 print('shape',b.shape) # (2,4) 9 # 幾維度 向量-->1維度 矩陣-->二維度 數組-->3維度 10 print(b.ndim) # 2 11 # 元素類型 12 print(b.dtype) # int32 13 # 數組元素的個數 14 print(b.size) # 8 => 2*4
3. 元素的數據類型由dtype(data-type)對象來指定,每個ndarray只有一種dtype類型
例:
np.array(['Python','cctv','ibeifeng','hello world'],dtype='|S4')
輸出結果array([b'Pyth', b'cctv', b'ibei', b'hell'], dtype='|S4')
其中S4中的S表示字元串型,4表示每個字元串長度為4,所以輸出結果每個數組只有4個字元
arr3 = np.array(['1','2','3','4'],dtype='int') # 表明arr3為整型
# 輸出array([1, 2, 3, 4])
arr3 = np.array(['1','2','3','4'],dtype='float') # 表明arr3為浮點型
# 輸出array([1., 2., 3., 4.])
4. 大小固定,創建好數組時一旦指定好大小,就不會再發生改變
數組的形狀可以方便的讀取數字例如
arr1 = np.array([[[ 1, 2, 3, 4, 5],
[ 2, 3, 4, 5, 6],
[ 3, 7, 4, 5, 6],
[ 3, 1, 4, 6, 7]],
[[11, 2, 23, 54, 5],
[28, 32, 42, 53, 46],
[35, 27, 74, 55, 86],
[63, 61, 44, 64, 87]]])
這個數組的形狀為(2,4,5)可以通過arr1[0][1][1]這個形式取到3
ndarray的常見創建方式
- array函數:接收一個普通的Python序列,轉成ndarray
- zeros函數:創建指定長度或形狀的全零數組
np.zeros((3,4)) 創建3行4列全為0的數組,且預設為float型
3. ones函數:創建指定長度或形狀的全1數組
np.ones((3,4),dtype=int) 創建3行4列全為1的整形數組,如果沒有dtype=int,預設為float型
4. empty函數:創建一個沒有任何具體值的數組(準確地說是一些未初始化的垃圾值)
np.empty((7,4)) 創建7行4列隨機值數組,float型
ndarray的其他創建方式
1.arrange函數:類似與python的range函數,通過指定開始值、終值和步長來創建一維數組,註意數組不包括終值
np.arange(2,20,3)
# 輸出 array([ 2, 5, 8, 11, 14, 17])
2. linspace函數:通過指定開始值、終值和元素個數來創建一維數組,可以通過endpoint關鍵字指定是否包括終值,預設設置是包括終值,它創建的是等差數列
np.linspace(2,20,3) 包含20
# 輸出 array([ 2., 11., 20.])
3.logspace函數:和linspace類似,但它創建的是等比數列
np.logspace(2,20,3)
# 輸出 array([1.e+02, 1.e+11, 1.e+20])
4.使用隨機數填充數組,即使用numpy.random模塊的random()函數,數組所包含的元素數量由參數決定
np.random.random((2,3,4))
# 輸出 array([[[0.40595225, 0.80061568, 0.16821289, 0.05557114],
[0.96146758, 0.81135374, 0.93132755, 0.11023897],
[0.79526355, 0.61563423, 0.78924163, 0.21849418]],
[[0.36029206, 0.883596 , 0.60343721, 0.38746385],
[0.92802328, 0.91256992, 0.61305594, 0.86444498],
[0.6619579 , 0.55846171, 0.37563522, 0.35721423]]])
np.random.random_sample()生成一位隨機數
ndarry的shape屬性巧算
np.arange(2,20,2).reshape((3,-1)) # -1 則會自動計算維度
# 輸出 array([[ 2, 4, 6],
[ 8, 10, 12],
[14, 16, 18]])
總結:
- 先規範顯示出數組
- 層層去中括弧對,直到無中括弧對,每去一層,一個維度,去掉一層[],後的元素個數(逗號隔開)即該維度的元素個數
NumPy中的數據類型
1. 創建NumPy數組時可以通過dtype屬性顯示指定數據類型,如果不指定,NumPy會自己推斷出合適的數據類型,所以一般無需顯示指定
arr2=np.arange(2,10,2),無需指定可判斷為int32型
2. astype方法,可以轉換數組的元素數據類型,得到一個新數組
arr3 = arr2.astype('float') # 為float64型
# 輸出array([2., 4., 6., 8.])
arr4 = arr2.astype('|U2') # 使用unicode編碼,每個元素長度為2
# 輸出array(['2', '4', '6', '8'], dtype='<U2')
3.數值型dtype的命名方式:一個類型名(比如int、float),後面接著一個用於表示各元素位長的數字
比如表中的雙精度浮點值,即Python中的float對象,需要占用8個位元組(即64位),因此該類型在NumPy中就記為float64
4.每種類型有一個相對應的類型代碼,即簡寫方式,參照下麵的表
改變ndarray的形狀
1. 直接修改ndarray的shape值
2. 使用reshape函數,可以創建一個改變了尺寸的新數組,原數組的shape保持不變,但註意他們共用記憶體空間,
因此修改任何一個也對另一個產生影響,因此註意新數組的元素個數必須與原數組一樣
arr=np.arange(20)
arr.reshape((4,5))
# 輸出array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19]])
reshape函數不會改變原來的ndarray,但是得到的新的ndarray是原數組的視圖
視圖
多個變數使用(指向)一個記憶體地址(空間)
對於ndarray的一些方法操作,首先區分是否會改變原變數,以此來判斷是視圖還是副本
副本
把原來的內容,重新複製(拷貝)了一份新的數據,放到新的記憶體地址(空間)
即使修改了其中一個變數的元素值,並不會影響另外一個變數
3. 當指定新數組某個軸的元素為-1時,將根據數組元素的個數自動計算此軸的長度
arr2=arr.reshape((2,-1))
# array([[ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]])
NumPy基本操作
- 數組與標量、數組之間的運算
- 數組的矩陣積(matrix product)
- 數組的索引與切片
- 數組轉置與軸對換
- 通用函數:快速的元素級數組函數
- 聚合函數
- np.where函數
- np.unique函數
數組與標量、數組之間的運算
- 數組不用迴圈即可對每個元素執行批量運算,這通常就叫做矢量化,即用數組表達式代替迴圈的做法
- 矢量化數組運算性能要比純Python方式快上一兩個數量級
- 大小相等的數組之間的任何算數運算都會將運算應用到元素級
元素級運算
- 像上面例子展現出來的,加、減、乘、除、冪運算等,可以用於數組與標量、大小相等數組之間
- 在NumPy中,大小相等的數組之間運算,為元素級運算,即只用於位置相同的元素之間,所得到的運算結果組成一個新的數組,運算結果的位置跟操作數位置相同
arr1=np.random.random((2,3))
arr2=np.arange(1,7).reshape(2,3) #arr2必須轉換為2行3列才能和arr1進行加、減、
乘、除、冪運算
數組的矩陣積(matrix product)
1. 兩個二維矩陣(多維數組即矩陣)滿足第一個矩陣的列數與第二個矩陣的行數相同,那麼可以進行矩陣乘法,即矩陣積不是元素級的運算
因為矩陣積是第一個矩陣的行與第二個矩陣的列相乘
f
a,b,c . g = a*f+b*g+c*h
(行) h
(列)
註意:矩陣積:第一個矩陣的列軸(水平的軸)要等於第二個矩陣的行軸(垂直的軸)
- 兩個矩陣相乘結果所得到的數組中每個元素為,第一個矩陣中與該元素行號相同的元素與第二個矩陣中與該元素列號相同的元素,兩兩相乘後求和