機器學習【工具】:Numpy基礎

来源:https://www.cnblogs.com/lianzhilei/archive/2018/09/22/9681910.html
-Advertisement-
Play Games

Numpy Numpy 是 Python 數據科學計算的核心庫,提供了高性能的多維數組對象及處理數組的工具 使用方式 數組 生成數組 簡單生成 dtype類型 copy參數 初始化占位符 輸入輸出 保存/讀取 數組信息 索引、切片、比較 切片 比較 數組計算 聚合函數 數組運算 數組操作 拷貝 ...


Numpy

  Numpy 是 Python 數據科學計算的核心庫,提供了高性能的多維數組對象及處理數組的工具

使用方式

import numpy as np

數組

 

生成數組

 簡單生成

a = np.array([1, 2, 3])
# <class 'numpy.ndarray'>
# [1 2 3]

a = np.array([1, '2', 3])     # 取值為字元串
# <class 'numpy.ndarray'>
# ['1' '2' '3']

a = np.array([1, 2.0, 3])     # 取值去float
# <class 'numpy.ndarray'>
# [1. 2. 3.] 

dtype類型

a = np.array([1, 2.0, 3],dtype=np.str)
# <class 'numpy.ndarray'>
# ['1' '2.0' '3']

# 其他類型
# np.int64            帶符號的64位整數
# np.float32           標準雙精度浮點數
# np.complex          顯示為128位浮點數的複數
# np.bool             布爾值:True值和False值
# np.object           Python對象
# np.string_          固定長度字元串
# np.unicode_         固定長度Unicode

copy參數

# copy參數   預設True
a = np.array([1, '2', 3])
b = np.array(a, copy=True)
c = np.array(a, copy=False)
# 635743528800
# 635743684528
# 635743528800

初始化占位符

# 3行4列
a = np.zeros((3, 4))  
# <class 'numpy.ndarray'>
# [[0. 0. 0. 0.]
#  [0. 0. 0. 0.]
#  [0. 0. 0. 0.]]

# 2行3列4縱
a = np.ones((2, 3, 4,2), dtype=np.int16)  
# <class 'numpy.ndarray'>
# [[[1 1 1 1]
#   [1 1 1 1]
#   [1 1 1 1]]
#
#  [[1 1 1 1]
#   [1 1 1 1]
#   [1 1 1 1]]]

# 創建均勻間隔的數組(步進值)
a = np.arange(10, 25, 5)  
# <class 'numpy.ndarray'>
# [10 15 20]

# 創建均勻間隔的數組(樣本數)
a = np.linspace(0, 2, 9)  
# <class 'numpy.ndarray'>
# [0.   0.25 0.5  0.75 1.   1.25 1.5  1.75 2.  ]

# 創建常數數組
a = np.full((2,2),7)  
# <class 'numpy.ndarray'>
# [[7 7]
#  [7 7]]

# 創建2x2單位矩陣
a = np.eye(2)  
# <class 'numpy.ndarray'>
# [[1. 0.]
#  [0. 1.]]

# 創建隨機值的數組
a = np.random.random((2,2)) 
# <class 'numpy.ndarray'>
# [[0.43922179 0.48453874]
#  [0.753194   0.09264839]]

# 創建空數組
a = np.empty((3,2))  
# <class 'numpy.ndarray'>
# [[1.39069238e-309 1.39069238e-309]
#  [1.39069238e-309 1.39069238e-309]
#  [1.39069238e-309 1.39069238e-309]]

 

輸入輸出

保存/讀取

# 保存為npy文件
a = np.full((10,10),7)
# 保存
np.save('my_array', a)
# 讀取
np.load('my_array.npy')

# 保存文本文檔
np.savetxt("myarray.txt", a, delimiter=",")
# 讀取
np.loadtxt("myarray.txt")
# 讀取excel
np.genfromtxt("my_fle.csv", delimiter=',')

數組信息

a = np.zeros((3, 4))
# [[0. 0. 0. 0.]
#  [0. 0. 0. 0.]
#  [0. 0. 0. 0.]]

# 數組形狀,幾行幾列
print(a.shape)
# (3, 4)

# 數組長度
print(len(a))
# 3

# 幾維數組
print(a.ndim)
# 2

# 數組有多少元素
print(a.size)
# 12

# 數據類型
print(a.dtype)
# float64

# 數據類型的名字
print(a.dtype.name)
# float64

# 數據類型轉換
print(a.astype(int))
# [[0 0 0 0]
#  [0 0 0 0]
#  [0 0 0 0]]

  

索引、切片、比較

切片

import numpy as np

matrix = np.array([
                    [5, 10, 15],
                    [20, 25, 30],
                    [35, 40, 45]
                 ])

# 取所有行的第2列
print(matrix[:,1])
# [10 25 40]

# 取所有行的前1、2列
print(matrix[:,0:2])
# [[ 5 10]
#  [20 25]
#  [35 40]]

# 取2、3行的前1、2列
print(matrix[1:3,0:2])
# [[20 25]
#  [35 40]]

比較

import numpy as np

# 獲取比較結果
matrix = np.array([
                    [5, 10, 15],
                    [20, 25, 30],
                    [35, 40, 45]
                 ])
print(matrix == 25)
# [[False False False]
#  [False  True False]
#  [False False False]]

# 根據比較結果取值
vector = np.array([5, 10, 15, 20])
equal_to_ten = (vector == 10)
print(equal_to_ten)
print(vector[equal_to_ten])
# [False  True False False]
# [10]

# 根據比較結果切片取值
matrix = np.array([
                [5, 10, 15],
                [20, 25, 30],
                [35, 40, 45]
             ])
second_column_25 = (matrix[:,1] == 25)
print(second_column_25)
print(matrix[second_column_25, :])
# [False  True False]
# [[20 25 30]]

# 與操作 去比較結果
vector = np.array([5, 10, 15, 20])
equal_to_ten_and_five = (vector == 10) & (vector == 5)
print(equal_to_ten_and_five)
# [False False False False]

# 或操作 去比較結果
vector = np.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)
print(equal_to_ten_or_five)
# [ True  True False False]

# 根據比較結果賦值
vector = np.array([5, 10, 15, 20])
equal_to_ten_or_five = (vector == 10) | (vector == 5)
vector[equal_to_ten_or_five] = 50
print(vector)
# [50 50 15 20]

 

數組計算

聚合函數

# 數據彙總
vector = np.array([5, 10, 15, 20])
print(vector.sum())
# 50

# 二維矩陣彙總
matrix = np.array([
    [5, 10, 15],
    [20, 25, 30],
    [35, 40, 45]
])
print(matrix.sum())
# 225

# 二維橫向彙總
print(matrix.sum(axis=1))
# [ 30  75 120]

# 二維豎向彙總
print(matrix.sum(axis=0))
# [60 75 90]

數組運算

a = np.array([20, 30, 40, 50])
b = np.arange(4)
print(a)
print(b)
# [20 30 40 50]
# [0 1 2 3]

# 減
c = a - b
print(c)
# [20 29 38 47]

# 加
c = a + b
print(c)
# [20 31 42 53]

# 乘
c = a * b
print(c)
# [  0  30  80 150]

# 除
c = b / a
print(c)
# [0.         0.03333333 0.05       0.06      ]

# 2次冪
print(b**2)
# [0 1 4 9]

# 點積  https://www.jianshu.com/p/482abac8798c
A = np.array( [[1,1],
               [0,1]] )
B = np.array( [[2,0],
               [3,4]] )
print(A)
print(B)
print(A.dot(B))
print(np.dot(A, B))
# [[1 1]
#  [0 1]]
# [[2 0]
#  [3 4]]
# [[5 4]
#  [3 4]]
# [[5 4]
#  [3 4]]

import numpy as np
B = np.arange(3)
print(B)
# [0 1 2]

# 冪
print(np.exp(B))   
# [1.         2.71828183 7.3890561 ]

# 平方根
print(np.sqrt(B))
# [0.         1.         1.41421356]

數組操作

import numpy as np

# floor向下取整
a = np.floor(10*np.random.random((3,4)))
print(a)
# [[1. 5. 3. 3.]
#  [3. 3. 2. 6.]
#  [4. 9. 5. 3.]]

# ravel合為一行
print(a.ravel())
# [1. 5. 3. 3. 3. 3. 2. 6. 4. 9. 5. 3.]

# 更換shape形狀
a.shape = (6, 2)
print(a)
# [[1. 5.]
#  [3. 3.]
#  [3. 3.]
#  [2. 6.]
#  [4. 9.]
#  [5. 3.]]

# 橫豎轉換
print(a.T)
# [[1. 3. 3. 2. 4. 5.]
#  [5. 3. 3. 6. 9. 3.]]

# -1 預設值
print(a.reshape(3,-1))
# [[1. 5. 3. 3.]
#  [3. 3. 2. 6.]
#  [4. 9. 5. 3.]]


# 拼接
a = np.floor(10*np.random.random((2,2)))
b = np.floor(10*np.random.random((2,2)))
print(a)
# [[5. 7.]
#  [2. 9.]]
print(b)
# [[7. 4.]
#  [7. 7.]]
print(np.hstack((a,b)))  # 橫向拼接
# [[5. 7. 7. 4.]
#  [2. 9. 7. 7.]]
print(np.vstack((a,b)))  # 縱向拼接
# [[5. 7.]
#  [2. 9.]
#  [7. 4.]
#  [7. 7.]]


# 分割
a = np.floor(10*np.random.random((2,12)))
print(a)
# [[4. 7. 8. 2. 0. 1. 5. 7. 1. 2. 1. 2.]
#  [5. 8. 9. 2. 5. 5. 8. 9. 5. 4. 7. 8.]]

print(np.hsplit(a,3))   # 橫向切割3份
# [array([[4., 7., 8., 2.],
#        [5., 8., 9., 2.]]), array([[0., 1., 5., 7.],
#        [5., 5., 8., 9.]]), array([[1., 2., 1., 2.],
#        [5., 4., 7., 8.]])]

print(np.vsplit(a,2))   # 橫向切割3份
# [array([[4., 7., 8., 2., 0., 1., 5., 7., 1., 2., 1., 2.]]), array([[5., 8., 9., 2., 5., 5., 8., 9., 5., 4., 7., 8.]])]

print(np.hsplit(a,(3,4)))   # 橫向切割3,4
# [array([[9., 3., 0.],
#        [1., 0., 4.]]), array([[7.],
#        [5.]]), array([[8., 5., 7., 7., 4., 9., 8., 2.],
#        [6., 7., 6., 4., 9., 5., 9., 3.]])]

拷貝

# 賦值
a = np.arange(12)
b = a
# a and b are two names for the same ndarray object
# b is a
# True
b.shape = 3,4
print(a.shape)
print(id(a))
print(id(b))
# (3, 4)
# 115753432
# 115753432

# 淺拷貝
c = a.view()
# c is a
# Flase
c.shape = 2,6
#print a.shape
c[0,4] = 1234
print(a)
# [[   0    1    2    3]
#  [1234    5    6    7]
#  [   8    9   10   11]]

# 深拷貝
d = a.copy()
# d is a
# Flase
d[0,0] = 9999
print(d)
print(a)
# [[9999    1    2    3]
#  [1234    5    6    7]
#  [   8    9   10   11]]
# [[   0    1    2    3]
#  [1234    5    6    7]
#  [   8    9   10   11]]

  

 

 

 

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 監控非常有用,不僅能及時預警發現故障,事後還能提供詳實的數據用於追查定位問題。監控也非常重要,從產品的角度來看,沒有監控意味著產品是不可靠不安全的。從技術的角度來看,沒有監控意味著分析bug就如同盲人摸象,不知下次故障何時發生,出現故障後毫無頭緒,無法解決。說到監控大家首先想到的是運維監控,不過監控 ...
  • 1 #include 2 #include 3 4 void* memncpy(void* dest, const void* src, int count){ 5 int i=0; 6 //void *init_dest = dest; 7 char* dest1 = (char*)dest; 8... ...
  • 使用SSDB作為二級緩存,當某個伺服器的文件緩存(一級緩存)過期後,統一去ssdb二級緩存中去取,如果ssdb中也沒有數據,查詢才會落到DB ...
  • java中方法重載是什麼, 實際中到底有什麼意義, 用處?請舉例 ...
  • 在Spring Cloud中Eureka負責服務發現功能。服務發現需要解決如何找到服務提供者在網路中位置的問題。 服務端 在Spring Tool Suite的文件菜單中,點擊新建Spring Starter Project。 然後在入口方法加上 標記。 接著,在application.proper ...
  • Form介紹 之前在HTML頁面中利用form表單向後端提交數據時,都會寫一些獲取用戶輸入的標簽並且用form標簽把它們包起來。 與此同時在好多場景下都需要對用戶的輸入做校驗,比如校驗用戶是否輸入,輸入的長度和格式等正不正確。如果用戶輸入的內容有錯誤就需要在頁面上相應的位置顯示對應的錯誤信息.。 D ...
  • json和pickle的功能是對數據進行序列化 將對象轉換為可通過網路傳輸或可以存儲到本地磁碟的數據格式(如:XML、JSON或特定格式的位元組串)的過程稱為序列化;反之,則稱為反序列化 json模塊 對於Python內置的數據類型(如:str, unicode, int, float, bool, ...
  • 在一個長度為n的數組裡的所有數字都在0到n-1的範圍內。 數組中某些數字是重覆的,但不知道有幾個數字是重覆的。也不知道每個數字重覆幾次。請找出數組中任意一個重覆的數字。 例如,如果輸入長度為7的數組{2,3,1,0,2,5,3},那麼對應的輸出是第一個重覆的數字2。 1.哈希法 2.定義備用數組,作... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...