Python數據分析--工具安裝及Numpy介紹(1)

来源:https://www.cnblogs.com/codingchen/archive/2022/05/19/16284665.html
-Advertisement-
Play Games

Anaconda 是一個跨平臺的版本,通過命令行來管理安裝包。進行大規模數據處理、預測分析和科學計算。它包括近 200 個工具包,大數據處理需要用到的常見包有 NumPy 、 SciPy 、 pandas 、 IPython 、 Matplotlib 、 Scikit-learn 、statsmod ...


Anaconda 是一個跨平臺的版本,通過命令行來管理安裝包。進行大規模數據處理、預測分析和科學計算。它包括近 200 個工具包,大數據處理需要用到的常見包有 NumPy 、 SciPy 、 pandas 、 IPython 、 Matplotlib 、 Scikit-learn 、statsmodels、gensim、nltk、networkx、beautifulsoup4和statsmodels 等。
可以直接通過命令進行安裝。如下圖,分別安裝上述相關文件(示例安裝pandas,其他類似)。

一、NumPy(Numerical Python)

    NumPy是 Python 語言的一個擴展程式庫,支持大量的維度數組與矩陣運算,也針對數組運算提供大量的數學函數庫。NumPy 為開放源代碼並且由許多協作者共同維護開發,是一個運行速度非常快的數學庫,用於數組計算。

     NumPy 通常與 SciPy(Scientific Python)和 Matplotlib(繪圖庫)一起使用,可廣泛用於替代 MatLab,是一個強大的科學計算環境,便於後期學習數據科學和者機器學習。 SciPy 是一個開源的 Python 演算法庫和數學工具包, 包含的模塊有最優化、線性代數、積分、插值、特殊函數、快速傅里葉變換、信號處理和圖像處理、常微分方程求解和其他科學與工程中常用的計算。 

Matplotlib 是 Python 編程語言及其數值數學擴展包 NumPy 的可視化操作界面,是為利用通用的圖形用戶界面工具包,如 Tkinter, wxPython, Qt 或 GTK+ 嚮應用程式嵌入式繪圖提供了應用程式介面(API),前期在數據可視化中做作過簡單的介紹。

1、numpy中的數組操作及代碼

NumPy中的ndarray是一個多維數組對象,該對象由兩部分組成:實際的數據和描述這些數據的元數據,大部分的數組操作僅僅修改元數據部分。

import numpy as np  #導入numpy包,並另命令為np

a = np.arange(5)  # 調用numpy中的函數arange,函數創建數組
print(a.dtype)   # 列印出數組a的數據類型
print(a.shape)  #數組的 shape 屬性返回一個元組(tuple),元組中的元素即為NumPy數組每一個維度上的大小
print('\n')
#創建多維數組
m = np.array([np.arange(5), np.arange(5)]) #列表作為參數傳給array函數,從而創建了一個5×2的數組
print(m)

#選取數組元素
print(m[0,0])
print(m[0,1])
print(m[1,1])
print(m[1,2])
print(m[1,3])

# NumPy 自定義的異構數據類型,該數據類型包括一個用字元串記錄的名字、一個用
# 整數記錄的數字以及一個用浮點數記錄的價格 
t = np.dtype([('name', np.str_, 40), ('numitems', np.int32), ('price',np.float32)])
print(t)

# 一維數組的索引和切片
a = np.arange(9)
print(a[3:7])
print('\n')
#多維數組的切片和索引
b = np.arange(24).reshape(2,3,4)  #reshape函數的作用是改變數組的“形狀”,也就是改變數組的維度
#其參數為一個正整數元組,分別指定數組在每個維度上的大小

print(b.shape)
print('\n')
print(b)
print('\n')
print(b[0])
print('\n')
print(b[:,0,0]) #下標用英文標點的冒號:來代替,表示不限該位置的參數,即列印出b的第1行,第1列的所有元組的數據。

運行結果如下:

至於具體更詳細的用法,可以多試試。

二、numpy改變數組的維度

上述的reshape函數可以將一維數組[0,1,2,...,23]轉變為具有2個元素,每個元素是一個二維數組的三維數組,同樣,也可以將多維數組轉變為一維數組(將數組展平)。

可以用 ravel 等函數完成相關操作,見如下代碼:

import numpy as np  #導入numpy包,並另命令為np

c = np.array([   #先定義一個numpy的多維數組
    [[0,1,2,3],[4,5,6,7],[8,9,10,11]],
    [[12,13, 14,15],[16,17,18,19],[20,21,22,23]]
     ])
e=d=c  
print (c.ravel())
print('\n')
print(c.flatten())
print('\n')
#用元組設置維度
d.shape = (6,4)
print(d)
print('\n')
# transpose用於轉置,即行列互換,即線性代數中的轉置矩陣
print(e.transpose())

運行結果:

三、數組的組合

NumPy數組有水平組合、垂直組合和深度組合等多種組合方式,使用 vstack 、dstack 、 hstack 、 column_stack 、 row_stack 以及 concatenate 等函數來完成數組的組合。

import numpy as np  #導入numpy包,並另命令為np

a = np.arange(9).reshape(3,3)#定義a為3行3列的二維數組
b=2*a #定義b,且b的每個元素均為a的兩倍。

print(a)  #列印出a數列
print('\n')
print(b) #列印出b數列
print('\n')

運行結果:

[[0 1 2]
 [3 4 5]
 [6 7 8]]


[[ 0  2  4]
 [ 6  8 10]
 [12 14 16]] 

分別看一下組合後的運行結果,代碼如下:

import numpy as np  #導入numpy包,並另命令為np

a = np.arange(9).reshape(3,3)   #定義a為3行3列的二維數組
b=2*a  #定義b,且b的每個元素均為a的兩倍,數組結構與a一致。

#水平組合:將ndarray對象構成的元組作為參數,傳給hstack 函數
print(np.hstack((a, b)))  #水平組合
print('\n')
print(np.concatenate((a, b), axis=1))  #註意axis參數
print('\n')
#垂直組合
print(np.vstack((a, b)))
print('\n')
print(np.concatenate((a, b), axis=0))#註意axis=0是預設值,即可以不設置。
print('\n')

運行結果如下:

很明顯,上述函數np.hstack((a,b))的結果顯示為將a的行與b的行連成一個更長的行(np.concatenate()函數一樣,只是多了一個參數),相當於增加了數組的列數。

而np.vstack((a,b)),則是結合成具有更多的行,而列數不變。用二維表示如下:

                                             

接下來看一下深度組合、列組合、行組合

import numpy as np  #導入numpy包,並另命令為np

a = np.arange(9).reshape(3,3)   #定義a為3行3列的二維數組
b=2*a  #定義b,且b的每個元素均為a的兩倍,數組結構與a一致。

#深度組合 將相同的元組作為參數傳給 dstack
print(np.dstack((a, b)))
print('\n')

#列組合
print(np.column_stack((a, b)))#對於二維數組,column_stack 與hstack的效果是相同
print('\n') 
# 行組合
print(np.row_stack((a,b)))#對於二維數組,column_stack與vstack 的效果是相同

 

從上可以看出,深度組合,就是將一系列數組沿著縱軸(深度)方向進行層疊組合,比如這裡只有2個數組a和b,所以深度只有2,由於a和b都是3*3,就形成如下結果:

二維數組中,行組合和列組合與水平組合、垂直組合一樣,不作過多介紹。

四、數組的分割

數組能組合 ,當然也能分割成多個子數組。像組合一樣,也可分為水平分割、垂直分割、深度分割。

1、水平分割 和垂直分割

import numpy as np  #導入numpy包,並另命令為np

a = np.array([[0, 1, 2],[3, 4, 5],[6, 7, 8]]) #定義一個多維數組
#水平分割
print(np.hsplit(a,3))  #hsplit把數組沿著水平方向分割為3個相同大小的子數組
# 或者
print(np.split(a,3,axis=1)) #同hsplit

#垂直分割
print(np.vsplit(a,3))  #vsplit把數組沿著垂直方向分割為3個相同大小的子數組
# 或者
print(np.split(a,3,axis=0)) #同vsplit,註意參數

運行結果:

整理後,得到:[array([[0],[3],[6]]), array([[1], [4],[7]]), array([[2],[5],[8]])]也就是將0,3,6歸為一組,註意:都是分別用"[ ]"和","分開的。

2、深度分割

import numpy as np  #導入numpy包,並另命令為np

c = np.array(np.arange(27).reshape(3, 3, 3))  #創建一個多維數組,並設置
print(np.dsplit(c,3)) 

運行結果如下:

[array([[[ 0],[ 3],[ 6]],[[ 9],[12],[15]],[[18],[21],[24]]]),

array([[[ 1],[ 4],[ 7]],[[10],[13],[16]],[[19],[22],[25]]]),

array([[[ 2],[ 5],[ 8]],[[11],[14],[17]],[[20],[23],[26]]])

]

生成的C數組為 : 

 這三塊數據應該像紙張一樣疊加的,0,3,6的下一層對應的是9,12,15,再下一層是18,21,24。

五、Numpy數組的其他屬性

在開始的代碼中有 .dtype和 .shape分別是數組的兩個不同的屬性,除此之外,還有其他屬性,如下:

import numpy as np  #導入numpy包,並另命令為np

a = np.array([[0, 1, 2],[3, 4, 5],[6, 7, 8]]) #定義一個多維數組
print(a.dtype)    #數組a的數據類型
print(a.shape)    #數組a的維數
print(a.ndim)     #給出數組的維數,或數組軸的個數
print(a.size)     #給出數組元素的總個數
print(a.itemsize) #元素在記憶體中所占的位元組數
print(a.nbytes)   #元素在記憶體中所占的存儲空間,itemsize和size屬性值的乘積

#複數的表示
b =  np.array([1.j + 1, 2.j + 3])
print(b.real)#列印實數
print(b.imag)#列印虛數部分

c = np.arange(4).reshape(2,2)

print(c)

f = c.flat   #flat屬性,可以像遍歷一維數組一樣去遍歷任意的多維數組
for item in f :
    print(item)
    
#或者獲取多個元素
print( c.flat[[1,3]])
#flat 屬性是一個可賦值的屬性。對flat屬性賦值將導致整個數組的元素都被覆蓋
c.flat=5   # 對flat屬性賦值將導致整個數組的元素都被覆蓋
print(c)

b =  np.array([1.j + 1, 2.j + 3])  # 數組的轉換
print( b.tolist())

print( b.astype(int)) #astype 函數可以在轉換數組時指定數據類型int

運行結果如下:

小結:

上述列舉了許多有關NumPy的基礎知識:數據類型和NumPy數組。類似於Python列表,NumPy數組也可以方便地進行切片和索引操作。但在多維數組上,NumPy有明顯的優勢。
對涉及改變數組維度的操作有很多種——組合、調整、設置維度和分割等,列舉了實用函數進行了說明。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 為了助力開發者高效解決崩潰問題,HarmonyOS服務開放平臺推出了“崩潰服務能力”。你是否也好奇崩潰服務能力有哪些功能?如何集成該能力?讓我們一起往下看吧~ ...
  • 之前Content Provider,Room,DataStore一起弄,對於蒟蒻我來說步子邁得太大了,bug滿天飛(DataStore一直給我報錯說同時打開了多個DataStore,卻又找不到問題所在),遂不得不暫且拋下DataStore換回SharedPreference,後來才發現是被Hook ...
  • 5月18日晚上19點,戰“碼”先鋒第一期直播《如何成為一名優秀的OpenHamrony 貢獻者?》,在OpenHarmony社群內成功舉行。 ...
  • 現如今,視頻是用戶記錄生活最熱門的方式,各種App在發佈視頻界面都提供了視頻簡單剪輯的功能。除了增加音樂、濾鏡、貼紙這些基礎功能以外,用戶越來越追求鏡頭感,這往往需要通過專業的視頻剪輯軟體手動打上關鍵幀,進行放大、縮小、移動等操作才能實現,這增加了用戶分享視頻的門檻,不利於UGC內容的生產。 有沒有 ...
  • 1 var a,b,c,swap; 2 a=+prompt(); 3 b=+prompt(); 4 c=+prompt(); 5 //冒泡排序:最壞情況:比較n*(n-1)/2輪,以下是3個數比較,考慮最壞情況要比較3輪 6 if(a>b) 7 { 8 swap=a;//判斷表達式中:第一個值>第二 ...
  • 背景 如今的前端是一個涉獵領域很廣的職業。作為一名前端,我們不僅要開發管理系統、數據中台、還要應對年報開發、節日活動等場景。不僅要會增刪改查,編寫表單,還要具備開發動畫、H5 游戲等能力。能做出很 Cool 的動畫效果,也是一種前端特有的成就感。所以,我們從動畫的實現方法入手,瞭解瀏覽器的渲染,以及 ...
  • 索引:對象或數組的對應位置的名字 數組的索引就是 number 類型的 0,1,2,3... 對象的索引就是 string 類型的屬性名 數字索引簽名:通過定義介面用來約束數組 type numberIndex{ [index:number]:string } const testArray:num ...
  • 這幾天是Spring版本日,很多Spring工件都發佈了新版本, Spring Framework 6.0.0 發佈了第 4 個裡程碑版本,此版本包含所有針對 5.3.20 的修複補丁,以及特定於 6.0 分支的 39 項修複和改進。而今天Spring Boot 2.7.0和Spring Secur ...
一周排行
    -Advertisement-
    Play Games
  • GoF之工廠模式 @目錄GoF之工廠模式每博一文案1. 簡單說明“23種設計模式”1.2 介紹工廠模式的三種形態1.3 簡單工廠模式(靜態工廠模式)1.3.1 簡單工廠模式的優缺點:1.4 工廠方法模式1.4.1 工廠方法模式的優缺點:1.5 抽象工廠模式1.6 抽象工廠模式的優缺點:2. 總結:3 ...
  • 新改進提供的Taurus Rpc 功能,可以簡化微服務間的調用,同時可以不用再手動輸出模塊名稱,或調用路徑,包括負載均衡,這一切,由框架實現並提供了。新的Taurus Rpc 功能,將使得服務間的調用,更加輕鬆、簡約、高效。 ...
  • 本章將和大家分享ES的數據同步方案和ES集群相關知識。廢話不多說,下麵我們直接進入主題。 一、ES數據同步 1、數據同步問題 Elasticsearch中的酒店數據來自於mysql資料庫,因此mysql數據發生改變時,Elasticsearch也必須跟著改變,這個就是Elasticsearch與my ...
  • 引言 在我們之前的文章中介紹過使用Bogus生成模擬測試數據,今天來講解一下功能更加強大自動生成測試數據的工具的庫"AutoFixture"。 什麼是AutoFixture? AutoFixture 是一個針對 .NET 的開源庫,旨在最大程度地減少單元測試中的“安排(Arrange)”階段,以提高 ...
  • 經過前面幾個部分學習,相信學過的同學已經能夠掌握 .NET Emit 這種中間語言,並能使得它來編寫一些應用,以提高程式的性能。隨著 IL 指令篇的結束,本系列也已經接近尾聲,在這接近結束的最後,會提供幾個可供直接使用的示例,以供大伙分析或使用在項目中。 ...
  • 當從不同來源導入Excel數據時,可能存在重覆的記錄。為了確保數據的準確性,通常需要刪除這些重覆的行。手動查找並刪除可能會非常耗費時間,而通過編程腳本則可以實現在短時間內處理大量數據。本文將提供一個使用C# 快速查找並刪除Excel重覆項的免費解決方案。 以下是實現步驟: 1. 首先安裝免費.NET ...
  • C++ 異常處理 C++ 異常處理機制允許程式在運行時處理錯誤或意外情況。它提供了捕獲和處理錯誤的一種結構化方式,使程式更加健壯和可靠。 異常處理的基本概念: 異常: 程式在運行時發生的錯誤或意外情況。 拋出異常: 使用 throw 關鍵字將異常傳遞給調用堆棧。 捕獲異常: 使用 try-catch ...
  • 優秀且經驗豐富的Java開發人員的特征之一是對API的廣泛瞭解,包括JDK和第三方庫。 我花了很多時間來學習API,尤其是在閱讀了Effective Java 3rd Edition之後 ,Joshua Bloch建議在Java 3rd Edition中使用現有的API進行開發,而不是為常見的東西編 ...
  • 框架 · 使用laravel框架,原因:tp的框架路由和orm沒有laravel好用 · 使用強制路由,方便介面多時,分多版本,分文件夾等操作 介面 · 介面開發註意欄位類型,欄位是int,查詢成功失敗都要返回int(對接java等強類型語言方便) · 查詢介面用GET、其他用POST 代碼 · 所 ...
  • 正文 下午找企業的人去鎮上做貸後。 車上聽同事跟那個司機對罵,火星子都快出來了。司機跟那同事更熟一些,連我在內一共就三個人,同事那一手指桑罵槐給我都聽愣了。司機也是老社會人了,馬上聽出來了,為那個無辜的企業經辦人辯護,實際上是為自己辯護。 “這個事情你不能怪企業。”“但他們總不能讓銀行的人全權負責, ...