【numpy基礎】--聚合計算

来源:https://www.cnblogs.com/wang_yb/archive/2023/06/26/17505273.html
-Advertisement-
Play Games

上一篇介紹的**通用計算**是關於多個`numpy`數組的計算, 本篇介紹的**聚合計算**一般是針對單個數據集的各種統計結果,同樣,使用**聚合函數**,也可以避免繁瑣的迴圈語句的編寫。 # 元素的和 數組中的元素求和也就是合計值。 ## 調用方式 **聚合計算**有兩種調用方式,一種是面向對象的 ...


上一篇介紹的通用計算是關於多個numpy數組的計算,
本篇介紹的聚合計算一般是針對單個數據集的各種統計結果,同樣,使用聚合函數,也可以避免繁瑣的迴圈語句的編寫。

元素的和

數組中的元素求和也就是合計值。

調用方式

聚合計算有兩種調用方式,一種是面向對象的方式,作為numpy數組對象的方法來調用:

import numpy as np

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[8 3 4]
 [4 4 1]
 [6 6 3]]

arr.sum()
#運行結果
39

另一種是函數式調用的方式:

import numpy as np

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[8 3 4]
 [4 4 1]
 [6 6 3]]

np.sum(arr)
#運行結果
39

下麵演示各種聚合計算的方法時,都採用函數式調用的方式,不再一一贅述了。

整體統計

整體統計就是統計數組所有值的

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

np.sum(arr)
#運行結果:30

按維度統計

比如上面的二維數組,按維度統計就是按行或者列來統計,而不是把所有值加在一起。

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#統計每列的合計值
np.sum(arr, axis=0)
#運行結果:array([ 8, 14,  8])

#統計每行的合計值
np.sum(arr, axis=1)
#運行結果:array([10, 12,  8])

元素的積

元素的積的聚合統計就是各個元素相乘的結果。
對應的函數是:np.prod

整體統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

np.prod(arr)
#運行結果:3240

按維度統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#統計每列的聚合值
np.prod(arr, axis=0)
#運行結果:array([ 6, 54, 10])

#統計每行的聚合值
np.prod(arr, axis=1)
#運行結果:array([18, 18, 10])

元素的平均值和中位數

平均值對應的函數是:np.mean,中位數對應的函數是:np.median

整體統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#平均值
np.mean(arr)
#運行結果:3.33333333

#中位數
np.median(arr)
#運行結果:2.0

按維度統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#按列統計平均值
np.mean(arr, axis=0)
#運行結果:array([2.66666667, 4.66666667, 2.66666667])

#按行統計平均值
np.mean(arr, axis=1)
#運行結果:array([3.33333333, 4.        , 2.66666667])

#按列統計中位數
np.median(arr, axis=0)
#運行結果:array([1., 3., 2.])

#按行統計中位數
np.median(arr, axis=1)
#運行結果:array([3., 2., 2.])

元素的標準差和方差

標準差對應的函數是:np.std,方差對應的函數是:np.var

整體統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#標準差
np.std(arr)
#運行結果:2.6246692913372702

#方差
np.var(arr)
#運行結果:6.888888888888889

按維度統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#按列統計標準差
np.std(arr, axis=0)
#運行結果:array([2.3570226 , 3.09120617, 1.69967317])

#按行統計標準差
np.std(arr, axis=1)
#運行結果:array([2.05480467, 3.55902608, 1.69967317])

#按列統計方差
np.var(arr, axis=0)
#運行結果:array([5.55555556, 9.55555556, 2.88888889])

#按行統計方差
np.var(arr, axis=1)
#運行結果:array([ 4.22222222, 12.66666667,  2.88888889])

最大值和最小值

最大值對應的函數是:np.max,最小值對應的函數是:np.min

整體統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#最大值
np.max(arr)
#運行結果:9

#最小值
np.min(arr)
#運行結果:1

按維度統計

arr = np.random.randint(1, 10, (3, 3))
print(arr)
#運行結果
[[6 3 1]
 [1 9 2]
 [1 2 5]]

#按列統計最大值
np.max(arr, axis=0)
#運行結果:array([6, 9, 5])

#按行統計最大值
np.max(arr, axis=1)
#運行結果:array([6, 9, 5])

#按列統計最小值
np.min(arr, axis=0)
#運行結果:array([1, 2, 1])

#按行統計最小值
np.min(arr, axis=1)
#運行結果:array([1, 1, 1])

總結回顧

本篇介紹了最常用的聚合計算函數,聚合計算通常用於對數據進行處理和分析,以及實現高級的數據分析演算法。

除了上面介紹的聚合計算函數,還有:

  1. cumsum():計算數組中所有元素的累積和。
  2. cumprod():計算數組中所有元素的累積乘積。
  3. argmin():計算數組中最小值的下標。
  4. argmax():計算數組中最大值的下標。
  5. ... ...

具體請參考官方文檔。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 本文將通過閱讀AnnotationConfigApplicationContext源碼,分析Spring啟動流程。 # 創建AnnotationConfigApplicationContext ```java AnnotationConfigApplicationContext applicatio ...
  • # 概念 在 Java 中,`char` 和 `byte` 類型占用的存儲空間是不同的。 1. `char` 類型:`char` 是 16 位無符號的 Unicode 字元類型,用於表示單個字元。在 Java 中,`char` 類型占用 2 個位元組(16 位)的存儲空間。 2. `byte` 類型: ...
  • 當我們在開發項目時,有時需要用到外部依賴組件,例如當我們需要Json序列化的時候需要用到FastJson組件,我們可以通過下載對應jar包載入到項目中。但當一個大的項目同時需要依賴各種各樣的外部服務,就存在著配置繁瑣、依賴衝突等問題,因此可以通過maven來完成對應的依賴管理功能。 ...
  • ### 序 上一篇我們介紹了 k8s 的基本架構,我們在這篇文章將介紹 `Kubernetes` 關鍵組件和概念。 還是先來一張圖: ![1_2pdatNn7KzcQZpc8cOALOQ.webp][1] 根據上圖我們分別對`Deployment`、`ReplicaSet`、`Pod`詳細的介紹,其 ...
  • ### 一、項目結構 新建報表微服務模塊,這是我的項目結構圖。 ![](https://pic.smartasc.cn/blogPics/20230626141851.png) ### 二、執行初始化數據腳本 運行積木報表的初始化腳本,創建相關表結構,github速度太慢,推薦使用 [gitee地址 ...
  • 1、準備需要的jar包並複製到伺服器某個目錄下 ![](https://img2023.cnblogs.com/blog/1928230/202306/1928230-20230626151543572-42173473.png) 2、在此目錄下,創建Dockerfile的文本文件,並將以下內容添加 ...
  • # hovertool `HoverTool` 是 `Bokeh` 庫中的一個工具,它可以在滑鼠懸停在圖上時顯示數據。當滑鼠指針放在圖表的特定部分(比如散點圖的點或者線圖中的線的時候),該工具會顯示與該部分相關的附加信息。 一般配套使用的是`from bokeh.plotting import fi ...
  • 最近在讀《數據密集型應用系統設計》,其中談到了zookeeper對容錯共識演算法的應用。這讓我想到之前參考的zookeeper學習資料中,誤將容錯共識演算法寫成了2PC(兩階段提交協議),所以準備以此文對共識演算法和2PC做梳理和區分,也希望它能幫助像我一樣對這兩者有誤解的同學。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...