【numpy基礎】--數組排序

来源:https://www.cnblogs.com/wang_yb/archive/2023/07/03/17522409.html
-Advertisement-
Play Games

`numpy` 數組通常是用於數值計算的多維數組,而排序功能可以快速、準確地對數據進行排序,從而得到更加清晰、易於分析的結果。 在數據分析和處理過程中,常常需要對數據進行排序,以便更好地理解和發現其中的規律和趨勢。 排序會應用在很多場景中,比如: 1. 數據分類:將數據按照一定的特征進行分類,可以通 ...


numpy 數組通常是用於數值計算的多維數組,而排序功能可以快速、準確地對數據進行排序,從而得到更加清晰、易於分析的結果。

在數據分析和處理過程中,常常需要對數據進行排序,以便更好地理解和發現其中的規律和趨勢。

排序會應用在很多場景中,比如:

  1. 數據分類:將數據按照一定的特征進行分類,可以通過 numpy 數組排序來實現。
  2. 數據篩選:通過 numpy 數組排序,可以快速地篩選出符合特定條件的數據。
  3. 數據合併:多個 numpy 數組可以通過 numpy 數組排序來進行合併,從而得到一個更加完整、準確的數據集。

1. 排序演算法

1.1. sort 函數

numpy中常用排序演算法都是封裝好的,通過 sort函數,可以直接使用常用的排序演算法。

import numpy as np

arr = np.random.randint(0, 100, 10)
print(arr)
#運行結果
[44 11 36  0 83 90 54 40 36 34]

arr.sort(kind='quicksort')
print(arr)
#運行結果
[ 0 11 34 36 36 40 44 54 83 90]

arr.sort(kind='mergesort')
print(arr)
#運行結果
[ 0 11 34 36 36 40 44 54 83 90]

arr.sort(kind='heapsort')
print(arr)
#運行結果
[ 0 11 34 36 36 40 44 54 83 90]

arr.sort(kind='stable')
print(arr)
#運行結果
[ 0 11 34 36 36 40 44 54 83 90]

四種排序演算法分別是:

  1. quicksort:快速排序
  2. mergesort:歸併排序
  3. heapsort:堆排序
  4. stable:冒泡排序

上述排序的結果都一樣,quicksort 是預設的排序演算法,也是效率最高的演算法。

1.2. argsort 函數

除了 sort 函數,還有一個比較常用的是 argsort,它返回的是排序之後的索引。

arr = np.random.randint(0, 100, 10)
print(arr)
#運行結果
[71 59 96 30 71 24 22 60 99 94]

print(arr.argsort())
#運行結果
[6 5 3 1 7 0 4 9 2 8]

argsort 的結果是排序之後的原數組的下標。
比如第一個值 6 表示的是 arr[6],也就是 22

2. 行列排序

當數組是多維的時候,可以按照每個維度來排序。
比如二維數組:

arr = np.random.randint(0, 100, (3, 3))
print(arr)
#運行結果
[[14 18  6]
 [80 85 14]
 [95 24 82]]

arr.sort(axis=0)
print(arr)
#運行結果
[[14 18  6]
 [80 24 14]
 [95 85 82]]

axis=0跨行的意思,也就是按列對數據進行排序。

arr = np.random.randint(0, 100, (3, 3))
print(arr)
#運行結果
[[ 2 22 17]
 [85  6 20]
 [98 97 39]]

arr.sort(axis=1)
print(arr)
#運行結果
[[ 2 17 22]
 [ 6 20 85]
 [39 97 98]]

axis=1跨列的意思,也就是按行對數據進行排序。

註意:這種排序的方式會破壞原有元素之間的行列關係。

3. 部分排序

nunpy的數組還支持部分排序,也就是只針對數組的特定部分排序,不用對整個數組排序。

arr = np.random.randint(0, 100, 10)
print(arr)
#運行結果
[13 94 71  6 47 81 99 12 49 20]

arr.partition(3)
print(arr)
#運行結果
[ 6 13 12 20 94 81 99 71 49 47]

partition(3)表示的把最小的三個數字放在數組前三個,後面的元素就是原先剩下的元素,順序不管。
放在最前面的三個數是所有元素中最小的三個數,它們的順序也是不保證的。

多維數組也可以部分排序:

arr = np.random.randint(0, 100, (5, 5))
print(arr)
#運行結果
[[11  8 84 34 99]
 [24 18 69 79 41]
 [ 2 25 91 91 64]
 [64  8 48 86 49]
 [68 62 51 22 85]]

arr.partition(3, axis=0)
print(arr)
#運行結果
[[ 2  8 48 22 49]
 [11  8 51 34 64]
 [24 18 69 79 41]
 [64 25 84 86 85]
 [68 62 91 91 99]]

partition之後,數組的前三行元素就是每列最小的三個數。

arr = np.random.randint(0, 100, (5, 5))
print(arr)
#運行結果
[[76 79 72 91 98]
 [13 58 53 76 63]
 [57 98 16 81 39]
 [48 43 63 98 77]
 [33 71 54 74 68]]

arr.partition(3, axis=1)
print(arr)
#運行結果
[[72 76 79 91 98]
 [13 53 58 63 76]
 [16 39 57 81 98]
 [43 48 63 77 98]
 [33 54 68 71 74]]

partition之後,數組的前三列元素就是每行最小的三個數。

4. 總結回顧

numpy 數組排序提供了一種快速、靈活、可靠的排序方式,可以滿足各種排序需求。
numpy的排序針對數組做了更多的優化,排序效率比python內置的排序演算法更高。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • GO 語言中 chan 的理解 ### chan 的底層實現是怎麼樣的? > chan 是 Go 語言中的一個關鍵字,用於實現併發通信。chan 可以用於在不同的 goroutine 之間傳遞數據,實現數據的同步和非同步傳輸。 在底層實現上,chan 是通過一個結構體來表示的,這個結構體包含了一個指向 ...
  • 序列化的目的是將對象變成位元組序列,這樣一來方便持久化存儲到磁碟,避免程式運行結束後對象就從記憶體里消失,另外位元組序列也更便於網路運輸和傳播 ...
  • 一、線程池的優點 1、線程池能夠復用已經創建了的線程來執行任務,從而降低了頻繁創建和銷毀線程所帶來的資源消耗; 2、任務創建完成時,不必等待線程的創建,能夠立即執行,提高了任務響應的速度。 二、創建線程池的七大核心參數 1、corePoorSize 核心線程數 線程池中長期存活的線程數量。一般情況下 ...
  • # rocketmq-console基本使用 作用:rocketmq-console是rocketmq的一款可視化工具,提供了mq的使用詳情等功能。 ## 一、安裝部署 > 下載rocketmq組件 **rocketmq**:[下載地址](https://rocketmq.apache.org/zh ...
  • ## 教程簡介 大數據分析是指對規模巨大的數據進行分析。大數據可以概括為5個V, 數據量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)、真實性(Veracity)。大數據作為時下最火熱的IT行業的辭彙,隨之而來的數據倉庫、數據安全、數據分析、數據挖掘等等 ...
  • ### 歡迎訪問我的GitHub > 這裡分類和彙總了欣宸的全部原創(含配套源碼):[https://github.com/zq2599/blog_demos](https://github.com/zq2599/blog_demos) ### 本篇概覽 - 本文是《JavaCV的攝像頭實戰》系列的 ...
  • # 1、什麼是MapReduce 1. Hadoop MapReduce 是一個 `分散式計算框架`,用於輕鬆編寫分散式應用程式,這些應用程式以可靠,容錯的方式並行處理大型硬體集群(數千個節點)上的大量數據(多TB數據集) 2. MapReduce 是一種`面向海量數據`處理的一種指導思想,也是一種 ...
  • # Cookie對象 Cookie是瀏覽器提供的一種技術,通過伺服器的程式能將一些只須保存在客戶端,或者在客戶端進行處理的數據,放在本地的電腦上,不需要通過網路傳輸,因而提高網頁處理的效率,並且能夠減少伺服器的負載,但是由於Cook是伺服器端保存在客戶端的信息,所以其安全性也是很差的。例如常見的記 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...