pandas選擇數據-【老魚學pandas】

来源:http://www.cnblogs.com/dreampursuer/archive/2017/11/20/7834885.html
-Advertisement-
Play Games

選擇列 根據列名來選擇某列的數據 輸出結果: 也可以用點符號來進行: 上面的功能跟data["A"]一樣。 選擇某幾行數據 輸出為: 也可以根據索引號範圍來選擇某幾行的數據。 比如,如下的例子中我們就選擇出2017 01 10到2017 01 12的數據: 輸出為: 使用loc進行選擇 使用loc選 ...


選擇列

根據列名來選擇某列的數據

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)
# 選擇A列數據
print("A列數據:")
print(data["A"])

輸出結果:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
A列數據:
2017-01-08     0
2017-01-09     4
2017-01-10     8
2017-01-11    12
2017-01-12    16
2017-01-13    20
Freq: D, Name: A, dtype: int32

也可以用點符號來進行:

print(data.A)

上面的功能跟data["A"]一樣。

選擇某幾行數據

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇0至3行的數據:")
print(data[0:3])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇03行的數據:
            A  B   C   D
2017-01-08  0  1   2   3
2017-01-09  4  5   6   7
2017-01-10  8  9  10  11

也可以根據索引號範圍來選擇某幾行的數據。
比如,如下的例子中我們就選擇出2017-01-10到2017-01-12的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("按照索引選擇數據:")
print(data["2017-01-10":"2017-01-12"])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
按照索引選擇數據:
             A   B   C   D
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19

使用loc進行選擇

使用loc選擇某幾行的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("按照索引選擇數據:")
print(data.loc["2017-01-10":"2017-01-12"])

輸出:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
按照索引選擇數據:
             A   B   C   D
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19

也可以按照列進行選擇數據,比如,我們想要選擇其中B和C列的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇某兩列的數據:")
print(data.loc[:, ["B", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇某兩列的數據:
             B   C
2017-01-08   1   2
2017-01-09   5   6
2017-01-10   9  10
2017-01-11  13  14
2017-01-12  17  18
2017-01-13  21  22

如果只想選擇某幾行中某幾列的數據,可以對上面的例子進行一下稍微的修改就能實現:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇某幾行某幾列的數據:")
print(data.loc["2017-01-09":"2017-01-12", ["B", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇某幾行某幾列的數據:
             B   C
2017-01-09   5   6
2017-01-10   9  10
2017-01-11  13  14
2017-01-12  17  18

根據位置索引選擇數據

位置索引的方法為iloc,例如,選擇第3行第2列的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第3行第2列的數據:")
print(data.iloc[3, 1])

輸出:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行第2位的數據:
2017-01-11    13
2017-01-12    17
2017-01-13    21
Freq: D, Name: B, dtype: int32

當然,我們也可以在iloc中使用切片,比如,我想選擇出從第3行之後的第2列數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第3行之後第2列的數據:")
print(data.iloc[3:, 1])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行之後第2列的數據:
2017-01-11    13
2017-01-12    17
2017-01-13    21
Freq: D, Name: B, dtype: int32

我們也可以單獨地選擇某幾行的數據,例如:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第1,3,5行第1到第3列的數據:")
print(data.iloc[[1, 3, 5], 1:3])
data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行之後第2列的數據:
             B   C
2017-01-09   5   6
2017-01-11  13  14
2017-01-13  21  22

標簽和位置混合篩選

比如行用數字來篩選,而列用標簽來進行篩選,例如:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第1,3,5行第1到第3列的數據:")
print(data.ix[[1, 3, 5], ["A", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第1,3,5行第1到第3列的數據:
             A   C
2017-01-09   4   6
2017-01-11  12  14
2017-01-13  20  22

根據某列中的數值進行篩選

類似於SQL中where column < xxx這種類型的選擇。
例如,選擇出A列小於8的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("根據某列中的數值進行篩選:")
print(data[data.A < 8])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇根據某列中的數值進行篩選:
            A  B  C  D
2017-01-08  0  1  2  3
2017-01-09  4  5  6  7

如果想要進行聯合索引,比如where A<8 and B < 5,則:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("根據某列中的數值進行篩選:")
data = data[data.A < 8]
print(data[data.B < 5])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
根據某列中的數值進行篩選:
            A  B  C  D
2017-01-08  0  1  2  3

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 返回總目錄 本小節目錄 Split Temporary Variable(分解臨時變數) Remove Assignments to Parameters(移除對參數的賦值) Remove Assignments to Parameters(移除對參數的賦值) 6.6Split Temporary ...
  • 本文主要討論在資料庫中使用GUID類型作為主鍵時常見的弊端,以及解決辦法,希望您能有所收穫。 ...
  • 本文章介紹下自己這剛實現的一個c#與js交互的插件。需求來源於一次與朋友的討論。主要對話如下: 朋友:最近我想模擬一些數據,來測試我現在寫的介面,但手工編寫這些測試數據太麻煩了 本人:是啊,.net能生成模擬數據的開源庫的不少吧。不過就我們搞前端的有個叫Mock.js這方面挺好用的 朋友:說來聽聽 ...
  • 存儲過程if (object_id('proc_find_stu', 'P') is not null) drop proc proc_find_stugocreate proc proc_find_stu(@startId int, @endId int,@outID int output)as ...
  • C#讀取固定文本格式的txt文件 一個簡單的C#讀取txt文檔的程式,文檔中用固定的格式存放著實例數據。 ...
  • 1、我們在主函數中調用其他函數,我們管主函數為調用者,其他函數為被調用者。 如果被調用者,想要得到調用者的值:傳參 使用靜態欄位來模擬全局變數 在方法外類里寫欄位 public static _name=10; 2、如果調用者想要得到被調用者的值 1.返回值 不管形參和實參都是開闢空間的 方法的功能 ...
  • try//嘗試執行 {SomeCode} except//出錯的時候執行, Except有特定的錯誤類型 {SomeCode} end; try//嘗試執行 {SomeCode} finally//無論如何都強制執行 {SomeCode} end; 例:tryAge:=StrToInt(Edit1. ...
  • 在開發過程中,我們經常需要列印一些變數的值,便於調試。這個時候就會發現如果在dict list這些容器中,如果包含中文字元,不管是str類型,還是unicode類型,都列印不出來。如下: >>> print {'name': '張三'}{'name': '\xd5\xc5\xc8\xfd'}>>> ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...