pandas選擇數據-【老魚學pandas】

来源:http://www.cnblogs.com/dreampursuer/archive/2017/11/20/7834885.html
-Advertisement-
Play Games

選擇列 根據列名來選擇某列的數據 輸出結果: 也可以用點符號來進行: 上面的功能跟data["A"]一樣。 選擇某幾行數據 輸出為: 也可以根據索引號範圍來選擇某幾行的數據。 比如,如下的例子中我們就選擇出2017 01 10到2017 01 12的數據: 輸出為: 使用loc進行選擇 使用loc選 ...


選擇列

根據列名來選擇某列的數據

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)
# 選擇A列數據
print("A列數據:")
print(data["A"])

輸出結果:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
A列數據:
2017-01-08     0
2017-01-09     4
2017-01-10     8
2017-01-11    12
2017-01-12    16
2017-01-13    20
Freq: D, Name: A, dtype: int32

也可以用點符號來進行:

print(data.A)

上面的功能跟data["A"]一樣。

選擇某幾行數據

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇0至3行的數據:")
print(data[0:3])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇03行的數據:
            A  B   C   D
2017-01-08  0  1   2   3
2017-01-09  4  5   6   7
2017-01-10  8  9  10  11

也可以根據索引號範圍來選擇某幾行的數據。
比如,如下的例子中我們就選擇出2017-01-10到2017-01-12的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("按照索引選擇數據:")
print(data["2017-01-10":"2017-01-12"])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
按照索引選擇數據:
             A   B   C   D
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19

使用loc進行選擇

使用loc選擇某幾行的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("按照索引選擇數據:")
print(data.loc["2017-01-10":"2017-01-12"])

輸出:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
按照索引選擇數據:
             A   B   C   D
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19

也可以按照列進行選擇數據,比如,我們想要選擇其中B和C列的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇某兩列的數據:")
print(data.loc[:, ["B", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇某兩列的數據:
             B   C
2017-01-08   1   2
2017-01-09   5   6
2017-01-10   9  10
2017-01-11  13  14
2017-01-12  17  18
2017-01-13  21  22

如果只想選擇某幾行中某幾列的數據,可以對上面的例子進行一下稍微的修改就能實現:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇某幾行某幾列的數據:")
print(data.loc["2017-01-09":"2017-01-12", ["B", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇某幾行某幾列的數據:
             B   C
2017-01-09   5   6
2017-01-10   9  10
2017-01-11  13  14
2017-01-12  17  18

根據位置索引選擇數據

位置索引的方法為iloc,例如,選擇第3行第2列的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第3行第2列的數據:")
print(data.iloc[3, 1])

輸出:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行第2位的數據:
2017-01-11    13
2017-01-12    17
2017-01-13    21
Freq: D, Name: B, dtype: int32

當然,我們也可以在iloc中使用切片,比如,我想選擇出從第3行之後的第2列數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第3行之後第2列的數據:")
print(data.iloc[3:, 1])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行之後第2列的數據:
2017-01-11    13
2017-01-12    17
2017-01-13    21
Freq: D, Name: B, dtype: int32

我們也可以單獨地選擇某幾行的數據,例如:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第1,3,5行第1到第3列的數據:")
print(data.iloc[[1, 3, 5], 1:3])
data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第3行之後第2列的數據:
             B   C
2017-01-09   5   6
2017-01-11  13  14
2017-01-13  21  22

標簽和位置混合篩選

比如行用數字來篩選,而列用標簽來進行篩選,例如:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("選擇第1,3,5行第1到第3列的數據:")
print(data.ix[[1, 3, 5], ["A", "C"]])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇第1,3,5行第1到第3列的數據:
             A   C
2017-01-09   4   6
2017-01-11  12  14
2017-01-13  20  22

根據某列中的數值進行篩選

類似於SQL中where column < xxx這種類型的選擇。
例如,選擇出A列小於8的數據:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("根據某列中的數值進行篩選:")
print(data[data.A < 8])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
選擇根據某列中的數值進行篩選:
            A  B  C  D
2017-01-08  0  1  2  3
2017-01-09  4  5  6  7

如果想要進行聯合索引,比如where A<8 and B < 5,則:

import pandas as pd
import numpy as np
dates = pd.date_range("2017-01-08", periods=6)
data = pd.DataFrame(np.arange(24).reshape(6, 4), index=dates, columns=["A", "B", "C", "D"])
print("data:")
print(data)

print("根據某列中的數值進行篩選:")
data = data[data.A < 8]
print(data[data.B < 5])

輸出為:

data:
             A   B   C   D
2017-01-08   0   1   2   3
2017-01-09   4   5   6   7
2017-01-10   8   9  10  11
2017-01-11  12  13  14  15
2017-01-12  16  17  18  19
2017-01-13  20  21  22  23
根據某列中的數值進行篩選:
            A  B  C  D
2017-01-08  0  1  2  3

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 返回總目錄 本小節目錄 Split Temporary Variable(分解臨時變數) Remove Assignments to Parameters(移除對參數的賦值) Remove Assignments to Parameters(移除對參數的賦值) 6.6Split Temporary ...
  • 本文主要討論在資料庫中使用GUID類型作為主鍵時常見的弊端,以及解決辦法,希望您能有所收穫。 ...
  • 本文章介紹下自己這剛實現的一個c#與js交互的插件。需求來源於一次與朋友的討論。主要對話如下: 朋友:最近我想模擬一些數據,來測試我現在寫的介面,但手工編寫這些測試數據太麻煩了 本人:是啊,.net能生成模擬數據的開源庫的不少吧。不過就我們搞前端的有個叫Mock.js這方面挺好用的 朋友:說來聽聽 ...
  • 存儲過程if (object_id('proc_find_stu', 'P') is not null) drop proc proc_find_stugocreate proc proc_find_stu(@startId int, @endId int,@outID int output)as ...
  • C#讀取固定文本格式的txt文件 一個簡單的C#讀取txt文檔的程式,文檔中用固定的格式存放著實例數據。 ...
  • 1、我們在主函數中調用其他函數,我們管主函數為調用者,其他函數為被調用者。 如果被調用者,想要得到調用者的值:傳參 使用靜態欄位來模擬全局變數 在方法外類里寫欄位 public static _name=10; 2、如果調用者想要得到被調用者的值 1.返回值 不管形參和實參都是開闢空間的 方法的功能 ...
  • try//嘗試執行 {SomeCode} except//出錯的時候執行, Except有特定的錯誤類型 {SomeCode} end; try//嘗試執行 {SomeCode} finally//無論如何都強制執行 {SomeCode} end; 例:tryAge:=StrToInt(Edit1. ...
  • 在開發過程中,我們經常需要列印一些變數的值,便於調試。這個時候就會發現如果在dict list這些容器中,如果包含中文字元,不管是str類型,還是unicode類型,都列印不出來。如下: >>> print {'name': '張三'}{'name': '\xd5\xc5\xc8\xfd'}>>> ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...