使用pandas篩選出指定列值所對應的行

-Advertisement-

在pandas中怎麼樣實現類似mysql查找語句的功能： pandas中獲取數據的有以下幾種方法：布爾索引位置索引標簽索引使用API 假設數據如下: 布爾索引該方法其實就是找出每一行中符合條件的真值(true value)，如找出列A中所有值等於foo 位置索引使用iloc方法，根據索引 ...

在pandas中怎麼樣實現類似mysql查找語句的功能：

select * from table where column_name = some_value;

pandas中獲取數據的有以下幾種方法：

布爾索引
位置索引
標簽索引
使用API

假設數據如下:

import pandas as pd
import numpy as np

df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
                   'B': 'one one two three two two one three'.split(),
                   'C': np.arange(8), 'D': np.arange(8) * 2})

布爾索引

該方法其實就是找出每一行中符合條件的真值(true value)，如找出列A中所有值等於foo

df[df['A'] == 'foo'] # 判斷等式是否成立

位置索引

使用iloc方法，根據索引的位置來查找數據的。這個例子需要先找出符合條件的行所在位置

mask = df['A'] == 'foo'
pos = np.flatnonzero(mask)  # 返回的是array([0, 2, 4, 6, 7])
df.iloc[pos]

#常見的iloc用法
df.iloc[:3,1:3]

標簽索引

如何DataFrame的行列都是有標簽的，那麼使用loc方法就非常合適了。

df.set_index('A', append=True, drop=False).xs('foo', level=1) # xs方法適用於多重索引DataFrame的數據篩選

# 更直觀點的做法
df.index=df['A'] # 將A列作為DataFrame的行索引
df.loc['foo', :]

# 使用布爾
df.loc[df['A']=='foo']

使用API

pd.DataFrame.query方法在數據量大的時候，效率比常規的方法更高效。

df.query('A=="foo"')

# 多條件
df.query('A=="foo" | A=="bar"')

數據提取不止前面提到的情況，第一個答案就給出了以下幾種常見情況：
1、篩選出列值等於標量的行，用==

df.loc[df['column_name'] == some_value]

2、篩選出列值屬於某個範圍內的行，用isin

df.loc[df['column_name'].isin(some_values)]  # some_values是可迭代對象

3、多種條件限制時使用&，&的優先順序高於>=或<=，所以要註意括弧的使用

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

4、篩選出列值不等於某個/些值的行

df.loc[df['column_name'] != 'some_value']

df.loc[~df['column_name'].isin('some_values')] #~取反

如果你覺得我的文章還可以，可以關註我的微信公眾號，查看更多實戰文章：Python爬蟲實戰之路
也可以掃描下麵二維碼，添加我的微信公眾號

公眾號

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

python 初學者

明確學習目標，不急於求成當下是一個喧囂、浮躁的時代。我們總是被生活中大量涌現的熱點所吸引，幾乎沒有深度閱讀和思考的時間和機會。我始終認為，學習是需要沉下心來慢慢鑽研的，是長期的；同時，學習不應該被賦予太多的功利色彩。一個Python 程式員的成長路線圖應該是這樣子的：基礎語法–>語感訓練–>課題 ...
python3-cookbook筆記：第十二章併發編程

python3-cookbook中每個小節以問題、解決方案和討論三個部分探討了Python3在某類問題中的最優解決方式，或者說是探討Python3本身的數據結構、函數、類等特性在某類問題上如何更好地使用。這本書對於加深Python3的理解和提升Python編程能力的都有顯著幫助，特別是對怎麼提高Py ...
基於JSP+Servlet開發java超市日常管理系統源碼

基於JSP+Servlet開發超市日常管理系統：開發環境: Windows操作系統開發工具： Eclipse+Jdk+Tomcat+MYSQL資料庫題目：根據超市日常所做的工作描述，結合超市經理提出的超市管理需求，本超市管理系統主要提供以下功能：超市經理能夠進行商品的添加、商品的查看，商品的信息修 ...
java開發JSP學生成績管理系統源碼

基於JSP+Servlet開發學生成績管理系統開發環境: Windows操作系統開發工具： MyEclipse+Jdk+Tomcat+Mysql資料庫運行效果圖源碼及原文鏈接：https://javadao.xyz/forum.php?mod=viewthread&tid=57 ...
16.python異常處理

異常處理涉及的關鍵字： try：理解它是掃描器，將可能出現異常的代碼放入其中；如果在執行的過程中出現異常對象了，掃描器會立即察覺到此異常對象，但是它沒有處理它的能力，所以會將異常對象給到except(捕獲器)進行處理 except：理解它是捕獲器，後面可以定義異常類型，並且和as關鍵字配合使 ...
C++常用函數

swap(a,b) 用於交換a，b兩個變數的值； template void swap ( T& a, T& b ) { T c(a); a=b; b=c; } reverse() reverse函數反轉區間的數據 sort() sort函數對區間的函數進行排序，內部是實現使用快速排序法。 max( ...
Java學習筆記(十三)面向對象---異常

概述對異常的理解程式在運行過程中出現不正常情況。是對問題的描述，將問題進行對象的封裝。異常的由來問題也是現實生活中一個具體的事物，也可以通過Java的類的形式進行描述，並封裝成對象。對於問題的劃分一種是嚴重的問題，一種是非嚴重的問題。 + 對於嚴重的：Java通過Error類進行描述。 ...
C語言指針學習總結

[TOC] 這裡對 C 語言的指針進行比較詳細的整理總結，參考網路上部分資料整理如下。指針概念電腦中所有的數據都必須放在記憶體中，不同類型的數據占用的位元組數不一樣，例如 int 占用4個位元組，char 占用1個位元組。為了正確地訪問這些數據，必須為每個位元組都編上號碼，就像門牌號、身份證號一樣，每個 ...