[數據分析工具] Pandas 功能介紹(二)

来源:https://www.cnblogs.com/BoyceYang/archive/2018/01/30/8383917.html
-Advertisement-
Play Games

條件過濾 我們需要看第一季度的數據是怎樣的,就需要使用條件過濾 體感的舒適適濕度是40-70,我們試著過濾出體感舒適濕度的數據 最後整合上面兩種條件,在一季度體感濕度比較舒適的數據 列排序 數據按照某列進行排序 “by”參數可以使用字元串,也可以是列表,ascending 的參數也可以是單個值或者列 ...


條件過濾

我們需要看第一季度的數據是怎樣的,就需要使用條件過濾

體感的舒適適濕度是40-70,我們試著過濾出體感舒適濕度的數據

最後整合上面兩種條件,在一季度體感濕度比較舒適的數據

列排序

數據按照某列進行排序

“by”參數可以使用字元串,也可以是列表,ascending 的參數也可以是單個值或者列表

ascending 預設值是 True

列中的每行上的 apply 函數

在前一篇的增加列的部分,根據風速計算人體感覺是否舒適,為了功能的演示,在這裡使用 DataFrame 的 apply 方法,他會在指定列的每個值上執行。詳見代碼:

均值和標準差

我們通過 describe 方法查看的統計信息中均值和方差都是按照列統計呢,這裡要說的,既可以按照列,還可以按照行

均值,行 df.mean(axis=0),列df.mean(axis=1)

方差,行 df.std(axis=0),列df.std(axis=1)

DataFrame 轉換為 Numpy

DataFrame 合併

連接合併

在兩個 df 的結果一致的情況下,我們可以簡單兩個 df 拼接起來

垂直(行)拼接,pd.concat([df1,df2],axis=0),水平(列)拼接,pd.concat([df1,df2],axis=1)

基於索引關鍵字合併

Pandas 還提供了像 SQL 一樣的連接,內聯,外聯,左聯,右聯

作為我們的示例數據,可以唯一標識一行的就是 Datatime 列

merged_df = df_1.merge(df_2, how='left', on='datetime')

在 DataFrame 中查找 NaN

每行有多少 NaN,df.isnull().sum()

Dataframe 中 NaN 的總數,上面統計出來的數量求和,df.isnull().sum().sum()

分組 Group By

分組在數據統計的時候經常使用。特別是統計數量、計算和、求平均值,等等。

我們在這裡統計一下每個季度的假期數是多少

在統計一下,每個季度的平均分風速是多少

定義範圍

如果我們想根據風力把風的等級區分出來,你可能可快就想到上面剛剛介紹的 apply,不過,現在介紹另外一種方式

通過這兩次的分享,我們已經瞭解了 pandas 數據處理常用的方式方法。

文件內容簡單說明:

文件地址:

bikeshare.zip  

雲+社區:[數據分析工具] Pandas 功能介紹(二)

知乎:[數據分析工具] Pandas 功能介紹(二)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、yum安裝MariaDB並啟動 二、按案例建立目錄並設置屬主屬組 將配置文件和資料庫按案例存放 設置目錄屬主屬組 三、建立資料庫文件 四、配置文件 修改配置文件 3307 3308也是一樣,需要改埠和目錄位置 五、服務腳本 設置許可權 3307,3308也是一樣,需改埠號 六、啟動服務(註意需 ...
  • 子查詢或內部查詢或嵌套查詢在另一個SQL查詢的查詢和嵌入式WHERE子句中。 子查詢用於返回將被用於在主查詢作為條件的數據,以進一步限制要檢索的數據。 子查詢可以在SELECT,INSERT,UPDATE使用,而且隨著運算符如DELETE語句 =, <, >, >=, <=, IN, BETWEEN ...
  • redis安裝 ubuntu: apt-get install redis-server redis服務 :redis-server 啟動客戶端 :redis-cli redis簡單知識初步: 0.redis 文檔 :http://doc.redisfans.com/ 1.redis為單進程2.re ...
  • Why use Storm? Apache Storm是一個免費的開源的分散式實時計算系統。Storm使得可靠的實時處理無邊界的數據量變得很容易,就如同Hadoop做批處理那樣。Storm很簡單,可以用任意的編程語言。 Storm有許多使用案例:實時分析、線上機器學習、持續的計算、分散式RPC、ET ...
  • 之前發了一個提問貼,可能大家都沒有遇到過。最近正好解決了所以給大家分享一下。 http://www.cndba.cn/549974293/problem/48 select client_name,task_name,operation_name,status from dba_autotask_t... ...
  • 1、定義基本變數: 2、引用型的變數: set serveroutput on declare pename emp.ename%type; psal emp.sal%type; begin select ename,sal into pename,psal from emp where empno ...
  • 解決mysql主從不同步 mysql>show processlist; 查看下進程是否Sleep太多。發現很正常。 show master status; 也正常。 mysql> show master status; + + + + + | File | Position | Binlog_Do ...
  • mysql max 與 where 間的執行問題 執行sql: CREATE TABLE `grades` ( `id` int(20) NOT NULL AUTO_INCREMENT, `student_id` int(20) NOT NULL, `subject` varchar(20) COL ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...