python數據分析學習(5)pandas描述性統計的概述與計算

来源:https://www.cnblogs.com/ITXiaoAng/archive/2020/03/14/12494862.html
-Advertisement-
Play Games

[TOC] pandas對象有一個常用數學,統計學方法的集合。大部分屬於歸納或彙總統計。這些方法從DataFrame的行或列中抽取一個Series或一系列的值。 pandas的描述性統計的方法和NumPy的方法相比,內建了處理缺失值的功能,很好地針對於每一個我們需要處理的數據。 一:一些基本方法 1 ...


目錄

  pandas對象有一個常用數學,統計學方法的集合。大部分屬於歸納或彙總統計。這些方法從DataFrame的行或列中抽取一個Series或一系列的值。
  pandas的描述性統計的方法和NumPy的方法相比,內建了處理缺失值的功能,很好地針對於每一個我們需要處理的數據。

一:一些基本方法

1.歸約方法

  sum方法返回一個包含列上加和的Series。 若傳入axis = 'columns'或axis = 1,將會把一行上各個列的值相加。會把缺失值自動排除,可以通過skipna = False設置禁用skipna來實現不排除缺失值。

  可用idxmin和idxmax,返回間接統計信息,比如最小值或最大值的索引值。

2.積累型方法

  有些方法是積累型方法,比如cumsum是返回積累值。

3.其他方法

  還有一些不是歸約方法和積累型的方法,比如describe方法,一次性產生多個彙總統計值。

二:相關性和協方差

  一些彙總統計,是由多個參數計算出的。與之相關的是一個附加庫,是 pandas-datareader ,可以從Yahoo!Finance上獲取股價和交易量的二維DataFrame數據。

  用pct_change和tail獲得股價的百分比。

  函數corr方法是計算兩個對象重疊的,非NA的,按索引對其的值的相關性。相應地,cov計算的是協方差。

  用DataFrame的corrwith方法,可以計算出DataFrame中的行或列與另一個序列或DataFrame的相關性。 這個方法是一個歸約方法 ,傳入axis = 'columns'或者axis = 1則會對逐行進行操作。

三:唯一值,計數和成員屬性

  有些方法可以從數據中提取信息,如下:

  函數unique會給出唯一值,可以用uniques.sort()進行排序。

  函數value_counts會計算數據中包含值的個數,預設會按照數量降序排列,可以通過設置sort = False不進行降序排列。

  函數isin可以檢查數據成員是否和參數匹配,併進行過濾,即去除未匹配的數據。

  而與之相關的Index.get_indexer方法,可以提供一個索引數組,將可能非唯一數組轉換為另一個唯一值數組。

  函數pandas.value_counts可以計算DataFrame多個相關列的直方圖,得到的直方圖的行標簽是所有列出現的不同值,數值是不同值在每個列中出現的次數。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 調用命令: javadoc -d doc -author -version -encoding UTF-8 -charset UTF-8 *.java -d:幫助文檔生成後存放的目錄 -author:在幫助文檔中加入作者 -version:幫助文檔中加入版本號 一個類中預設會有一個空參數的構造函數, ...
  • 高級創意介面 1.cartier datapush介面文檔 ...
  • 一、FileOutputStream詳解 1.該類的構造方法,有第二個參數 FileOutputStream(String address,boolean append) append預設false,也就是新的寫入會覆蓋原來的東西。改為true的話,也就是以追加的形式寫入文件 package com ...
  • ***該隨筆僅用於學習*** 最近在學習java的時候,老師佈置了一道很有意思的題目:電腦給出隨機的石頭剪刀布,用戶可以輸入r,p,s輸出一項,直接給出這一局的輸贏。在老師原有代碼基礎上,增添了用e退出,計算這次游戲的獲勝者及分數。用隨機數和switch語句隨機電腦給出選項。 3 import ja ...
  • 背景 項目交叉編譯為可執行文件之後,在其他目錄執行文件時提示找不到配置文件 解決方案 直接採用以下代碼獲取到實際執行文件的路徑,然後拼接配置文件即可 代碼分析 os.Args是用來獲取命令行執行參數分片的,當使用 時 分片0會是一串複雜的路徑,原因是直接run go文件時會將文件轉移到臨時路徑下,然 ...
  • Dubbo admin管理控制台目前還沒有正式發佈,但是源碼已托管在github上,我們可以自行下載使用; 目前的管理控制台已經發佈0.1版本,結構上採取了前後端分離的方式,前端使用Vue和Vuetify分別作為Javascript框架和UI框架,後端採用Spring Boot框架。既可以按照標準的 ...
  • 1、Spring 1.x時代 在Spring 1.x時代,都是通過XML文件配置Bean。隨著項目的不斷擴大,需要將Bean的定義配置分放到不同的XML配置文件中。開發的時候需要頻繁的在java類和XML配置文件中切換。 2、Spring 2.x時代 隨著 JDK 1.5帶來的註解支持,Spring ...
  • 資源限制 時間限制:1.0s 記憶體限制:256.0MB 問題描述 利用字母可以組成一些美麗的圖形,下麵給出了一個例子: ABCDEFG BABCDEF CBABCDE DCBABCD EDCBABC 這是一個5行7列的圖形,請找出這個圖形的規律,並輸出一個n行m列的圖形。 輸入格式 輸入一行,包含兩 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...