【pandas小技巧】--數據轉置

来源:https://www.cnblogs.com/wang_yb/archive/2023/08/16/17633060.html
-Advertisement-
Play Games

所謂**數據轉置**,就是是將原始數據表格沿著對角線翻折,使原來的行變成新的列,原來的列變成新的行,從而更方便地進行數據分析和處理。 `pandas`中`DataFrame`的轉置非常簡單,每個`DataFrame`對象都有一個`T`屬性,通過這個屬性就能得到轉置之後的`DataFrame`。下麵介 ...


所謂數據轉置,就是是將原始數據表格沿著對角線翻折,使原來的行變成新的列,原來的列變成新的行,從而更方便地進行數據分析和處理。

pandasDataFrame的轉置非常簡單,每個DataFrame對象都有一個T屬性,通過這個屬性就能得到轉置之後的DataFrame
下麵介紹幾個數據轉置常用的場景,感受下轉置前後數據展示的區別。

1. 數據結構調整

有時候原始數據在行列方向上不太適合某些數據分析和處理需求,需要將其調整為合適的數據結構。
某些機器學習演算法要求輸入特征矩陣的行表示樣本,列表示特征值,這時候就需要將原始數據表格進行轉置。

比如,隨機生成10個樣本數據,每個樣本有200個特征值:

import pandas as pd

df = pd.DataFrame(np.random.rand(200, 10))
df.columns = [
    "SAMPLE_"+s for s in list("ABCDEFGHIJ")
]
df

image.png
代表一個樣本的所有特征的值,樣本名稱是按字母順序生成的。
代表所有樣本的一種特征值。

如果要讓列顯示各個特征值,行代表一個個樣本的話,就需要轉置操作。

df.T

image.png
轉置之後,每代表一個樣本的所有特征的值,更有利於觀察每個樣本的特征。

2. 數據展示效果

有時候為了更好地呈現數據,需要將原始數據表格進行轉置。
在製作某些類型的圖表或者報告中,將數據表格轉置可以更加直觀地展示重點數據信息。

比如,有如下學生成績數據:

df = pd.DataFrame(
    np.random.randint(60, 100, (4, 3))
)
df.columns = ["語文", "數學", "英語"]
df.index = ["學生"+s for s in list("ABCD")]
df

image.png
這樣的視圖適合查看每個學生的成績情況。
這樣的結構以學生為主要視角,可以繪製各個學生的學科堆疊柱狀圖等。

轉置之後如下:

df.T

image.png
這樣的視圖以學科為主要視角,方便查看每個學科的學習情況。
這樣的結構適合繪製每個學科的學生成績堆疊柱狀圖等。

此外,查看DataFrame概況信息時,也常常會轉置之後查看。

df = pd.DataFrame(np.random.rand(200, 10))
df.columns = [
    "SAMPLE_" + s for s in list("ABCDEFGHIJ")
]

df.describe()

image.png

轉置之後是這樣的,可以體會在不同的視角下,數據給我們的感覺。

df.describe().T

image.png


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ```java package com.java3y.austin.test; abstract class A{ public abstract void test(); } class B extends A{ B(){ System.out.println("B的構造函數"); } @Over ...
  • ## String的三種初始化方式 ```java public class Test { public static void main(String[] args) { String str1 = "Hello, World !"; //直接初始化 String str2 = new Strin ...
  • package com.yc.cloud.excel.util; import cn.hutool.poi.excel.ExcelWriter; import lombok.extern.slf4j.Slf4j; import org.apache.poi.hssf.usermodel.HSSFCl ...
  • ## 1、說明 一般情況下,都是在model中指定一個資料庫連接參數即可。但某些情況下,相同的庫表會在不同地區都有部署,這個時候需要按地區進行切換(只有一個model情況下)。 ## 2、多model繼承方式 Model層代碼 ``` //A地區的資料庫 class A extends Model ...
  • [TOC] ## 1. 好險,差點被噴 早幾天發了一篇文章:[《僅三天,我用 GPT-4 生成了性能全網第一的 Golang Worker Pool,輕鬆打敗 GitHub 萬星項目》](https://www.danielhu.cn/golang-gopool-1/),這標題是挺容易被懟,哇咔咔; ...
  • 變數 變數是一種可以賦給值的標簽。每一個變數都指向一個相關聯的值,下列代碼中 message 即為變數,指向的值為“Hello Python world !” message = "Hello Python world!" print(message) 第二行的 print() 函數用於列印輸出這個 ...
  • C++ STL 中的非變易演算法(Non-modifying Algorithms)是指那些不會修改容器內容的演算法,是C++提供的一組模板函數,該系列函數不會修改原序列中的數據,而是對數據進行處理、查找、計算等操作,並通過迭代器實現了對序列元素的遍歷與訪問。由於迭代器與演算法是解耦的,因此非變易演算法可以... ...
  • # 將Markdown文件上傳到博客園 # 1.下載python 下載地址為:http://npm.taobao.org/mirrors/python/ 安裝為3.10.11版本 在cmd視窗輸入python,彈出以下視窗為安裝成功 ![image-20230816102551883](https: ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...