【pandas小技巧】--統計值作為新列

-Advertisement-

這次介紹的小技巧不是統計，而是把統計結果作為**新列**和原來的數據放在一起。`pandas`的各種統計功能之前已經介紹了不少，但是每次都是統計結果歸統計結果，原始數據歸原始數據，沒有把它們合併在一個數據集中來觀察。下麵通過兩個場景示例來演示如果把統計值作為新列的數據。 # 1. 成績統計的場景 ...

這次介紹的小技巧不是統計，而是把統計結果作為新列和原來的數據放在一起。
pandas的各種統計功能之前已經介紹了不少，但是每次都是統計結果歸統計結果，原始數據歸原始數據，
沒有把它們合併在一個數據集中來觀察。

下麵通過兩個場景示例來演示如果把統計值作為新列的數據。

1. 成績統計的場景

成績統計及其類似的場景比較常見，也就是把每行統計的結果作為該行的一個新列。
比如：

import pandas as pd
import numpy as np

df = pd.DataFrame(
    np.random.randint(60, 100, (4, 3))
)
df.columns = ["語文", "數學", "英語"]
df.index = ["學生"+s for s in list("ABCD")]
df

統計每個學生的各科總分和平均分，然後作為新的列合併到原數據中。

sum = df.sum(axis=1)
mean = df.mean(axis=1)

df["總分"] = sum
df["平均分"] = mean
df

這樣可以更全面的查看每個學生的學習情況。

2. 訂單統計的場景

訂單統計的這個示例稍微複雜點，因為一個訂單ID可能包含多個物品，
按訂單ID來統計每個訂單合計信息時，不能簡單的像上面的統計成績那樣直接計算按行統計。

df = pd.DataFrame(
    {
        "id": [1, 1, 2, 3, 3, 3],
        "product": ["蘋果", "香蕉", "手機",
                    "冰箱", "電視", "空調"],
        "price": [24, 15, 2000, 8000, 
                  5500, 7800],
    }
)

df

如上所示，總共有3個訂單，根據訂單號統計每個訂單的總價如下：

df.groupby("id").price.sum()

得到每個訂單ID對應的總價格，但是合計信息只有3行，而原來的數據是6行，無法直接合併到原數據。

這種情況下，我們需要用pandas里的transform函數。
transform函數分組統計之後，會保持原來的行數。

df["總價"] = df.groupby("id").price.transform("sum")
df

相同的訂單ID，統計的總價是一樣的。
把總價的信息附加在訂單的每個具體物品之後，
還可以基於此統計出同一個訂單中每個物品價格所占總價的百分比。

df["百分比"] = df.price / df["合計"]
df

總之，統計值作為新的列，不僅可以更好的比較和觀察原始數據和統計值，
還可以基於新的統計列，再統計出其他的信息。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

業務開發時，介面不能對外暴露怎麼辦？

在業務開發的時候，經常會遇到某一個介面不能對外暴露，只能內網服務間調用的實際需求。面對這樣的情況，我們該如何實現呢？今天，我們就來理一理這個問題，從幾個可行的方案中，挑選一個來實現。推薦一個開源免費的 Spring Boot 實戰項目： > [https://github.com/javasta ...
將實體類對象數據存入和讀取進csv文件（可追加）

# 前言最近公司一個新的項目，因為需要存儲的數據很少，單獨去部署一個資料庫去存儲該數據顯然是不划算的，所以想的是通過存入csv文件中來代替存入資料庫中。說乾就乾。 ## 什麼是csv文件 CSV代表逗號分隔值（Comma-Separated Values），是一種常見的文本文件格式，用於存儲表格數 ...
protojson簡介

`google.golang.org/protobuf/encoding/protojson` 是 Go 語言中的一個庫，用於處理 Protocol Buffers（protobuf）和 JSON 之間的轉換，遵循[https://protobuf.dev/programming-guides/pr ...
10.4K Star！程式員為程式員針對性優化的開源免費筆記

平時我一直用Notion來記錄內容為主，但也一直關註著其他開源產品。上周正好看到一款非常受歡迎的開源免費筆記，今天就推薦給大家：[**VNote**](https://blog.didispace.com/tj-opensource-vnote/)。 ![file](https://img2023. ...
7種創建方式，帶你理解Java的單例模式

介紹創建Java單例對象的七種方式，重點掌握哪些創建方式是線程安全的，哪些方式是線程不安全的，並能夠在實際項目中靈活運用設計模式，編寫可維護的代碼。 ...
SpringBoot3集成Kafka

Kafka是一個開源的分散式事件流平臺，常被用於高性能數據管道、流分析、數據集成和關鍵任務應用，基於Zookeeper協調的處理平臺，也是一種消息系統，具有更好的吞吐量、內置分區、複製和容錯。 ...
JavaEE基礎知識

1. JDK 和 JRE 有什麼區別？ JDK：Java Development Kit 的簡稱，Java 開發工具包，提供了 Java 的開發環境和運行環境。 JRE：Java Runtime Environment 的簡稱，Java 運行環境，為 Java 的運行提供了所需環境。具體來說 JD ...
springboot~ApplicationContextAware和Interceptor產生了真感情

看著題目，有點一頭污水吧，事實上，沒有經歷過，很難去說`ApplicationContextAware`在什麼時候會用到，直接在一個bean對象里，你可以直接使用構造方法註入或者Autowired屬性註入的方式來使用`其它的bean對象`，這在springboot里是非常自然的，也是天然支持的；但如 ...