【matplotlib 實戰】--面積圖

来源:https://www.cnblogs.com/wang_yb/archive/2023/09/30/17737650.html
-Advertisement-
Play Games

面積圖,或稱區域圖,是一種隨有序變數的變化,反映數值變化的統計圖表。 面積圖也可用於多個系列數據的比較。這時,面積圖的外觀看上去類似層疊的山脈,在錯落有致的外形下表達數據的總量和趨勢。面積圖不僅可以清晰地反映出數據的趨勢變化,也能夠強調不同類別的數據間的差距對比。 面積圖的特點在於,折線與自變數坐標 ...


面積圖,或稱區域圖,是一種隨有序變數的變化,反映數值變化的統計圖表。

面積圖也可用於多個系列數據的比較。
這時,面積圖的外觀看上去類似層疊的山脈,在錯落有致的外形下表達數據的總量和趨勢。
面積圖不僅可以清晰地反映出數據的趨勢變化,也能夠強調不同類別的數據間的差距對比。

面積圖的特點在於,折線與自變數坐標軸之間的區域,會由顏色或者紋理填充。
但它的劣勢在於,填充會讓形狀互相遮蓋,反而看不清變化。一種解決方法,是使用有透明度的顏色,來“讓”出覆蓋區域。

1. 主要元素

面積圖是一種用於展示數據分佈或密度的圖表類型,主要由數據點、面積、以及X軸和Y軸組成。
面積圖可以直觀地反映數據的分佈情況。

面積圖的主要構成元素包括:

  1. 數據點:表示數據的具體位置和大小
  2. 面積:表示數據的分佈或密度
  3. X軸:一般是有序變數,表示數據點的變化區間
  4. Y軸:數據點在不同時刻的值

image.png

2. 適用的場景

面積圖適用於以下分析場景:

  • 數據分佈分析:幫助分析人員瞭解數據的分佈情況,如城市的大小、人口分佈等。
  • 市場需求分析:幫助企業瞭解市場需求的變化趨勢,如銷售額的增長情況等。
  • 健康狀況分析:幫助醫生瞭解患者的健康狀況,如體溫、血壓等數據的變化趨勢。

3. 不適用的場景

面積圖不適用於以下分析場景:

  • 數據的精確性要求較高的分析場景:面積圖無法精確地反映數據的分佈情況,在需要精確數據的場景中不適用。
  • 需要顯示數據細節的分析場景:面積圖無法直觀地顯示數據的細節和變化趨勢,在需要顯示數據細節的場景中不適用。
  • 需要進行多維數據分析的場景:面積圖無法直接展示多維數據,在需要進行多維數據分析的場景中不適用。

4. 分析實戰

這次使用國內生產總值相關數據來實戰面積圖的分析。

4.1. 數據來源

數據來源國家統計局公開數據,已經整理好的csv文件在:https://databook.top/nation/A02

本次分析使用其中的 A0201.csv 文件(國內生產總值數據)。

下麵的文件路徑 fp 要換成自己實際的文件路徑。

fp = "d:/share/A0201.csv"

df = pd.read_csv(fp)
df

image.png

4.2. 數據清理

從中過濾出國內生產總值(億元)人均國內生產總值(元),然後繪製面積圖看看有什麼發現。

key1 = "國民總收入(億元)"
df[df["zbCN"]==key1].head()

image.png

key2 = "人均國內生產總值(元)"
df[df["zbCN"]==key2].head()

image.png

4.3. 分析結果可視化

國內生產總值(億元)的面積圖:

from matplotlib.ticker import MultipleLocator

with plt.style.context("seaborn-v0_8"):
    fig = plt.figure()
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
    ax.xaxis.set_major_locator(MultipleLocator(4))
    ax.xaxis.set_minor_locator(MultipleLocator(2))

    data = df[df["zbCN"] == key1].copy()
    data["value"] = data["value"] / 10000
    data = data.sort_values(by="sj")
    ax.fill_between(data["sjCN"], data["value"], label="國民總收入(萬億元)")

    ax.legend(loc="upper left")

image.png

上面的代碼把Y軸的單位改成了萬億元,原先的億元作為單位,數值太大。
面積圖來展示分析結果,不像折線圖那樣,僅僅只是變化趨勢的感覺;
通過折線下的面積不斷擴大,會感覺到國民總收入的總量在不斷變大,且2006年之後,總量增速明顯提高。

同樣分析步驟,人均收入的面積圖如下:

from matplotlib.ticker import MultipleLocator

with plt.style.context("seaborn-v0_8"):
    fig = plt.figure()
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
    ax.xaxis.set_major_locator(MultipleLocator(4))
    ax.xaxis.set_minor_locator(MultipleLocator(2))

    data = df[df["zbCN"] == key2].copy()
    data = data.sort_values(by="sj")
    ax.fill_between(data["sjCN"], data["value"], label=key2)

    ax.legend(loc="upper left")

image.png

接下來,我們把國民總收入人均收入放在一起看,但是,這兩組數據的單位不一樣(一個是萬億元,一個是元)。
所以要用到之前 matplotlib基礎系列中介紹的雙坐標軸技巧來展示。

from matplotlib.ticker import MultipleLocator

with plt.style.context("seaborn-v0_8"):
    fig = plt.figure()
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])
    ax.xaxis.set_major_locator(MultipleLocator(4))
    ax.xaxis.set_minor_locator(MultipleLocator(2))
    ax_twinx = ax.twinx()

    data = df[df["zbCN"] == key1].copy()
    data["value"] = data["value"] / 10000
    data = data.sort_values(by="sj")
    ax.fill_between(data["sjCN"], data["value"], 
                    alpha=0.5, label="國民總收入(萬億元)")

    data = df[df["zbCN"] == key2].copy()
    data = data.sort_values(by="sj")
    ax_twinx.fill_between(data["sjCN"], data["value"], 
                          color='r', alpha=0.2, label=key2)

    ax.legend(loc="upper left")
    ax_twinx.legend(loc="upper right")

image.png

兩個面積圖用了不同顏色,並加了透明度(即alpha 參數),不加透明度,顏色會互相覆蓋。
左邊的Y軸是國民總收入右邊的Y軸是人均收入
這兩個面積圖幾乎完全重合,正說明瞭國民總收入人均收入是強相關的。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在記憶體管理中,::operator new()/::operator delete() 、delete/new、 placement new 是不同的: ::operator new():只是進行空間的申請而不調用構造函數,可以理解為只是對 malloc 的簡單封裝,返回 void* 。可以進行類內 ...
  • 在Java語言中,子類只能繼承extends單個父類,實現implements多個介面(即單繼承和多實現)。在Dart語言中,所有類型均是Object子類,它們也是單繼承和多實現,但Dart中有個Mixin的高級特性,它可以做到更多的代碼復用(單繼承、多實現、多Mixin代碼復用)…… ...
  • 魅族雲服務的相冊功能,沒有一鍵選擇所有的圖片,就挺噁心的。魅族不一直提供雲相冊的服務了,就需要將圖片全部下載。之前有大神寫過油潑猴的腳本。 今天拿來用,發現用不了。 又在網上查一下了,有npm的開源下載工具。附上碼雲地址,沒用過。https://gitee.com/moreant/mpcb 但是部署 ...
  • 我們在使用SpringMVC從前端接受傳遞過來的日期數據時,預設傳遞過來的數據是String類型,如果我們從前端傳遞過來的數據格式是yyyy/MM/dd,SpringMVC有內置類型轉化器會將String類型自動轉化成Date類型。但如果我們從前端傳遞過來的數據格式是yyyy-MM-dd,Sprin... ...
  • Feign 簡介 Spring Cloud Feign 是一個 HTTP 請求調用的輕量級框架,可以以 Java 介面註解的方式調用 HTTP 請求,而不用通過封裝 HTTP 請求報文的方式直接調用 Feign 通過處理註解,將請求模板化,當實際調用的時候傳入參數,根據參數再應用到請求上,進而轉化成 ...
  • Get請求和Post請求都是HTTP協議中的兩種常見請求方法,底層都是TCP/IP協議,用於客戶端與伺服器之間的數據傳輸。 ...
  • 目錄題目翻譯題目描述輸入格式輸出格式樣例 #1樣例輸入 #1樣例輸出 #1樣例 #2樣例輸入 #2樣例輸出 #2樣例 #3樣例輸入 #3樣例輸出 #3題目簡化題目思路AC代碼 題目翻譯 【題目描述】 你決定用素數定理來做一個調查. 眾所周知, 素數又被稱為質數,其含義就是除了數字一和本身之外不能被其 ...
  • 布爾值表示兩個值之一:True(真)或False(假)。 布爾值 在編程中,您經常需要知道一個表達式是否為True或False。 您可以在Python中評估任何表達式,並獲得兩個答案之一:True或False。 當您比較兩個值時,表達式會被評估,Python會返回布爾答案: 示例 print(10 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...