從靜態到動態化,Python數據可視化中的Matplotlib和Seaborn

来源:https://www.cnblogs.com/huaweiyun/p/18093822
-Advertisement-
Play Games

本文詳細介紹瞭如何使用Python中的Matplotlib、Seaborn、Bokeh和Plotly等庫進行數據可視化,並深入探討了一系列主題,涵蓋了從基礎的靜態圖表到高級的交互性和動態可視化的方方面面。 ...


本文分享自華為雲社區《Python數據可視化大揭秘:Matplotlib和Seaborn高效應用指南》,作者: 檸檬味擁抱。

安裝Matplotlib和Seaborn

首先,確保你已經安裝了Matplotlib和Seaborn庫。如果沒有安裝,可以使用以下命令進行安裝:

pip install matplotlib seaborn

Matplotlib基礎

Matplotlib是一個靈活的繪圖庫,支持多種圖表類型。以下是一個簡單的折線圖的代碼示例:

import matplotlib.pyplot as plt

# 創建數據
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 繪製折線圖
plt.plot(x, y, label='Line Chart')

# 添加標題和標簽
plt.title('Simple Line Chart')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')

# 顯示圖例
plt.legend()

# 顯示圖表
plt.show()

上述代碼首先導入Matplotlib庫,然後創建了一組簡單的數據並使用plt.plot繪製了折線圖。接著,添加了標題和坐標軸標簽,並通過plt.legend顯示圖例。最後,通過plt.show顯示圖表。

Seaborn的美化

Seaborn是基於Matplotlib的統計數據可視化庫,它提供了更簡單的介面和更美觀的預設樣式。以下是一個使用Seaborn創建直方圖的代碼示例:

import seaborn as sns
import matplotlib.pyplot as plt

# 創建數據
data = [1, 2, 2, 3, 3, 3, 4, 4, 5]

# 使用Seaborn創建直方圖
sns.histplot(data, bins=5, kde=True, color='skyblue')

# 添加標題和標簽
plt.title('Histogram with Seaborn')
plt.xlabel('Values')
plt.ylabel('Frequency')

# 顯示圖表
plt.show()

在這個例子中,使用seaborn.histplot創建了直方圖,並通過參數設置調整了一些樣式,如bins指定柱子的數量,kde添加核密度估計。此外,Matplotlib的基礎功能仍然可以與Seaborn一起使用。

定製化和進階功能

Matplotlib的子圖和定製化

Matplotlib允許你在同一圖表上繪製多個子圖,通過plt.subplot實現。以下是一個使用子圖的例子:

import matplotlib.pyplot as plt
import numpy as np

# 創建數據
x = np.linspace(0, 2 * np.pi, 100)
y1 = np.sin(x)
y2 = np.cos(x)

# 創建子圖
plt.subplot(2, 1, 1)  # 兩行一列,當前選中第一個子圖
plt.plot(x, y1, label='Sin')
plt.title('Sin Function')
plt.legend()

plt.subplot(2, 1, 2)  # 兩行一列,當前選中第二個子圖
plt.plot(x, y2, label='Cos')
plt.title('Cos Function')
plt.legend()

plt.tight_layout()  # 調整子圖佈局,防止重疊
plt.show()

在這個例子中,使用plt.subplot創建了兩個子圖,分別繪製了正弦和餘弦函數。

Matplotlib還提供了大量的定製化選項,包括顏色、線型、標記等。例如:

plt.plot(x, y, color='red', linestyle='--', marker='o', label='Data Points')

這將繪製一條紅色虛線,帶有圓形標記的線條。

Seaborn的高級繪圖功能

Seaborn提供了一些高級繪圖功能,如Pair Plots、Heatmaps等,可以更全面地瞭解數據之間的關係。

import seaborn as sns
import matplotlib.pyplot as plt

# 使用Seaborn創建Pair Plot
iris = sns.load_dataset('iris')
sns.pairplot(iris, hue='species', markers=['o', 's', 'D'])

plt.show()

這個例子中,使用Seaborn的pairplot創建了一個Pair Plot,展示了Iris數據集中不同物種之間的關係。

保存圖表

無論是Matplotlib還是Seaborn,都支持將圖表保存為圖像文件。例如,使用plt.savefig保存Matplotlib圖表:

plt.savefig('my_plot.png')

性能優化

對於大型數據集,性能可能成為一個問題。Matplotlib和Seaborn都提供了一些優化選項,如使用plt.plotmarker參數控制標記的顯示,以提高渲染性能。

plt.plot(x, y, marker='.', markersize=1)

數據可視化的交互性

在實際應用中,交互性是數據可視化中的重要部分,能夠增強用戶體驗並提供更深層次的數據探索。使用Matplotlib和Seaborn,你可以通過其他庫或工具來實現交互性,如Plotly、Bokeh等。

使用Plotly創建交互性圖表

Plotly是一個強大的交互性繪圖庫,可以與Matplotlib和Seaborn無縫集成。以下是一個簡單的例子:

import plotly.express as px

# 創建數據
df = px.data.iris()

# 使用Plotly創建交互性散點圖
fig = px.scatter(df, x='sepal_width', y='sepal_length', color='species', size='petal_length', hover_data=['petal_width'])

# 顯示圖表
fig.show()

這個例子中,使用Plotly的scatter函數創建了一個交互性的散點圖,通過hover_data參數添加了懸停信息。

Bokeh的交互性繪圖

Bokeh是另一個強大的交互性繪圖庫,支持大規模數據集的互動式可視化。以下是一個簡單的Bokeh例子:

from bokeh.plotting import figure, show
from bokeh.models import ColumnDataSource

# 創建數據
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 創建Bokeh圖表
source = ColumnDataSource(data=dict(x=x, y=y))
p = figure(title='Interactive Line Chart', x_axis_label='X-axis', y_axis_label='Y-axis')

# 添加線條
p.line('x', 'y', source=source, line_width=2)

# 顯示圖表
show(p)

這個例子中,使用Bokeh的figureline函數創建了一個交互性的折線圖。

結合使用Matplotlib/Seaborn和交互性庫

你還可以結合使用Matplotlib或Seaborn與交互性庫,以在靜態圖表中添加交互性元素,提供更豐富的用戶體驗。

import matplotlib.pyplot as plt
from mplcursors import cursor

# 創建數據
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 繪製散點圖
plt.scatter(x, y, label='Data Points')

# 添加標題和標簽
plt.title('Interactive Scatter Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')

# 使用mplcursors添加懸停信息
cursor(hover=True)

# 顯示圖例
plt.legend()

# 顯示圖表
plt.show()

在這個例子中,使用了mplcursors庫來添加懸停信息,通過懸停滑鼠可以查看數據點的具體數值。

高級主題:時間序列可視化和麵向對象的繪圖

時間序列可視化

在許多數據分析任務中,我們需要處理時間序列數據。Matplotlib和Seaborn提供了強大的工具來可視化時間序列。

import pandas as pd
import matplotlib.pyplot as plt

# 創建時間序列數據
date_rng = pd.date_range(start='2024-01-01', end='2024-01-10', freq='D')
data = {'value': [1, 3, 7, 2, 5, 8, 4, 6, 9, 10]}
df = pd.DataFrame(data, index=date_rng)

# 繪製時間序列折線圖
plt.plot(df.index, df['value'], marker='o', linestyle='-', color='b')

# 添加標題和標簽
plt.title('Time Series Plot')
plt.xlabel('Date')
plt.ylabel('Value')

# 日期標簽自動格式化
plt.gcf().autofmt_xdate()

# 顯示圖表
plt.show()

在這個例子中,我們使用了Pandas創建了一個簡單的時間序列數據,並使用Matplotlib繪製了折線圖。通過autofmt_xdate可以自動調整日期標簽的格式,確保它們在圖上顯示得更加美觀。

面向對象的繪圖

Matplotlib支持兩種不同的繪圖介面:MATLAB風格的plt介面和麵向對象的介面。面向對象的介面更為靈活,能夠實現更高級的定製化。

import numpy as np
import matplotlib.pyplot as plt

# 創建數據
x = np.linspace(0, 2 * np.pi, 100)
y1 = np.sin(x)
y2 = np.cos(x)

# 創建Figure和Axes對象
fig, ax = plt.subplots()

# 在Axes對象上繪製折線圖
line1, = ax.plot(x, y1, label='Sin')
line2, = ax.plot(x, y2, label='Cos')

# 添加標題和標簽
ax.set_title('Sine and Cosine Functions')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis')

# 顯示圖例
ax.legend()

# 顯示圖表
plt.show()

在這個例子中,我們使用了面向對象的繪圖方式,通過subplots創建了Figure和Axes對象,然後在Axes對象上繪製了兩條折線。這種方式可以更靈活地控製圖表的各個元素。

性能和效率優化

對於大規模的數據集或複雜的圖表,性能和效率成為關鍵問題。以下是一些優化技巧:

  • 使用NumPy和Pandas優化數據處理: 儘可能使用向量化操作,以提高數據處理效率。

  • 使用plt.tight_layout(): 該函數能夠自動調整子圖的佈局,避免重疊。

  • 避免繪製過多數據點: 對於大型數據集,可以通過降採樣等方法減少數據點的數量。

  • 非同步渲染: 在一些情況下,使用非同步渲染可以提高交互性圖表的響應速度。

交互性和動態可視化

在一些場景中,靜態圖表無法完全滿足需求,需要使用交互性和動態可視化來更好地與數據進行互動。

使用Bokeh創建動態可視化

Bokeh是一個強大的互動式可視化庫,支持創建動態可視化。以下是一個簡單的Bokeh動態圖表的例子:

from bokeh.plotting import figure, curdoc
from bokeh.models import ColumnDataSource
from bokeh.driving import count

# 創建數據源
source = ColumnDataSource(data={'x': [], 'y': []})

# 創建Bokeh圖表
p = figure(title='Dynamic Plot', width=800, height=400)
p.circle(x='x', y='y', size=10, color='navy', alpha=0.5, source=source)

# 定義動態更新函數
@count()
def update(i):
    new_data = {'x': [i], 'y': [i % 10]}  # 更新數據
    source.stream(new_data, rollover=20)  # 更新數據源

# 添加定時器,每100毫秒觸發一次更新
curdoc().add_periodic_callback(update, 100)

# 顯示圖表
curdoc().title = 'Dynamic Plot'
curdoc().add_root(p)

在這個例子中,使用Bokeh創建了一個動態散點圖,通過ColumnDataSource更新數據。使用add_periodic_callback函數定時觸發數據更新,實現了動態可視化。

使用Plotly創建交互性動畫

Plotly也提供了創建交互性動畫的功能,以下是一個簡單的例子:

import plotly.express as px
import pandas as pd

# 創建數據
df = pd.DataFrame({'x': range(10), 'y': [i % 10 for i in range(10)]})

# 創建動畫散點圖
fig = px.scatter(df, x='x', y='y', animation_frame=df.index, size_max=50, range_x=[0, 10], range_y=[0, 10])

# 顯示圖表
fig.show()

在這個例子中,使用Plotly的scatter函數創建了一個動畫散點圖,通過animation_frame參數指定了動畫的幀。

輸出和分享可視化

一旦創建了令人滿意的可視化,你可能希望將其分享給他人。Matplotlib、Seaborn、Bokeh和Plotly都提供了保存圖表的功能,可以將圖表保存為圖片或HTML文件。

# 保存Matplotlib圖表
plt.savefig('my_plot.png')

# 保存Bokeh圖表
from bokeh.io import output_file, save
output_file('my_bokeh_plot.html')
save(p)

# 保存Plotly圖表
fig.write_html('my_plotly_plot.html')

這些方法使得你可以方便地將可視化結果分享給他人,或者嵌入到網頁中。

實際應用示例:輿情分析的交互性可視化

讓我們通過一個實際的應用場景,結合Matplotlib、Seaborn、Bokeh和Plotly,來展示如何創建一個交互性的輿情分析可視化。

假設我們有一份包含日期、情感分數和新聞數量的數據集,我們希望通過可視化展示每天的輿情走勢,並提供交互性操作。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from bokeh.plotting import figure, show
import plotly.express as px

# 創建示例數據集
data = {'Date': pd.date_range(start='2024-01-01', end='2024-01-10'),
        'Sentiment': [0.2, -0.1, 0.5, -0.3, 0.6, -0.2, 0.1, 0.4, -0.5, 0.3],
        'News_Count': [10, 8, 12, 6, 15, 9, 11, 14, 7, 13]}

df = pd.DataFrame(data)

# Matplotlib折線圖
plt.figure(figsize=(10, 5))
plt.plot(df['Date'], df['Sentiment'], label='Sentiment Score', marker='o')
plt.plot(df['Date'], df['News_Count'], label='News Count', marker='o')
plt.title('Sentiment Analysis Over Time')
plt.xlabel('Date')
plt.ylabel('Score/Count')
plt.legend()
plt.show()

# Seaborn折線圖
plt.figure(figsize=(10, 5))
sns.lineplot(x='Date', y='Sentiment', data=df, label='Sentiment Score', marker='o')
sns.lineplot(x='Date', y='News_Count', data=df, label='News Count', marker='o')
plt.title('Sentiment Analysis Over Time (Seaborn)')
plt.xlabel('Date')
plt.ylabel('Score/Count')
plt.legend()
plt.show()

# Bokeh交互性折線圖
p = figure(title='Sentiment Analysis Over Time', x_axis_label='Date', y_axis_label='Score/Count', width=800, height=400)
p.line(df['Date'], df['Sentiment'], legend_label='Sentiment Score', line_width=2, line_color='blue')
p.circle(df['Date'], df['Sentiment'], size=8, color='blue')
p.line(df['Date'], df['News_Count'], legend_label='News Count', line_width=2, line_color='green')
p.square(df['Date'], df['News_Count'], size=8, color='green')
p.legend.location = 'top_left'
show(p)

# Plotly交互性折線圖
fig = px.line(df, x='Date', y=['Sentiment', 'News_Count'], labels={'value': 'Score/Count'},
              title='Sentiment Analysis Over Time (Plotly)', markers=True)
fig.show()

在這個示例中,我們使用了Matplotlib、Seaborn、Bokeh和Plotly創建了相同的輿情分析可視化,其中Bokeh和Plotly提供了交互性操作,可以縮放、平移、懸停查看數值等。

這種綜合運用不同庫的方式,可以根據具體需求選擇最適合的工具,為數據科學和分析提供更全面、多樣化的可視化支持。

總結

本文詳細介紹瞭如何使用Python中的Matplotlib、Seaborn、Bokeh和Plotly等庫進行數據可視化,並深入探討了一系列主題,涵蓋了從基礎的靜態圖表到高級的交互性和動態可視化的方方面面。以下是本文的主要總結:

  1. Matplotlib和Seaborn基礎: 學習了使用Matplotlib和Seaborn創建各種靜態圖表的基本方法,包括折線圖、直方圖和散點圖。

  2. 高級主題: 涵蓋了時間序列可視化、面向對象的繪圖和性能優化等高級主題,使讀者能夠更好地應對不同場景下的數據可視化任務。

  3. 交互性和動態可視化: 介紹了Bokeh和Plotly這兩個強大的交互性可視化庫,展示瞭如何創建動態可視化和交互性圖表,以更靈活地與數據進行互動。

  4. 實際應用示例: 通過一個輿情分析的實際應用場景,演示瞭如何結合多個庫創建一個綜合、交互性的可視化,為讀者提供了在實際工作中應用所學知識的示範。

  5. 輸出和分享可視化: 介紹瞭如何保存可視化結果為圖片或HTML文件,以便分享或嵌入到網頁中,幫助讀者將成果展示給他人。

通過這篇綜合性的指南,讀者可以全面瞭解數據可視化的基礎知識,並學會如何應用不同的庫和技術,使得數據科學和分析工作更具深度和廣度。希望本文能夠激發讀者對數據可視化的興趣,併為他們在實際項目中提供有力的工具和方法。

點擊關註,第一時間瞭解華為雲新鮮技術~

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • C++ 變數 變數是用於存儲數據值的容器。 在 C++ 中,有不同類型的變數(使用不同的關鍵字定義),例如: int - 存儲整數(沒有小數點),例如 123 或 -123 double - 存儲浮點數,帶有小數點,例如 19.99 或 -19.99 char - 存儲單個字元,例如 'a' 或 ' ...
  • 在Java EE(Java Enterprise Edition)開發環境中,編程意義上的“介面”(interface)和API介面雖然都涉及介面的概念,但它們屬於不同層面的術語。 1. 編程意義上的“介面”(interface) 在Java編程語言中,介面(interface)是一種引用類型,它是 ...
  • Spring 為開發 Java 應用程式提供了全面的基礎架構支持,它將 Java 對象交由容器統一管理,從而實現控制反轉(IOC)和依賴註入(DI),並提供了一些常用模塊如 SpringAOP、SpringJDBC、SpringMVC 等等 SpringBoot 繼承了 Spring 的核心思想,並 ...
  • 在處理PDF文檔時,有時需要為文檔中的每一頁添加頁眉和頁腳,以包含一些有用的信息,如文檔標題、章節名稱、日期、頁碼等。對於需要自動化處理的場景,或者需要在大量文檔中添加一致的頁眉和頁腳,可以通過編程的方式來實現。本文將介紹如何使用Java為PDF文件添加頁眉、頁腳。 所需工具:Free Spire. ...
  • 今天講一個常見的gc compiler(也就是官方版本的go編譯器和runtime)在垃圾回收的掃描標記階段做的優化。 我對這個優化的描述印象最深的是在bigcache的註釋里,大致內容是如果map的鍵值都不包含指針,那麼gc掃描的時候不管這個map多大都不會深入掃描map內部存儲的數據,只檢查ma ...
  • 目錄簡介架構Application 和組件簡單入門示例先決條件創建項目編譯庫文件引用庫文件運行項目界面交互示例創建項目編譯庫文件實現應用函數引用庫文件運行項目參考資料 簡介 Sauron 是一個多功能的 Web 框架和庫,用於構建客戶端和/或伺服器端 Web 應用程式,重點關註人體工程學、簡單性和優 ...
  • 前言 springboot 整合 ES 有兩種方案,ES 官方提供的 Elasticsearch Java API Client 和 spring 提供的 [Spring Data Elasticsearch](Spring Data Elasticsearch) 兩種方案各有優劣 Spring:高 ...
  • EasyCode —— 基於 IntelliJ IDEA Ultimate 版開發的一個代碼生成插件,主要通過自定義模板(基於 velocity)來生成各種你想要的代碼。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...