數據分析和科學計算可視化

来源:https://www.cnblogs.com/cnn-ljc/archive/2020/05/05/12824355.html
-Advertisement-
Play Games

一、用於數據分析、科學計算與可視化的擴展模塊主要有:numpy、scipy、pandas、SymPy、matplotlib、Traits、TraitsUI、Chaco、TVTK、Mayavi、VPython、OpenCV。 1.numpy模塊:科學計算包,支持N維數組運算、處理大型矩陣、成熟的廣播函 ...


一、用於數據分析、科學計算與可視化的擴展模塊主要有:numpy、scipy、pandas、SymPy、matplotlib、Traits、TraitsUI、Chaco、TVTK、Mayavi、VPython、OpenCV。

1.numpy模塊:科學計算包,支持N維數組運算、處理大型矩陣、成熟的廣播函數庫、矢量運算、線性代數、傅里葉變換、隨機數生成、並可與C++ /Fortran語言無縫結合。Python v3預設安裝已經包含了numpy。

(1)導入模塊:import  numpy  as  np

切片操作

>>> a = np.arange(10)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> a[::-1]                           # 反向切片
array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
>>> a[::2]                            # 隔一個取一個元素
array([0, 2, 4, 6, 8])
>>> a[:5]                             # 前5個元素
array([0, 1, 2, 3, 4])

>>> c = np.arange(25)     # 創建數組
>>> c.shape = 5,5         # 修改數組大小
>>> c
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24]])
>>> c[0, 2:5]             # 第0行中下標[2,5)之間的元素值
array([2, 3, 4])
>>> c[1]                  # 第0行所有元素
array([5, 6, 7, 8, 9])
>>> c[2:5, 2:5]           # 行下標和列下標都介於[2,5)之間的元素值
array([[12, 13, 14],
       [17, 18, 19],
       [22, 23, 24]])  
布爾運算
>>> x = np.random.rand(10) # 包含10個隨機數的數組
>>> x
array([ 0.56707504,  0.07527513,  0.0149213 ,  0.49157657,  0.75404095,
      0.40330683,  0.90158037,  0.36465894,  0.37620859,  0.62250594])
>>> x > 0.5               # 比較數組中每個元素值是否大於0.5
array([ True, False, False, False,  True, False,  True, False, False,  True], dtype=bool)
>>> x[x>0.5]              # 獲取數組中大於0.5的元素,可用於檢測和過濾異常值
array([ 0.56707504,  0.75404095,  0.90158037,  0.62250594])
>>> x < 0.5
array([False,  True,  True,  True, False,  True, False,  True,  True, False], dtype=bool)
>>> np.all(x<1)           # 測試是否全部元素都小於1
True
>>> np.any([1,2,3,4])         # 是否存在等價於True的元素
True
>>> np.any([0])
False
>>> a = np.array([1, 2, 3])
>>> b = np.array([3, 2, 1])
>>> a > b                     # 兩個數組中對應位置上的元素比較
array([False, False,  True], dtype=bool)
>>> a[a>b]
array([3])
>>> a == b
array([False,  True, False], dtype=bool)
>>> a[a==b]
array([2]) 
取整運算

>>> x = np.random.rand(10)*50      # 10個隨機數
>>> x
array([ 43.85639765,  30.47354735,  43.68965984,  38.92963767,
         9.20056878,  21.34765863,   4.61037809,  17.99941701,
        19.70232038,  30.05059154])
>>> np.int64(x)                    # 取整
array([43, 30, 43, 38,  9, 21,  4, 17, 19, 30], dtype=int64)
>>> np.int32(x)
array([43, 30, 43, 38,  9, 21,  4, 17, 19, 30])
>>> np.int16(x)
array([43, 30, 43, 38,  9, 21,  4, 17, 19, 30], dtype=int16)
>>> np.int8(x)
array([43, 30, 43, 38,  9, 21,  4, 17, 19, 30], dtype=int8)
廣播

>>> a = np.arange(0,60,10).reshape(-1,1)     # 列向量
>>> b = np.arange(0,6)                       # 行向量
>>> a
array([[ 0],
       [10],
       [20],
       [30],
       [40],
       [50]])
>>> b
array([0, 1, 2, 3, 4, 5])
>>> a[0] + b                                 # 數組與標量的加法
array([0, 1, 2, 3, 4, 5])
>>> a[1] + b
array([10, 11, 12, 13, 14, 15])
>>> a + b                                     
array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])
>>> a * b
array([[  0,   0,   0,   0,   0,   0],
       [  0,  10,  20,  30,  40,  50],
       [  0,  20,  40,  60,  80, 100],
       [  0,  30,  60,  90,  120, 150],
       [  0,  40,  80,  120, 160, 200],
       [  0,  50,  100, 150,  200, 250]])
分段函數

>>> x = np.random.randint(0, 10, size=(1,10))
>>> x
array([[0, 4, 3, 3, 8, 4, 7, 3, 1, 7]])
>>> np.where(x<5, 0, 1)            # 小於5的元素值對應0,其他對應1
array([[0, 0, 0, 0, 1, 0, 1, 0, 0, 1]])
>>> np.piecewise(x, [x<4, x>7], [lambda x:x*2, lambda x:x*3])
                                   # 小於4的元素乘以2
                                   # 大於7的元素乘以3
                                   # 其他元素變為0
array([[ 0,  0,  6,  6, 24,  0,  0,  6,  2,  0]])


計算唯一值以及出現次數

>>> x = np.random.randint(0, 10, 7)
>>> x
array([8, 7, 7, 5, 3, 8, 0])
>>> np.bincount(x)   # 元素出現次數,0出現1次,
                     # 1、2沒出現,3出現1次,以此類推
array([1, 0, 0, 1, 0, 1, 0, 2, 2], dtype=int64)
>>> np.sum(_)        # 所有元素出現次數之和等於數組長度
7
>>> np.unique(x)     # 返回唯一元素值
array([0, 3, 5, 7, 8])


矩陣運算

>>> a_list = [3, 5, 7]
>>> a_mat = np.matrix(a_list)            # 創建矩陣
>>> a_mat
matrix([[3, 5, 7]])
>>> a_mat.T                              # 矩陣轉置
matrix([[3],
        [5],
        [7]])
>>> a_mat.shape                          # 矩陣形狀
(1, 3)
>>> a_mat.size                           # 元素個數
3
>>> a_mat.mean()                         # 元素平均值
5.0
>>> a_mat.sum()                          # 所有元素之和
15
>>> a_mat.max()                          # 最大值
7

>>> a_mat.max(axis=1)                    # 橫向最大值
matrix([[7]])
>>> a_mat.max(axis=0)                    # 縱向最大值
matrix([[3, 5, 7]])
>>> b_mat = np.matrix((1, 2, 3))         # 創建矩陣
>>> b_mat
matrix([[1, 2, 3]])
>>> a_mat * b_mat.T                      # 矩陣相乘
matrix([[34]])

>>> c_mat = np.matrix([[1, 5, 3], [2, 9, 6]]) # 創建二維矩陣
>>> c_mat
matrix([[1, 5, 3],
        [2, 9, 6]])
>>> c_mat.argsort(axis=0)                     # 縱向排序後的元素序號
matrix([[0, 0, 0],
        [1, 1, 1]], dtype=int64)
>>> c_mat.argsort(axis=1)                     # 橫向排序後的元素序號
matrix([[0, 2, 1],
        [0, 2, 1]], dtype=int64)
>>> d_mat = np.matrix([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>>> d_mat.diagonal()                          # 矩陣對角線元素
matrix([[1, 5, 9]])
矩陣不同維度上的計算

>>> x = np.matrix(np.arange(0,10).reshape(2,5))  # 二維矩陣
>>> x
matrix([[0, 1, 2, 3, 4],
        [5, 6, 7, 8, 9]])
>>> x.sum()                                      # 所有元素之和
45
>>> x.sum(axis=0)                                # 縱向求和
matrix([[ 5,  7,  9, 11, 13]])
>>> x.sum(axis=1)                                # 橫向求和
matrix([[10],
        [35]])
>>> x.mean()                                     # 平均值
4.5
>>> x.mean(axis=1)
matrix([[ 2.],
        [ 7.]])
>>> x.mean(axis=0)
matrix([[ 2.5,  3.5,  4.5,  5.5,  6.5]])

>>> x.max()                                # 所有元素最大值
9
>>> x.max(axis=0)                          # 縱向最大值
matrix([[5, 6, 7, 8, 9]])
>>> x.max(axis=1)                          # 橫向最大值
matrix([[4],
        [9]])
>>> weight = [0.3, 0.7]                    # 權重
>>> np.average(x, axis=0, weights=weight)
matrix([[ 3.5,  4.5,  5.5,  6.5,  7.5]])

>>> x = np.matrix(np.random.randint(0, 10, size=(3,3)))
>>> x
matrix([[3, 7, 4],
        [5, 1, 8],
        [2, 7, 0]])
>>> x.std()                         # 標準差
2.6851213274654606
>>> x.std(axis=1)                   # 橫向標準差
matrix([[ 1.69967317],
        [ 2.86744176],
        [ 2.94392029]])
>>> x.std(axis=0)                   # 縱向標準差
matrix([[ 1.24721913,  2.82842712,  3.26598632]])
>>> x.var(axis=0)                   # 縱向方差
matrix([[  1.55555556,   8.        ,  10.66666667]])

 

2.matplotlib模塊依賴於numpy模塊和tkinter模塊,可以繪製多種形式的圖形,包括線圖、直方圖、餅狀圖、散點圖、誤差線圖等等,圖形質量可滿足出版要求,是數據可視化的重要工具。

 

 

二、使用numpy、matplotlib模塊繪製雷達圖

import numpy as np
import matplotlib.pyplot as plt

# 中文和負號的正常顯示
plt.rcParams['font.sans-serif'] = 'Microsoft YaHei'
plt.rcParams['axes.unicode_minus'] = False

# 使用ggplot的繪圖風格
plt.style.use('ggplot')

# 構造數據
values = [5,5,5,5,5,5,5]
feature = ['第一周','第二周','第三周','第四周','第五周','第六周','第七周']

N = len(values)
# 設置雷達圖的角度,用於平分切開一個圓面
angles=np.linspace(0, 2*np.pi, N, endpoint=False)
# 為了使雷達圖一圈封閉起來,需要下麵的步驟
values=np.concatenate((values,[values[0]]))
angles=np.concatenate((angles,[angles[0]]))

# 繪圖
fig=plt.figure()
ax = fig.add_subplot(111, polar=True)
# 繪製折線圖
ax.plot(angles, values, 'o-', linewidth=2, label = '學號2019310143016')
# 填充顏色
ax.fill(angles, values, alpha=0.35)

# 添加每個特征的標簽
ax.set_thetagrids(angles * 180/np.pi, feature)
# 設置雷達圖的範圍
ax.set_ylim(0,5)
# 添加標題
plt.title('純牛奶的成績單')

# 添加網格線
ax.grid(True)
# 設置圖例
plt.legend(loc = 'best')
# 顯示圖形
plt.show()

 

 

 

 

三、使用PIL、numpy模塊繪製自定義手繪風 

from PIL import Image
import numpy as np
 
a = np.asarray(Image.open("xiaoxiao.jpg").convert("L")).astype("float")
 
depth = 50
grad = np.gradient(a)   
 
grad_x, grad_y = grad
grad_x = grad_x*depth/100
grad_y = grad_y*depth/100
A = np.sqrt(grad_x**2 + grad_y**2 + 1.)
uni_x = grad_x/A
uni_y = grad_y/A
uni_z = 1./A
 
vec_el = np.pi/2.2  
vec_az = np.pi/4.   
dx = np.cos(vec_el)*np.cos(vec_az)
dy = np.cos(vec_el)*np.sin(vec_az)
dz = np.sin(vec_el)
 
b = 255*(dx*uni_x + dy*uni_y + dz*uni_z)
b = b.clip(0, 255)
 
im = Image.fromarray(b.astype('uint8'))
im.save("b.jpg")

  

原圖:

 

結果:

 

 

 

四、科學計算、繪製sinx、cosx的數學規律

import numpy as np
import pylab as pl
import matplotlib.font_manager as fm
myfont = fm.FontProperties(fname=r'C:\Windows\Fonts\STKAITI.ttf')
t = np.arange(0.0, 2.0*np.pi, 0.01)                       
s = np.sin(t)                                             
z = np.cos(t)                                             
pl.plot(t, s, label='正弦')
pl.plot(t, z, label='餘弦')
pl.xlabel('x-變數', fontproperties='STKAITI', fontsize=18) 
pl.ylabel('y-正弦餘弦函數值', fontproperties='simhei', fontsize=18)
pl.title('sin-cos函數圖像', fontproperties='STLITI', fontsize=24)
pl.legend(prop=myfont)                                                          
pl.show()

  


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 網站架構變遷 Intro 從最早的 html 的學習到現在從單體應用遷移到微服務架構,所經歷的網站架構也一直在變化,於是想寫一篇關於網站架構變遷的文章。 單伺服器 最早的我們的網站只有一臺伺服器,網站應用 + 資料庫 + 網站文件 都在同一臺伺服器上,有的時候一臺伺服器上也會有多個網站。 這個階段的 ...
  • 當程式運行出現異常時,會退出程式結束運行而不至於讓程式崩潰。 1. 異常類 所有異常的根類是java.lang.Throwable,其下有兩個子類:Error和Exception。 (1) Error Error是程式無法處理的錯誤,錶面系統JVM處於不可恢復的崩潰狀態,此時錯誤與代碼書寫無關。 如 ...
  • 原型模式(Prototype Pattern)也有人將原型模式稱為克隆模式,是屬於創造型設計模式,用於創建重覆的對象,提供了一種創建對象的最佳方式。原型模式需要實現Cloneable介面,來實現對象的克隆。在實際的應用中,如果應用需要反覆創建相同的對象時,並且創建這個對象需要花費大量時間或者需要訪問 ...
  • 導入相關依賴: 配置資料庫連接信息: 測試連接: 簡單使用示例: ...
  • 1首先建立Clsss類文件memcached.class.php <?phpclass Memcacheds{ //聲明靜態成員變數 private static $m = null; private static $cache = null; public function __construct ...
  • #include <iostream> #include <ctime> #include <vector> #include <algorithm> using std::cout; using std::endl; /* xx排序,空間複雜度,時間複雜度,是否原地排序,是否穩定排序 */ /* ...
  • 需要準備的環境: (1)python3.8 (2)pycharm (3)截取網路請求信息的工具,有很多,百度一種隨便用即可。 第一:首先通過python的sqlalchemy模塊,來新建一個表。 第二:通過python中的request模塊介面的形式調取數據。 思路:(1)先獲取所有城市信息:需要用 ...
  • WAE : Concrete syntax WAE : Abstract syntax parse : sexp WAE subst : WAE symbol number WAE interp : WAE number ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...