python數據可視化-matplotlib入門(6)-從文件中載入數據

来源:https://www.cnblogs.com/codingchen/archive/2022/04/29/16203699.html
-Advertisement-
Play Games

前幾篇都是手動錄入或隨機函數產生的數據。實際有許多類型的文件,以及許多方法,用它們從文件中提取數據來圖形化。 比如之前python基礎(12)介紹打開文件的方式,可直接讀取文件中的數據,擴大了我們的數據來源。下麵詳細介紹從文件中載入數據。 一、使用內置的 csv 模塊載入CSV文件 CSV文件是一種 ...


前幾篇都是手動錄入或隨機函數產生的數據。實際有許多類型的文件,以及許多方法,用它們從文件中提取數據來圖形化。

比如之前python基礎(12)介紹打開文件的方式,可直接讀取文件中的數據,擴大了我們的數據來源。下麵詳細介紹從文件中載入數據。

一、使用內置的 csv 模塊載入CSV文件

CSV文件是一種特殊的文本文件,文件中的數據以逗號作為分隔符,很適合進行數據的解析。先用excle建立如下表格和數據,另存為csv格式文件,放到代碼目錄下。

包含在Python標準庫中自帶CSV 模塊,我們只需要import進來就能使用。比如我們需要將上面的CSV文件都列印出來,代碼 如下:

import csv  #import csv 用來導入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑,如果在代碼目錄文件下,可以直接用文件名
with open(filename) as file_csv:      #是不是忘記瞭如何打開文件?打開文件,並將結果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調讀取 用csv.read()讀取文件內容  
    for row in reader: #   用for迴圈列印每一行
        print(row)

運行結果如下:

['Name', 'Grade', 'Class', 'Age', 'mathscore', 'Englishscore']
['Lucy', '7', '2', '14', '95', '86']
['bush', '8', '1', '15', '80', '75']
['lily', '7', '3', '14', '93', '95']
['Jack', '8', '2', '14', '87', '84']
['Mary', '9', '1', '15', '85', '86']
['philip', '7', '3', '14', '90', '92']
['Liming', '9', '2', '16', '99', '87']

 1、列印文件頭及其位置

讀入文件,是為了獲取其中的數據,需要將相關信息進行分離,先看看如何讀出頭即文件的第一行, next()返迴文件中的下一行。

import csv  #import csv 用來導入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記瞭如何打開文件?打開文件,並將結果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調讀取 用csv.read()讀取文件內容  
    header_row = next(reader)   #模塊csv包含函數 next() ,調用它並將閱讀器對象傳遞給它時,它將返迴文件中的下一行
                                #調用了next()一次,因此得到的是文件的第一行,其中包含文件頭

      #for row in reader: # 用for迴圈列印每一行
       # print(row)

    for index, column_header in enumerate(header_row):  #對列表調用了enumerate()來獲取每個元素的索引及其值
        print(index, column_header)  

運行後的結果如下所示:

0 Name
1 Grade
2 Class
3 Age
4 mathscore
5 Englishscore

 提取其中索引,即name的索引為0,Grade的索引為1,知道了索引便可以讀取其中的任何數據,比如我們要列印出mathscore,索引為4,於是代碼如下:

    scores =[] 定義一個空的list
    for row in reader:
        scores.append(int(row[4])) #讀取的文件,預設為字元串,用int()轉換為數字。
    print(scores)

運行結果:

[95, 80, 93, 87, 85, 90, 99]

 接下來,製作圖表展示一下,先把mathscore和englishscore分數做個柱狀對比。代碼如下:

import matplotlib.pyplot as plt
import csv  #import csv 用來導入csv模塊

filename = 'E:\WorkSpace\python\coding\score.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記瞭如何打開文件?打開文件,並將結果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調讀取 用csv.read()讀取文件內容   
    header_row = next(reader)   #模塊csv包含函數 next() ,調用它並將閱讀器對象傳遞給它時,它將返迴文件中的下一行。
                                #調用了 next() 一次,因此得到的是文件的第一行,其中包含文件頭
    mathscores =[] #定義兩個列表
    englishscores=[]
    for row in reader:
        mathscores.append(int(row[4]))     #讀取索引為4的數據,預設為字元串,用int()轉換為數字。
        englishscores.append(int(row[5]))  #讀取索引為5的數據,用int()轉換為數字。
        
plt.bar([1,3,5,7,9,11,13],mathscores,label='math',color='#FF2204')     
plt.bar([2,4,6,8,10,12,14],englishscores, label='englis', color='g')
plt.legend()
plt.title('scores') 
plt.show()

已將那些列印相關代碼刪除。看運行結果:

 接下來,我們讀取文件 ,並根據文件中的時間來繪製圖表

新建一個年份的數據(真的是胡編亂造的數據),第一列是年份,第二列每年畢業的人數,第三列是每年申請人數,如圖所示:

要求:

1,按年份分別顯示出每年兩者的人數,並用不同的顏色表示;

2、兩者間也用其他顏色進行填充。

完成代碼如下:

import matplotlib.pyplot as plt
import csv  #import csv 用來導入csv模塊
from datetime import datetime #引入時間相關模塊

filename = 'E:\WorkSpace\python\coding\graduatesNumbers.csv'  #文件保存的絕對路徑
with open(filename) as file_csv:      #是不是忘記瞭如何打開文件?打開文件,並將結果文件對象存儲在file_csv中
    reader = csv.reader(file_csv)     #直接調讀取 用csv.read()讀取文件內容   
    header_row = next(reader)   
    dates=[]                            
    numbers=[]
    application_numbers=[]
    for row in reader: 
        current_date = datetime.strptime(row[0], "%Y/%m/%d") #年份,strptime()日期格式轉化為字元串格式的函數
        dates.append(current_date)
        numbers.append(int(row[1]))      #讀取索引為1的數據,預設為字元串,用int()轉換為數字,即Numbers of graduates 。
        application_numbers.append(int(row[2])) #讀取索引為2的數據,即Number of applicants
        
plt.plot(dates,numbers,label='Numbers of graduate', c='red') #顯示第一條線
plt.plot(dates,application_numbers,label='Number of applicant', c='green')  #顯示第二條線application_numbers折線
plt.fill_between(dates,numbers, application_numbers, facecolor='blue', alpha=0.5)   #在兩線之間填充顏色  alpha透明度
    
plt.title("The numbers of graduate",fontsize=24)
plt.xlabel('Years', fontsize=16)
plt.ylabel("The numbers", fontsize=16)
plt.legend()
plt.show()

實際運行結果如下:

 除了直接讀取文件外,數據還有眾多其他來源,比如後期涉及的爬蟲等。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 前言 在使用Python的過程中,我最喜歡的就是Python的各種第三方庫,能夠完成很多操作。 下麵就給大家介紹5個通過Python構建的項目,以此來學習Python編程。 一、石頭剪刀布游戲 目標:創建一個命令行游戲,游戲者可以在石頭、剪刀和布之間進行選擇,與電腦PK。如果游戲者贏了,得分就會添 ...
  • 封裝:隱藏內部功能的具體實現,只保留和外部交流數據的介面。繼承:一個對象可以從它的父類繼承所有的通用的屬性和方法,併在無需重新編寫原來的類的情況下對這些功能進行擴展;最大的好處是實現代碼的高效重用。多態:同一個動作作用於不同的對象 所產生不同的行為。 ...
  • 在這次的Java 18中,新增了一個@snipppet標簽,主要用於JavaDoc中需要放示例代碼的場景。其實在Java 18之前,已經有一個@code標簽,可以用於在JavaDoc中編寫小段的代碼內容,比如在之前介紹Simple Web Server視頻中,提到的這段樣例代碼,就是用@code標簽 ...
  • 最近正在學習回溯法,遇到的第一個問題就是n皇後問題,問題如下: 要求在一個n×n的棋盤上放置n個皇後,使得任意兩個皇後不在同一行或同一列或同一斜線上。 直接上代碼: #include<iostream> #include<math.h> using namespace std; void NQuee ...
  • POM :文件名稱是pom.xml ,  pom翻譯過來叫做項目對象模型,maven把一個項目當做一個模型使用 ...
  • 背景介紹 R和Python作為兩個開源、且容易上手的數據分析和繪圖工具,在科研中應用的比較廣泛。 在接下來的日子,我們圍繞Python進行繪圖和數據分析話題,寫一系列推文,事實上是我自己的一些學習筆記分享出來,為了我 方便查閱,也方便大家翻閱。 軟體介紹 [軟體名稱]:Anaconda | Spyd ...
  • 我們知道,頻繁操作資料庫會降低伺服器的系統性能,因此通常需要將頻繁訪問、更新的數據存入到緩存。Halo 項目也引入了緩存機制,且設置了多種實現方式,如自定義緩存、Redis、LevelDB 等,下麵我們分析一下緩存機制的實現過程。 ...
  • 適用 2022.1 【更新時間 2022-4-29】 引言 由於IDEA在2021.2.2以後我們不能再使用重置大法白嫖了。 為了打擊破解,Jetbrains煞費苦心,這次採用了JB賬號登陸,通過授權認證獲取免費試用資格(所以之前的無限重置的插件在今後的新版本中,將無法使用),以下整理了一個免JB註 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...