深度學習(一)——使用Python讀取圖片

来源:https://www.cnblogs.com/zoubilin/archive/2023/07/11/17545697.html
-Advertisement-
Play Games

# 一、Python學習兩大道具 ## 1. dir()工具 - 作用:支持打開package,看到裡面的工具函數 - 示例: (1) 輸出torch庫包含的函數 ```python dir(torch) ``` (2) 輸出torch.AVG函數中的參數 ```python dir(torch.A ...


一、Python學習兩大道具

1. dir()工具

  • 作用:支持打開package,看到裡面的工具函數

  • 示例:

    (1) 輸出torch庫包含的函數

dir(torch)

(2) 輸出torch.AVG函數中的參數

dir(torch.AVG)

2. help()工具

  • 作用:說明書,查看庫中函數某個參數的說明或使用方法

  • 示例:

    (1) 輸出torch庫中AVG函數的AVG參數使用方法

help(torch.AVG.AVG) 

二、Pytorch讀取圖像數據

0. 寫在前面:

(1)PIL庫中Image函數的基本使用方法

  • PIL的安裝:win+r → cmd → 選擇環境 → pip install Pillow

  • 使用方法:

from PIL import Image
  
#選擇圖像路徑
#註意:在複製圖像路徑後,在windows環境下,需要將\變為\\
img_path="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants\\0013035.jpg"
  
#打開並標識給定的圖像文件。
#image.open()是一個懶惰的操作;此函數可識別文件,但文件保持打開狀態,直到嘗試處理數據(或調用load()方法),才會從文件中讀取實際圖像數據。
img=image.open(img_path)
  
#輸出圖像大小
print(img.size)
  
#打開圖像(指的是直接根據該地址打開一個視窗顯示這個圖像)
img.show()

(2)os庫中函數的基本使用方法

  • os.path.join(path1, path2, ... ,pathn):合併路徑,在一定程度上可以避免因python語法問題,造成的\t或\n之類的錯誤。

    比如說,圖片路徑為:”hymenoptera_data\hymenoptera_data\train“,如果直接輸入路徑,那麼會出現以下結果:

path="hymenoptera_data\hymenoptera_data\train"
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data    rain
'''

此時的處理方法有兩種:

方法一:在\後面加個\

path="hymenoptera_data\\hymenoptera_data\\train"
print(path)

'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''

方法二:os.path.join

import os
path1="hymenoptera_data\hymenoptera_data"
path2="train"
path=os.path.join(path1,path2)
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''
  • os.listdir(path):將path中包含的圖片名稱變為一個列表。

    比如說,路徑為”hymenoptera_data\hymenoptera_data\train\ants“的文件夾中有0013035.jpg、5650366_e22b7e1065.jpg、6240329_72c01e663e.jpg三張圖片,那麼此時有:

import os
path="hymenoptera_data\\hymenoptera_data\\train\\ants"
path_list=os.listdir(path)
print(path_list)
  
'''
[Run]
['0013035.jpg', '5650366_e22b7e1065.jpg', '6240329_72c01e663e.jpg']
'''

1. Dataset

  • 作用:提供一種方式去獲取數據及其label

  • 功能:

    • 如何獲取每一個數據及其label

    • 告訴我們總共有多少數據(作用:神經網路要對同一個數據迭代多次,只有當我們知道總共有多少個數據,訓練的時候我們才知道要訓練多少次,才能把這個數據集迭代完然後進行下一次的迭代)

  • 詳解:

    • getitem:獲取數據對應的label

    • len:返回數據的size

使用示例:

數據下載地址:百度網盤 請輸入提取碼 (baidu.com)

提取碼:zsh8

(1)讀取、簡單處理圖像數據

from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    #參數說明:
    #root_dir:數據集的路徑,如"E:\Desktop\hymenoptera_data\hymenoptera_data\train"(最好還是都加上\\,像其中的\train由於\t的存在會導致錯誤)
    #label_dir:數據的標簽,如"ants"
    def __init__(self,root_dir,label_dir):
        self.root_dir=root_dir
        self.label_dir=label_dir

        # 使用os.path.join的方法是為了避免\和\\錯誤的問題
        # self.path='E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants'
        self.path=os.path.join(self.root_dir,self.label_dir)

        #將文件夾內所有圖片的地址變成一個列表,並按先後順序排列
        self.img_path=os.listdir(self.path)

    #輸入:圖像對應的索引
    #返回:idx索引對應的打開並標識過後的圖像文件img;圖像對應的標簽label
    def __getitem__(self,idx):
        img_name=self.img_path[idx]    #根據索引idx,讀取列表self.img_path中的圖像名稱
        img_item_path=os.path.join(self.root_dir,self.label_dir,img_name)   #讀取該索引對應圖像的存儲路徑
        img=Image.open(img_item_path)  #打開並標識給定的圖像文件
        label=self.label_dir    #label=數據標簽,在該數據集中為ant或bee
        return img,label

    #返回圖像數據集的長度,也就是說所讀取的數據集中有多少張圖片
    def __len__(self):
        return len(self.img_path)

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
ants_label_dir="ants"
bees_label_dir="bees"
ants_dataset=MyData(root_dir,ants_label_dir)
bees_dataset=MyData(root_dir,ants_label_dir)

img,label=ants_dataset[0]
print(img,label)   #根據索引,獲取標識過後的圖像img,以及對應的標簽
img.show()         #顯示對應索引的圖像

train_dataset=ants_dataset+bees_dataset    #將兩個數據集進行拼接
print(len(ants_dataset),len(bees_dataset),len(train_dataset))

(2)存儲圖像數據

首先新建一個文件夾,在該文件夾中:.txt文件名錶示.jpg的圖片名稱,.txt文件中存儲的數據為對應圖像的label。用下麵代碼將文件名、label實現寫入:

import os

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
target_dir="ants"
img_path=os.listdir(os.path.join(root_dir,target_dir))  #將target_dir文件夾中的圖片名稱存到img_path的列表中
label=target_dir  #標簽為target_dir(根據實際情況讀取標簽)
out_dir="ants_label"   #輸出圖片的地址
for i in img_path:  #遍歷每一張圖片的名字
    file_name=i.split(".jpg")[0]   #除去.jpg尾碼,取出圖片名字
    with open(os.path.join(root_dir,out_dir,"{}.txt".format(file_name)),'w') as f:   #以圖片名命名.txt文件
        f.write(label)  #將相應圖片的標簽,寫入.txt文件中

2. Dataloder

  • 作用:為後面的網路提供不同的數據形式(對其中幾條數據進行打包)

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 學習數字信號處理演算法時整理的學習筆記。本篇介紹 SSB 單邊帶調幅信號的調製與解調,內附全套 MATLAB 代碼。 ...
  • 解耦 含義 系統各個模塊或組件之間的耦合度降低,使得它們能夠獨立地進行開發、測試、部署和維護。通過解耦,可以提高系統的可維護性、可擴展性和可重用性。 使用場景 將前端和後端分離,通過API介面就行通信,使得前端和後端可以獨立開發、測試和部署。 使用消息隊列解耦生產者和消費者,生產者將消息發送到消息隊 ...
  • JWT簡介 是一種身份認證的開放標準(RFC 7519),可以在網路應用間傳輸信息作為Json對象。由三部分組成:頭部(Header)、載荷(payload)和簽名(Signature). 頭部(Header) 兩部分組成,令牌類型和所使用的的簽名演算法 { "alg":"HS256", "typ": ...
  • 基本概念 是一種用於非同步編程的概念。Task的重要特點是可以在後臺執行方法或操作,而不會阻塞主線程或UI線程。 封裝的非同步操作,表示執行的操作正在進行。可以表示一個方法的返回值或者表示執行的操作已經完成。 Task類的主要成員 屬性:TaskStatus、IsCanceled、IsCompleted ...
  • ## 引言 最近做一個配置的功能,需求是該配置項跟另一個整形配置項關聯,具有一定的函數關係,例如有一個配置項是值為 `N` ,則另一配置 `F` 項滿足函數關係$F=2/(N+1)$。這個函數關係是客戶手動輸入,只需要簡單的四則運算,所以我們要做的就是判斷四則運算表達式是否有效,且給定 `N` 的值 ...
  • 之前在Windows上用過一款圓盤菜單工具Quicker, 感覺非常方便, 換成Macos後,一直沒有找到類似應用。 最近終於發現,一款好用的快捷鍵收集,觸發工具Radial Menu. 其核心功能是可以根據當前程式的上下文,彈出一個圓盤菜單。 執行圓盤中的動作。 目前菜單動作還僅支持快捷鍵,預計後 ...
  • 今天檢查前同事留下的一個shell腳本時,其中一個腳本中有一個業務邏輯處理:要判斷Oracle資料庫實例是否啟動,如果資料庫實例處於OPEN狀態的話,則執行/運行一些業務邏輯操作。腳本大體如下(腳本做了一下混淆和精簡收縮) up_flag=`${SCRIPT_DIR}/chkdbup.sh ${OR ...
  • 本文介紹在**Windows 10**操作系統中,進行**用戶變數**、**系統變數**等兩種**環境變數**的新建、修改與刪除的詳細方法。 在很多時候,我們需要對**Windows**電腦的**環境變數**加以修改,例如安裝一些專業軟體、配置一些代碼環境等等;這裡就具體介紹一下這一操作的方法。 首 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...