使用Python讀取圖片

来源:https://www.cnblogs.com/zoubilin/archive/2023/07/11/17545697.html
-Advertisement-
Play Games

# 一、Python學習兩大道具 ## 1. dir()工具 - 作用:支持打開package,看到裡面的工具函數 - 示例: (1) 輸出torch庫包含的函數 ```python dir(torch) ``` (2) 輸出torch.AVG函數中的參數 ```python dir(torch.A ...


一、Python學習兩大道具

1. dir()工具

  • 作用:支持打開package,看到裡面的工具函數

  • 示例:

    (1) 輸出torch庫包含的函數

dir(torch)

(2) 輸出torch.AVG函數中的參數

dir(torch.AVG)

2. help()工具

  • 作用:說明書,查看庫中函數某個參數的說明或使用方法

  • 示例:

    (1) 輸出torch庫中AVG函數的AVG參數使用方法

help(torch.AVG.AVG) 

二、Pytorch讀取圖像數據

0. 寫在前面:

(1)PIL庫中Image函數的基本使用方法

  • PIL的安裝:win+r → cmd → 選擇環境 → pip install Pillow

  • 使用方法:

from PIL import Image
  
#選擇圖像路徑
#註意:在複製圖像路徑後,在windows環境下,需要將\變為\\
img_path="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants\\0013035.jpg"
  
#打開並標識給定的圖像文件。
#image.open()是一個懶惰的操作;此函數可識別文件,但文件保持打開狀態,直到嘗試處理數據(或調用load()方法),才會從文件中讀取實際圖像數據。
img=image.open(img_path)
  
#輸出圖像大小
print(img.size)
  
#打開圖像(指的是直接根據該地址打開一個視窗顯示這個圖像)
img.show()

(2)os庫中函數的基本使用方法

  • os.path.join(path1, path2, ... ,pathn):合併路徑,在一定程度上可以避免因python語法問題,造成的\t或\n之類的錯誤。

    比如說,圖片路徑為:”hymenoptera_data\hymenoptera_data\train“,如果直接輸入路徑,那麼會出現以下結果:

path="hymenoptera_data\hymenoptera_data\train"
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data    rain
'''

此時的處理方法有兩種:

方法一:在\後面加個\

path="hymenoptera_data\\hymenoptera_data\\train"
print(path)

'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''

方法二:os.path.join

import os
path1="hymenoptera_data\hymenoptera_data"
path2="train"
path=os.path.join(path1,path2)
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''
  • os.listdir(path):將path中包含的圖片名稱變為一個列表。

    比如說,路徑為”hymenoptera_data\hymenoptera_data\train\ants“的文件夾中有0013035.jpg、5650366_e22b7e1065.jpg、6240329_72c01e663e.jpg三張圖片,那麼此時有:

import os
path="hymenoptera_data\\hymenoptera_data\\train\\ants"
path_list=os.listdir(path)
print(path_list)
  
'''
[Run]
['0013035.jpg', '5650366_e22b7e1065.jpg', '6240329_72c01e663e.jpg']
'''

1. Dataset

  • 作用:提供一種方式去獲取數據及其label

  • 功能:

    • 如何獲取每一個數據及其label

    • 告訴我們總共有多少數據(作用:神經網路要對同一個數據迭代多次,只有當我們知道總共有多少個數據,訓練的時候我們才知道要訓練多少次,才能把這個數據集迭代完然後進行下一次的迭代)

  • 詳解:

    • getitem:獲取數據對應的label

    • len:返回數據的size

使用示例:

數據下載地址:百度網盤 請輸入提取碼 (baidu.com)

提取碼:zsh8

(1)讀取、簡單處理圖像數據

from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    #參數說明:
    #root_dir:數據集的路徑,如"E:\Desktop\hymenoptera_data\hymenoptera_data\train"(最好還是都加上\\,像其中的\train由於\t的存在會導致錯誤)
    #label_dir:數據的標簽,如"ants"
    def __init__(self,root_dir,label_dir):
        self.root_dir=root_dir
        self.label_dir=label_dir

        # 使用os.path.join的方法是為了避免\和\\錯誤的問題
        # self.path='E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants'
        self.path=os.path.join(self.root_dir,self.label_dir)

        #將文件夾內所有圖片的地址變成一個列表,並按先後順序排列
        self.img_path=os.listdir(self.path)

    #輸入:圖像對應的索引
    #返回:idx索引對應的打開並標識過後的圖像文件img;圖像對應的標簽label
    def __getitem__(self,idx):
        img_name=self.img_path[idx]    #根據索引idx,讀取列表self.img_path中的圖像名稱
        img_item_path=os.path.join(self.root_dir,self.label_dir,img_name)   #讀取該索引對應圖像的存儲路徑
        img=Image.open(img_item_path)  #打開並標識給定的圖像文件
        label=self.label_dir    #label=數據標簽,在該數據集中為ant或bee
        return img,label

    #返回圖像數據集的長度,也就是說所讀取的數據集中有多少張圖片
    def __len__(self):
        return len(self.img_path)

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
ants_label_dir="ants"
bees_label_dir="bees"
ants_dataset=MyData(root_dir,ants_label_dir)
bees_dataset=MyData(root_dir,ants_label_dir)

img,label=ants_dataset[0]
print(img,label)   #根據索引,獲取標識過後的圖像img,以及對應的標簽
img.show()         #顯示對應索引的圖像

train_dataset=ants_dataset+bees_dataset    #將兩個數據集進行拼接
print(len(ants_dataset),len(bees_dataset),len(train_dataset))

(2)存儲圖像數據

首先新建一個文件夾,在該文件夾中:.txt文件名錶示.jpg的圖片名稱,.txt文件中存儲的數據為對應圖像的label。用下麵代碼將文件名、label實現寫入:

import os

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
target_dir="ants"
img_path=os.listdir(os.path.join(root_dir,target_dir))  #將target_dir文件夾中的圖片名稱存到img_path的列表中
label=target_dir  #標簽為target_dir(根據實際情況讀取標簽)
out_dir="ants_label"   #輸出圖片的地址
for i in img_path:  #遍歷每一張圖片的名字
    file_name=i.split(".jpg")[0]   #除去.jpg尾碼,取出圖片名字
    with open(os.path.join(root_dir,out_dir,"{}.txt".format(file_name)),'w') as f:   #以圖片名命名.txt文件
        f.write(label)  #將相應圖片的標簽,寫入.txt文件中

2. Dataloder

  • 作用:為後面的網路提供不同的數據形式(對其中幾條數據進行打包)

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.前言 在開發中,我們經常用到對象之間的映射。談到對象映射器,我們比較熟知的肯定是AutoMapper,但很少人會知道Mapster。今天在這裡我們一起探討一下什麼是Mapster?為什麼有了AutoMapper映射器了,還要學習使用Mapster? 2.什麼是Mapster? Mapster是一 ...
  • # Unity UGUI的Mask(遮罩)組件的介紹及使用 ## 1. 什麼是Mask組件? Mask(遮罩)組件是Unity UGUI中的一個重要組件,用於限制子對象的可見區域。通過設置遮罩組件,可以實現一些特殊效果,如顯示部分圖片、裁剪文本等。 ## 2. Mask組件的工作原理 Mask組件通 ...
  • **背景** 小編最近接到一個任務,批量獲取內部網站用TXT生成的日誌,在閑時把日誌插入到MySql資料庫做分析。為了快速開發小編選擇了Entity Framework Core,很快開發完成了。測試數據不是很多,批量插入數據很快完成,效率很高。但是部署到線上問題來了,最開始也挺快,越到後面越慢,慢 ...
  • * LambdaExpression繼承Expression ![](https://img2023.cnblogs.com/blog/2404061/202307/2404061-20230710110551773-2135938777.png) * Expression又繼承LambdaExpr ...
  • RabbitMQ 多個消費者共用一個通道實例 與 每個消費者使用不同的通道實例 區別: 1. 多個消費者共用一個通道實例:這種方式下,多個消費者共用同一個通道實例來進行消息的消費。 優點:這樣可以減少通道的創建和銷毀開銷,並且可以利用通道的流控機制來限制消費者的消費速率。 缺點:共用一個通道實例也意 ...
  • # Unity OnOpenAsset 在Unity中,OnOpenAsset是一個非常有用的回調函數,它可以在用戶雙擊資源文件時自動打開一個編輯器視窗。這個回調函數可以用於自定義資源編輯,提高工作效率。本文將介紹OnOpenAsset的使用方法,並提供三個使用例子。 ## OnOpenAsset的 ...
  • # shell腳本-批量主機執行命令(expect) ## 準備 > 上次連接多台伺服器使用ssh-keygen,24機器去連接22、25,所以存在.ssh/authorized_keys > > 1.如果有.ssh/authorized_keys該文件則先刪除 > > ``` > rm -rf.s ...
  • # shell腳本-監控多台伺服器磁碟利用率 ## 介紹 > 第一步:實現免密登錄伺服器 ,為後續腳本免密登錄做好準備。 > > 第二步:把要監控伺服器的ip地址 root用戶 埠port 寫入host.info文件中以便後續腳本從這個文件讀取伺服器信息。 > > 第三步:寫shell腳本,先從h ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...