深度學習（一）——使用Python讀取圖片

-Advertisement-

# 一、Python學習兩大道具 ## 1. dir()工具 - 作用：支持打開package，看到裡面的工具函數 - 示例： (1) 輸出torch庫包含的函數 ```python dir(torch) ``` (2) 輸出torch.AVG函數中的參數 ```python dir(torch.A ...

一、Python學習兩大道具

1. dir()工具

作用：支持打開package，看到裡面的工具函數
示例：

(1) 輸出torch庫包含的函數

dir(torch)

(2) 輸出torch.AVG函數中的參數

dir(torch.AVG)

2. help()工具

作用：說明書，查看庫中函數某個參數的說明或使用方法
示例：

(1) 輸出torch庫中AVG函數的AVG參數使用方法

help(torch.AVG.AVG)

二、Pytorch讀取圖像數據

0. 寫在前面：

（1）PIL庫中Image函數的基本使用方法

PIL的安裝：win+r → cmd → 選擇環境 → pip install Pillow
使用方法：

from PIL import Image
  
#選擇圖像路徑
#註意：在複製圖像路徑後，在windows環境下，需要將\變為\\
img_path="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants\\0013035.jpg"
  
#打開並標識給定的圖像文件。
#image.open()是一個懶惰的操作；此函數可識別文件，但文件保持打開狀態，直到嘗試處理數據(或調用load()方法)，才會從文件中讀取實際圖像數據。
img=image.open(img_path)
  
#輸出圖像大小
print(img.size)
  
#打開圖像(指的是直接根據該地址打開一個視窗顯示這個圖像)
img.show()

（2）os庫中函數的基本使用方法

os.path.join(path1, path2, ... ,pathn)：合併路徑，在一定程度上可以避免因python語法問題，造成的\t或\n之類的錯誤。

比如說，圖片路徑為：”hymenoptera_data\hymenoptera_data\train“，如果直接輸入路徑，那麼會出現以下結果：

path="hymenoptera_data\hymenoptera_data\train"
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data    rain
'''

此時的處理方法有兩種：

方法一：在\後面加個\

path="hymenoptera_data\\hymenoptera_data\\train"
print(path)

'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''

方法二：os.path.join

import os
path1="hymenoptera_data\hymenoptera_data"
path2="train"
path=os.path.join(path1,path2)
print(path)
  
'''
[Run]
hymenoptera_data\hymenoptera_data\train
'''

os.listdir(path)：將path中包含的圖片名稱變為一個列表。

比如說，路徑為”hymenoptera_data\hymenoptera_data\train\ants“的文件夾中有0013035.jpg、5650366_e22b7e1065.jpg、6240329_72c01e663e.jpg三張圖片，那麼此時有：

import os
path="hymenoptera_data\\hymenoptera_data\\train\\ants"
path_list=os.listdir(path)
print(path_list)
  
'''
[Run]
['0013035.jpg', '5650366_e22b7e1065.jpg', '6240329_72c01e663e.jpg']
'''

1. Dataset

作用：提供一種方式去獲取數據及其label
功能：
- 如何獲取每一個數據及其label
- 告訴我們總共有多少數據（作用：神經網路要對同一個數據迭代多次，只有當我們知道總共有多少個數據，訓練的時候我們才知道要訓練多少次，才能把這個數據集迭代完然後進行下一次的迭代）
詳解：
- getitem：獲取數據對應的label
- len：返回數據的size

使用示例：

數據下載地址：百度網盤請輸入提取碼 (baidu.com)

提取碼：zsh8

（1）讀取、簡單處理圖像數據

from torch.utils.data import Dataset
from PIL import Image
import os

class MyData(Dataset):
    #參數說明：
    #root_dir:數據集的路徑，如"E:\Desktop\hymenoptera_data\hymenoptera_data\train"(最好還是都加上\\，像其中的\train由於\t的存在會導致錯誤)
    #label_dir:數據的標簽，如"ants"
    def __init__(self,root_dir,label_dir):
        self.root_dir=root_dir
        self.label_dir=label_dir

        # 使用os.path.join的方法是為了避免\和\\錯誤的問題
        # self.path='E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train\\ants'
        self.path=os.path.join(self.root_dir,self.label_dir)

        #將文件夾內所有圖片的地址變成一個列表，並按先後順序排列
        self.img_path=os.listdir(self.path)

    #輸入：圖像對應的索引
    #返回：idx索引對應的打開並標識過後的圖像文件img；圖像對應的標簽label
    def __getitem__(self,idx):
        img_name=self.img_path[idx]    #根據索引idx，讀取列表self.img_path中的圖像名稱
        img_item_path=os.path.join(self.root_dir,self.label_dir,img_name)   #讀取該索引對應圖像的存儲路徑
        img=Image.open(img_item_path)  #打開並標識給定的圖像文件
        label=self.label_dir    #label=數據標簽,在該數據集中為ant或bee
        return img,label

    #返回圖像數據集的長度，也就是說所讀取的數據集中有多少張圖片
    def __len__(self):
        return len(self.img_path)

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
ants_label_dir="ants"
bees_label_dir="bees"
ants_dataset=MyData(root_dir,ants_label_dir)
bees_dataset=MyData(root_dir,ants_label_dir)

img,label=ants_dataset[0]
print(img,label)   #根據索引，獲取標識過後的圖像img，以及對應的標簽
img.show()         #顯示對應索引的圖像

train_dataset=ants_dataset+bees_dataset    #將兩個數據集進行拼接
print(len(ants_dataset),len(bees_dataset),len(train_dataset))

（2）存儲圖像數據

首先新建一個文件夾，在該文件夾中：.txt文件名錶示.jpg的圖片名稱，.txt文件中存儲的數據為對應圖像的label。用下麵代碼將文件名、label實現寫入：

import os

root_dir="E:\\Desktop\\hymenoptera_data\\hymenoptera_data\\train"
target_dir="ants"
img_path=os.listdir(os.path.join(root_dir,target_dir))  #將target_dir文件夾中的圖片名稱存到img_path的列表中
label=target_dir  #標簽為target_dir(根據實際情況讀取標簽)
out_dir="ants_label"   #輸出圖片的地址
for i in img_path:  #遍歷每一張圖片的名字
    file_name=i.split(".jpg")[0]   #除去.jpg尾碼，取出圖片名字
    with open(os.path.join(root_dir,out_dir,"{}.txt".format(file_name)),'w') as f:   #以圖片名命名.txt文件
        f.write(label)  #將相應圖片的標簽，寫入.txt文件中

2. Dataloder

作用：為後面的網路提供不同的數據形式（對其中幾條數據進行打包）

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

【調製解調】SSB 單邊帶調幅

學習數字信號處理演算法時整理的學習筆記。本篇介紹 SSB 單邊帶調幅信號的調製與解調，內附全套 MATLAB 代碼。 ...
WPF快速定位某個元素的相關信息

解耦含義系統各個模塊或組件之間的耦合度降低，使得它們能夠獨立地進行開發、測試、部署和維護。通過解耦，可以提高系統的可維護性、可擴展性和可重用性。使用場景將前端和後端分離，通過API介面就行通信，使得前端和後端可以獨立開發、測試和部署。使用消息隊列解耦生產者和消費者，生產者將消息發送到消息隊 ...
API身份認證JWT

JWT簡介是一種身份認證的開放標準（RFC 7519）,可以在網路應用間傳輸信息作為Json對象。由三部分組成：頭部（Header）、載荷（payload）和簽名（Signature）. 頭部(Header) 兩部分組成，令牌類型和所使用的的簽名演算法 { "alg":"HS256"， "typ": ...
Task的基本概念、使用方法和實例代碼

基本概念是一種用於非同步編程的概念。Task的重要特點是可以在後臺執行方法或操作，而不會阻塞主線程或UI線程。封裝的非同步操作，表示執行的操作正在進行。可以表示一個方法的返回值或者表示執行的操作已經完成。 Task類的主要成員屬性：TaskStatus、IsCanceled、IsCompleted ...
編碼技巧 --- 如何實現字元串運算表達式的計算

## 引言最近做一個配置的功能，需求是該配置項跟另一個整形配置項關聯，具有一定的函數關係，例如有一個配置項是值為 `N` ，則另一配置 `F` 項滿足函數關係$F=2/(N+1)$。這個函數關係是客戶手動輸入，只需要簡單的四則運算，所以我們要做的就是判斷四則運算表達式是否有效，且給定 `N` 的值 ...
推薦一款好用的Macos應用Radial Menu

之前在Windows上用過一款圓盤菜單工具Quicker，感覺非常方便，換成Macos後，一直沒有找到類似應用。最近終於發現，一款好用的快捷鍵收集,觸發工具Radial Menu. 其核心功能是可以根據當前程式的上下文，彈出一個圓盤菜單。執行圓盤中的動作。目前菜單動作還僅支持快捷鍵，預計後 ...
Linux grep命令與$?命令結合使用技巧

今天檢查前同事留下的一個shell腳本時,其中一個腳本中有一個業務邏輯處理：要判斷Oracle資料庫實例是否啟動，如果資料庫實例處於OPEN狀態的話，則執行/運行一些業務邏輯操作。腳本大體如下（腳本做了一下混淆和精簡收縮） up_flag=`${SCRIPT_DIR}/chkdbup.sh ${OR ...
Windows電腦環境變數（用戶變數、系統變數）的修改

本文介紹在**Windows 10**操作系統中，進行**用戶變數**、**系統變數**等兩種**環境變數**的新建、修改與刪除的詳細方法。在很多時候，我們需要對**Windows**電腦的**環境變數**加以修改，例如安裝一些專業軟體、配置一些代碼環境等等；這裡就具體介紹一下這一操作的方法。首 ...