Python從0到1丨細說圖像增強及運算

摘要：本文主要講解常見的圖像銳化和邊緣檢測方法，即Roberts運算元和Prewitt運算元。本文分享自華為雲社區《[Python從零到壹] 五十七.圖像增強及運算篇之圖像銳化Roberts、Prewitt運算元實現邊緣檢測》，作者： eastmount。一.圖像銳化由於收集圖像數據的器件或傳輸圖像 ...

摘要：本文主要講解常見的圖像銳化和邊緣檢測方法，即Roberts運算元和Prewitt運算元。

本文分享自華為雲社區《[Python從零到壹] 五十七.圖像增強及運算篇之圖像銳化Roberts、Prewitt運算元實現邊緣檢測》，作者： eastmount。

一.圖像銳化

由於收集圖像數據的器件或傳輸圖像的通道存在一些質量缺陷，或者受其他外界因素的影響，使得圖像存在模糊和有雜訊的情況，從而影響到圖像識別工作的開展。一般來說，圖像的能量主要集中在其低頻部分，雜訊所在的頻段主要在高頻段，同時圖像邊緣信息主要集中在其高頻部分。這將導致原始圖像在平滑處理之後，圖像邊緣和圖像輪廓模糊的情況出現。為了減少這類不利效果的影響，就需要利用圖像銳化技術，使圖像的邊緣變得清晰[1]。

圖像銳化處理的目的是為了使圖像的邊緣、輪廓線以及圖像的細節變得清晰，經過平滑的圖像變得模糊的根本原因是圖像受到了平均或積分運算，因此可以對其進行逆運算，從而使圖像變得清晰。微分運算是求信號的變化率，具有較強高頻分量作用。從頻率域來考慮，圖像模糊的實質是因為其高頻分量被衰減，因此可以用高通濾波器來使圖像清晰。但要註意能夠進行銳化處理的圖像必須有較高的性噪比，否則銳化後圖像性噪比反而更低，從而使得雜訊增加比信號還要多，因此一般是先去除或減輕雜訊後再進行銳化處理。這時需要開展圖像銳化和邊緣檢測處理，加強原圖像的高頻部分，銳化突出圖像的邊緣細節，改善圖像的對比度，使模糊的圖像變得更清晰。

圖像銳化和邊緣提取技術可以消除圖像中的雜訊，提取圖像信息中用來表徵圖像的一些變數，為圖像識別提供基礎。通常使用灰度差分法對圖像的邊緣、輪廓進行處理，將其凸顯。圖像銳化的方法分為高通濾波和空域微分法，本章主要介紹Robert運算元、Prewitt運算元、Sobel運算元、Laplacian運算元、Scharr運算元等[2-3]。

1.一階微分運算元

一階微分運算元一般藉助空域微分運算元通過捲積完成，但實際上數字圖像處理中求導是利用差分近似微分來進行的。梯度對應一階導數，梯度運算元是一階導數運算元。對一個連續函數f(x,y)，它在位置(x,y)梯度可表示為一個矢量：

梯度的模值為公式（2）所示。

梯度的方向在最大變化率方向上，梯度方向如公式（3）所示。

對於數字圖像，導數可以用差分來近似，則梯度可以表示為：

在實際中常用區域模板捲積來近似計算，對水平方向和垂直方向各用一個模板，再通過兩個模板組合起來構成一個梯度運算元。根據模板的大小，其中元素值的不同，可以提出多種模板，構成不同的檢測運算元，後文中將對各種運算元進行詳細介紹。

由梯度的計算可知，在圖像灰度變化較大的邊沿區域其梯度值大，在灰度變化平緩的區域梯度值較小，而在灰度均勻的區域其梯度值為零。根據得到的梯度值來返回像素值，如將梯度值大的像素設置成白色，梯度值小的設置為黑色，這樣就可以將邊緣提取出來了，或者是加強梯度值大的像素灰度值就可以突出細節了達到了銳化的目的。

2.二階微分運算元

二階微分運算元是求圖像灰度變化導數的導數，對圖像中灰度變化強烈的地方很敏感，從而可以突出圖像的紋理結構。當圖像灰度變化劇烈時，進行一階微分則會形成一個局部的極值，對圖像進行二階微分則會形成一個過零點，並且在零點兩邊產生一個波峰和波谷，設定一個閾值檢測到這個過零點，如圖1所示。

這樣做的好處有兩個，一是二階微分關心的是圖像灰度的突變而不強調灰度緩慢變化的區域，對邊緣的定位能力更強；二是Laplacian運算元是各向同性的，即具有旋轉不變性，在一階微分里，是用|dx|+|dy|來近似一個點的梯度，當圖像旋轉一個角度時，這個值就會變化，但對於Laplacian運算元來說，不管圖像怎麼旋轉，得到的相應值是一樣的。

想要確定過零點要以p為中心的一個3×3領域，p點為過零點意味著至少有兩個相對的領域像素的符號不同。有四種要檢測的情況：左/右、上/下、兩個對角。如果g(x,y)的值與一個閾值比較，那麼不僅要求相對領域的符號不同，數值差的絕對值也要超過這個閾值，這時p稱為一個過零點像素。二階微分的定義為：

二階微分在恆定灰度區域的微分值為零，在灰度臺階或斜坡起點處微分值非零，沿著斜坡的微分值為零。與一階微分運算元相比較，一階微分運算元獲得的邊界是比較粗略的邊界，反映的邊界信息較少，但是所反映的邊界比較清晰；二階微分運算元獲得的邊界是比較細緻的邊界，反映的邊界信息包括了許多的細節信息，但是所反映的邊界不是太清晰。

二.Roberts運算元

Roberts運算元又稱為交叉微分演算法，它是基於交叉差分的梯度演算法，通過局部差分計算檢測邊緣線條。常用來處理具有陡峭的低雜訊圖像，當圖像邊緣接近於正45度或負45度時，該演算法處理效果更理想，其缺點是對邊緣的定位不太準確，提取的邊緣線條較粗。

Roberts運算元的模板分為水平方向和垂直方向，如公式（6）所示，從其模板可以看出，Roberts運算元能較好的增強正負45度的圖像邊緣[4]。

如公式（7）所示，分別表示圖像的水平方向和垂直方向的計算公式。

Roberts運算元像素的最終計算公式如下：

在Python中，Roberts運算元主要通過Numpy定義模板，再調用OpenCV的filter2D()函數實現邊緣提取[3]。該函數主要是利用內核實現對圖像的捲積運算，其函數原型如下所示：

dst = filter2D(src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])
– src表示輸入圖像
– dst表示輸出的邊緣圖，其大小和通道數與輸入圖像相同
– ddepth表示目標圖像所需的深度
– kernel表示捲積核，一個單通道浮點型矩陣
– anchor表示內核的基準點，其預設值為（-1，-1），位於中心位置
– delta表示在儲存目標圖像前可選的添加到像素的值，預設值為0
– borderType表示邊框模式

在進行Roberts運算元處理之後，還需要調用convertScaleAbs()函數計算絕對值，並將圖像轉換為8點陣圖進行顯示。其演算法原型如下：

dst = convertScaleAbs(src[, dst[, alpha[, beta]]])
– src表示原數組
– dst表示輸出數組，深度為8位
– alpha表示比例因數
– beta表示原數組元素按比例縮放後添加的值

最後調用addWeighted()函數計算水平方向和垂直方向的Roberts運算元。其運行代碼如下：

# -*- coding: utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('luo.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Roberts運算元
kernelx = np.array([[-1,0],[0,1]], dtype=int)
kernely = np.array([[0,-1],[1,0]], dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8 
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Roberts = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = ['原始圖像', 'Roberts運算元'] 
images = [lenna_img, Roberts] 
for i in range(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

其運行結果如圖2所示，左邊為原始圖像，右邊為Roberts運算元圖像銳化提取的邊緣輪廓。

三.Prewitt運算元

Prewitt是一種圖像邊緣檢測的微分運算元，其原理是利用特定區域內像素灰度值產生的差分實現邊緣檢測。由於Prewitt運算元採用3×3模板對區域內的像素值進行計算，而Robert運算元的模板為2×2，故Prewitt運算元的邊緣檢測結果在水平方向和垂直方向均比Robert運算元更加明顯。Prewitt運算元適合用來識別雜訊較多、灰度漸變的圖像，其計算公式如下所示。

具體的水平和垂直方向計算公式如下所示：

Prewitt運算元像素的最終計算如公式（11）所示。

在Python中，Prewitt運算元的實現過程與Roberts運算元比較相似。通過Numpy定義模板，再調用OpenCV的filter2D()函數實現對圖像的捲積運算，最終通過convertScaleAbs()和addWeighted()函數實現邊緣提取，代碼如下所示：

# -*- coding: utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('luo.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Prewitt運算元
kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]],dtype=int)
kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]],dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = ['原始圖像', 'Prewitt運算元'] 
images = [lenna_img, Prewitt] 
for i in range(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()