Python圖像處理丨認識圖像銳化和邊緣提取的4個運算元

来源:https://www.cnblogs.com/huaweiyun/archive/2022/09/08/16669495.html
-Advertisement-
Play Games

摘要:圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。 本文分享自華為雲社區《[Python圖像處理] 十七.圖像銳化與邊緣檢測之Roberts運算元、Prewitt運算元、Sobel運算元和Laplacian算》,作者: eastmount 。 由於 ...


摘要:圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。

本文分享自華為雲社區《[Python圖像處理] 十七.圖像銳化與邊緣檢測之Roberts運算元、Prewitt運算元、Sobel運算元和Laplacian算》,作者: eastmount 。

由於收集圖像數據的器件或傳輸數圖像的通道的存在一些質量缺陷,文物圖像時間久遠,或者受一些其他外界因素、動態不穩定抓取圖像的影響,使得圖像存在模糊和有雜訊的情況,從而影響到圖像識別工作的開展。這時需要開展圖像銳化和邊緣檢測處理,加強原圖像的高頻部分,銳化突出圖像的邊緣細節,改善圖像的對比度,使模糊的圖像變得更清晰。

圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。通常使用灰度差分法對圖像的邊緣、輪廓進行處理,將其凸顯。本文分別採用Laplacian運算元、Robert運算元、Prewitt運算元和Sobel運算元進行圖像銳化邊緣處理實驗。本文主要講解灰度線性變換,基礎性知識希望對您有所幫助。

該系列在github所有源代碼:https://github.com/eastmountyxz/ImageProcessing-Python

一.Roberts運算元

Roberts運算元又稱為交叉微分演算法,它是基於交叉差分的梯度演算法,通過局部差分計算檢測邊緣線條。常用來處理具有陡峭的低雜訊圖像,當圖像邊緣接近於正45度或負45度時,該演算法處理效果更理想。其缺點是對邊緣的定位不太準確,提取的邊緣線條較粗。

Roberts運算元的模板分為水平方向和垂直方向,如公式(11.7)所示,從其模板可以看出,Roberts運算元能較好的增強正負45度的圖像邊緣。

詳細計算公式如下所示:(PS-下圖參考自己的書和論文)

在Python中,Roberts運算元主要通過Numpy定義模板,再調用OpenCV的filter2D()函數實現邊緣提取。該函數主要是利用內核實現對圖像的捲積運算,其函數原型如下所示:

dst = filter2D(src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])

  • src表示輸入圖像
  • dst表示輸出的邊緣圖,其大小和通道數與輸入圖像相同
  • ddepth表示目標圖像所需的深度
  • kernel表示捲積核,一個單通道浮點型矩陣
  • anchor表示內核的基準點,其預設值為(-1,-1),位於中心位置
  • delta表示在儲存目標圖像前可選的添加到像素的值,預設值為0
  • borderType表示邊框模式

Python實現代碼如下所示:

# -*- coding: utf-8 -*-
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('lena.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Roberts運算元
kernelx = np.array([[-1,0],[0,1]], dtype=int)
kernely = np.array([[0,-1],[1,0]], dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8 
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Roberts = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Roberts運算元'] 
images = [lenna_img, Roberts] 
for i in xrange(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

運行結果如下圖所示:

二.Prewitt運算元

Prewitt是一種圖像邊緣檢測的微分運算元,其原理是利用特定區域內像素灰度值產生的差分實現邊緣檢測。由於Prewitt運算元採用33模板對區域內的像素值進行計算,而Robert運算元的模板為22,故Prewitt運算元的邊緣檢測結果在水平方向和垂直方向均比Robert運算元更加明顯。Prewitt運算元適合用來識別雜訊較多、灰度漸變的圖像,其計算公式如下所示。

在Python中,Prewitt運算元的實現過程與Roberts運算元比較相似。通過Numpy定義模板,再調用OpenCV的filter2D()函數實現對圖像的捲積運算,最終通過convertScaleAbs()和addWeighted()函數實現邊緣提取,代碼如下所示:

# -*- coding: utf-8 -*-
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('lena.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Prewitt運算元
kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]],dtype=int)
kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]],dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Prewitt運算元'] 
images = [lenna_img, Prewitt] 
for i in xrange(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

輸出結果如下圖所示,左邊為原始圖像,右邊為Prewitt運算元圖像銳化提取的邊緣輪廓,其效果圖的邊緣檢測結果在水平方向和垂直方向均比Robert運算元更加明顯。

三.Sobel運算元

Sobel運算元是一種用於邊緣檢測的離散微分運算元,它結合了高斯平滑和微分求導。該運算元用於計算圖像明暗程度近似值,根據圖像邊緣旁邊明暗程度把該區域內超過某個數的特定點記為邊緣。Sobel運算元在Prewitt運算元的基礎上增加了權重的概念,認為相鄰點的距離遠近對當前像素點的影響是不同的,距離越近的像素點對應當前像素的影響越大,從而實現圖像銳化並突出邊緣輪廓。

Sobel運算元的邊緣定位更準確,常用於雜訊較多、灰度漸變的圖像。其演算法模板如公式所示,其中dx表示水平方向,dy表示垂直方向。

Sobel運算元根據像素點上下、左右鄰點灰度加權差,在邊緣處達到極值這一現象檢測邊緣。對雜訊具有平滑作用,提供較為精確的邊緣方向信息。因為Sobel運算元結合了高斯平滑和微分求導(分化),因此結果會具有更多的抗噪性,當對精度要求不是很高時,Sobel運算元是一種較為常用的邊緣檢測方法。

dst = Sobel(src, ddepth, dx, dy[, dst[, ksize[, scale[, delta[, borderType]]]]])

  • src表示輸入圖像
  • dst表示輸出的邊緣圖,其大小和通道數與輸入圖像相同
  • ddepth表示目標圖像所需的深度,針對不同的輸入圖像,輸出目標圖像有不同的深度
  • dx表示x方向上的差分階數,取值1或 0
  • dy表示y方向上的差分階數,取值1或0
  • ksize表示Sobel運算元的大小,其值必須是正數和奇數
  • scale表示縮放導數的比例常數,預設情況下沒有伸縮繫數
  • delta表示將結果存入目標圖像之前,添加到結果中的可選增量值
  • borderType表示邊框模式,更多詳細信息查閱BorderTypes

註意,在進行Sobel運算元處理之後,還需要調用convertScaleAbs()函數計算絕對值,並將圖像轉換為8點陣圖進行顯示。其演算法原型如下:

dst = convertScaleAbs(src[, dst[, alpha[, beta]]])

  • src表示原數組
  • dst表示輸出數組,深度為8位
  • alpha表示比例因數
  • beta表示原數組元素按比例縮放後添加的值

Sobel運算元的實現代碼如下所示:

# -*- coding: utf-8 -*-
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('lena.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Sobel運算元
x = cv2.Sobel(grayImage, cv2.CV_16S, 1, 0) #對x求一階導
y = cv2.Sobel(grayImage, cv2.CV_16S, 0, 1) #對y求一階導
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Sobel運算元'] 
images = [lenna_img, Sobel] 
for i in xrange(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

最終輸出結果如下圖所示:

四.Laplacian運算元

拉普拉斯(Laplacian)運算元是n維歐幾里德空間中的一個二階微分運算元,常用於圖像增強領域和邊緣提取。它通過灰度差分計算鄰域內的像素,基本流程是:判斷圖像中心像素灰度值與它周圍其他像素的灰度值,如果中心像素的灰度更高,則提升中心像素的灰度;反之降低中心像素的灰度,從而實現圖像銳化操作。在演算法實現過程中,Laplacian運算元通過對鄰域中心像素的四方向或八方向求梯度,再將梯度相加起來判斷中心像素灰度與鄰域內其他像素灰度的關係,最後通過梯度運算的結果對像素灰度進行調整。

Laplacian運算元分為四鄰域和八鄰域,四鄰域是對鄰域中心像素的四方向求梯度,八鄰域是對八方向求梯度。其中,四鄰域模板如公式所示:

通過模板可以發現,當鄰域內像素灰度相同時,模板的捲積運算結果為0;當中心像素灰度高於鄰域內其他像素的平均灰度時,模板的捲積運算結果為正數;當中心像素的灰度低於鄰域內其他像素的平均灰度時,模板的捲積為負數。對捲積運算的結果用適當的衰弱因數處理並加在原中心像素上,就可以實現圖像的銳化處理。

Laplacian運算元的八鄰域模板如下:

Python和OpenCV將Laplacian運算元封裝在Laplacian()函數中,其函數原型如下所示:

dst = Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])

  • src表示輸入圖像
  • dst表示輸出的邊緣圖,其大小和通道數與輸入圖像相同
  • ddepth表示目標圖像所需的深度
  • ksize表示用於計算二階導數的濾波器的孔徑大小,其值必須是正數和奇數,且預設值為1,更多詳細信息查閱getDerivKernels
  • scale表示計算拉普拉斯運算元值的可選比例因數。預設值為1,更多詳細信息查閱getDerivKernels
  • delta表示將結果存入目標圖像之前,添加到結果中的可選增量值,預設值為0
  • borderType表示邊框模式,更多詳細信息查閱BorderTypes

註意,Laplacian運算元其實主要是利用Sobel運算元的運算,通過加上Sobel運算元運算出的圖像x方向和y方向上的導數,得到輸入圖像的圖像銳化結果。同時,在進行Laplacian運算元處理之後,還需要調用convertScaleAbs()函數計算絕對值,並將圖像轉換為8點陣圖進行顯示。

當ksize=1時,Laplacian()函數採用3×3的孔徑(四鄰域模板)進行變換處理。下麵的代碼是採用ksize=3的Laplacian運算元進行圖像銳化處理,其代碼如下:

# -*- coding: utf-8 -*-
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('lena.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#拉普拉斯演算法
dst = cv2.Laplacian(grayImage, cv2.CV_16S, ksize = 3)
Laplacian = cv2.convertScaleAbs(dst) 
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = [u'原始圖像', u'Laplacian運算元'] 
images = [lenna_img, Laplacian] 
for i in xrange(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

最終輸出結果如下圖所示:

五.總結代碼

邊緣檢測演算法主要是基於圖像強度的一階和二階導數,但導數通常對雜訊很敏感,因此需要採用濾波器來過濾雜訊,並調用圖像增強或閾值化演算法進行處理,最後再進行邊緣檢測。下麵是採用高斯濾波去噪和閾值化處理之後,再進行邊緣檢測的過程,並對比了四種常見的邊緣提取演算法。

# -*- coding: utf-8 -*-
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('lena.png')
lenna_img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#高斯濾波
gaussianBlur = cv2.GaussianBlur(grayImage, (3,3), 0)
#閾值處理
ret, binary = cv2.threshold(gaussianBlur, 127, 255, cv2.THRESH_BINARY)
#Roberts運算元
kernelx = np.array([[-1,0],[0,1]], dtype=int)
kernely = np.array([[0,-1],[1,0]], dtype=int)
x = cv2.filter2D(binary, cv2.CV_16S, kernelx)
y = cv2.filter2D(binary, cv2.CV_16S, kernely)
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Roberts = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#Prewitt運算元
kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]], dtype=int)
kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]], dtype=int)
x = cv2.filter2D(binary, cv2.CV_16S, kernelx)
y = cv2.filter2D(binary, cv2.CV_16S, kernely)
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0)
#Sobel運算元
x = cv2.Sobel(binary, cv2.CV_16S, 1, 0)
y = cv2.Sobel(binary, cv2.CV_16S, 0, 1) 
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Sobel = cv2.addWeighted(absX, 0.5, absY, 0.5, 0)
#拉普拉斯演算法
dst = cv2.Laplacian(binary, cv2.CV_16S, ksize = 3)
Laplacian = cv2.convertScaleAbs(dst) 
#效果圖
titles = ['Source Image', 'Binary Image', 'Roberts Image',
 'Prewitt Image','Sobel Image', 'Laplacian Image'] 
images = [lenna_img, binary, Roberts, Prewitt, Sobel, Laplacian] 
for i in np.arange(6): 
 plt.subplot(2,3,i+1),plt.imshow(images[i],'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show() 

輸出結果如圖所示。其中,Laplacian運算元對雜訊比較敏感,由於其演算法可能會出現雙像素邊界,常用來判斷邊緣像素位於圖像的明區或暗區,很少用於邊緣檢測;Robert運算元對陡峭的低雜訊圖像效果較好,尤其是邊緣正負45度較多的圖像,但定位準確率較差;Prewitt運算元對灰度漸變的圖像邊緣提取效果較好,而沒有考慮相鄰點的距離遠近對當前像素點的影響;Sobel運算元考慮了綜合因素,對雜訊較多的圖像處理效果更好。

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 網路編程 筆記目錄:(https://www.cnblogs.com/wenjie2000/p/16378441.html) 網路基礎 網路通信 概念:兩台設備之間通過網路實現數據傳輸 網路通信:將數據通過網路從一臺設備傳輸到另一臺設備 java.net包下提供了一系列的類或介面,供程式員使用,完成 ...
  • 7.線程的應用03 7.4坦克大戰5.0版 增加功能: 我方坦克在發射的子彈消亡之後,才能發射新的子彈==>拓展:發射多顆子彈怎麼辦,控制一次最多只能發射5顆子彈 讓敵人坦克發射的子彈消亡之後,可以再發射子彈 當地人的坦克擊中我方坦克之後,我方坦克小時,並出現爆炸效果 7.4.1功能1plus:我方 ...
  • 一、什麼是配置之屬性優化 在解答這個問題之前我們應該先明白MyBatis的配置有哪些? 官方文檔中文網:配置_MyBatis中文網。 我們還是直接看官方文檔中給出的內容: MyBatis 的配置文件包含了會深深影響 MyBatis 行為的設置和屬性信息。 配置文檔的頂層結構如下: configura ...
  • 作者:Richard_Yi 來源:juejin.cn/post/6844904056230690824 前言 本章的內容主要是想探討我們在進行Spring 開發過程當中,關於依賴註入的幾個知識點。感興趣的讀者可以先看下以下問題: @Autowired, @Resource, @Inject 三個註解 ...
  • 當我們碰到諸如需要求階乘或斐波那契數列的問題時,使用普通的迴圈往往比較麻煩,但如果我們使用遞歸時,會簡單許多,起到事半功倍的效果。這篇文章主要和大家分享一些和遞歸有關的經典案例,結合一些資料談一下個人的理解,也藉此加深自己對遞歸的理解和掌握一些遞歸基礎的用法。 一、遞歸的簡介 1、遞歸的百度百科定義 ...
  • Smartbi操作 繪製報表 實現需求 在需要向資料庫中查詢一些欄位並繪製成一個Excel表格時,可以不需要經過後臺寫代碼,直接通過在Smartbi中寫SQL語句查詢資料庫,拿到數據填充到準備好的Excel模板中。 前期準備 安裝Smartbi插件(需要office)安裝好後Excel中會有相應的S ...
  • 前言 😋 大家早好、午好、晚好吖~ 知識點: 爬蟲基本流程 requests 發送請求 re 正則表達式 json 結構化數據解析 開發環境: python 3.8: 解釋器 pycharm: 代碼編輯器 requests 發送請求 pyecharts 繪製圖表 pandas 讀取數據 實現代碼: ...
  • 本文介紹 docker 環境下安裝並單機運行 Nacos2,使用 docker 環境下的 MySQL 8 存儲數據。 1 拉取鏡像 1.1 創建目錄 在硬碟上創建 nacos 的有關目錄: mkdir -p /Users/yygnb/dockerMe/nacos/conf /Users/yygnb/ ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...