Python從0到1丨細說圖像增強及運算

来源:https://www.cnblogs.com/huaweiyun/archive/2023/01/04/17024867.html
-Advertisement-
Play Games

摘要:本文主要講解常見的圖像銳化和邊緣檢測方法,即Roberts運算元和Prewitt運算元。 本文分享自華為雲社區《[Python從零到壹] 五十七.圖像增強及運算篇之圖像銳化Roberts、Prewitt運算元實現邊緣檢測》,作者: eastmount。 一.圖像銳化 由於收集圖像數據的器件或傳輸圖像 ...


摘要:本文主要講解常見的圖像銳化和邊緣檢測方法,即Roberts運算元和Prewitt運算元。

本文分享自華為雲社區《[Python從零到壹] 五十七.圖像增強及運算篇之圖像銳化Roberts、Prewitt運算元實現邊緣檢測》,作者: eastmount。

一.圖像銳化

由於收集圖像數據的器件或傳輸圖像的通道存在一些質量缺陷,或者受其他外界因素的影響,使得圖像存在模糊和有雜訊的情況,從而影響到圖像識別工作的開展。一般來說,圖像的能量主要集中在其低頻部分,雜訊所在的頻段主要在高頻段,同時圖像邊緣信息主要集中在其高頻部分。這將導致原始圖像在平滑處理之後,圖像邊緣和圖像輪廓模糊的情況出現。為了減少這類不利效果的影響,就需要利用圖像銳化技術,使圖像的邊緣變得清晰[1]。

圖像銳化處理的目的是為了使圖像的邊緣、輪廓線以及圖像的細節變得清晰,經過平滑的圖像變得模糊的根本原因是圖像受到了平均或積分運算,因此可以對其進行逆運算,從而使圖像變得清晰。微分運算是求信號的變化率,具有較強高頻分量作用。從頻率域來考慮,圖像模糊的實質是因為其高頻分量被衰減,因此可以用高通濾波器來使圖像清晰。但要註意能夠進行銳化處理的圖像必須有較高的性噪比,否則銳化後圖像性噪比反而更低,從而使得雜訊增加比信號還要多,因此一般是先去除或減輕雜訊後再進行銳化處理。這時需要開展圖像銳化和邊緣檢測處理,加強原圖像的高頻部分,銳化突出圖像的邊緣細節,改善圖像的對比度,使模糊的圖像變得更清晰。

圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。通常使用灰度差分法對圖像的邊緣、輪廓進行處理,將其凸顯。圖像銳化的方法分為高通濾波和空域微分法,本章主要介紹Robert運算元、Prewitt運算元、Sobel運算元、Laplacian運算元、Scharr運算元等[2-3]。

1.一階微分運算元

一階微分運算元一般藉助空域微分運算元通過捲積完成,但實際上數字圖像處理中求導是利用差分近似微分來進行的。梯度對應一階導數,梯度運算元是一階導數運算元。對一個連續函數f(x,y),它在位置(x,y)梯度可表示為一個矢量:

梯度的模值為公式(2)所示。

梯度的方向在最大變化率方向上,梯度方向如公式(3)所示。

對於數字圖像,導數可以用差分來近似,則梯度可以表示為:

在實際中常用區域模板捲積來近似計算,對水平方向和垂直方向各用一個模板,再通過兩個模板組合起來構成一個梯度運算元。根據模板的大小,其中元素值的不同,可以提出多種模板,構成不同的檢測運算元,後文中將對各種運算元進行詳細介紹。

由梯度的計算可知,在圖像灰度變化較大的邊沿區域其梯度值大,在灰度變化平緩的區域梯度值較小,而在灰度均勻的區域其梯度值為零。根據得到的梯度值來返回像素值,如將梯度值大的像素設置成白色,梯度值小的設置為黑色,這樣就可以將邊緣提取出來了,或者是加強梯度值大的像素灰度值就可以突出細節了達到了銳化的目的。

2.二階微分運算元

二階微分運算元是求圖像灰度變化導數的導數,對圖像中灰度變化強烈的地方很敏感,從而可以突出圖像的紋理結構。當圖像灰度變化劇烈時,進行一階微分則會形成一個局部的極值,對圖像進行二階微分則會形成一個過零點,並且在零點兩邊產生一個波峰和波谷,設定一個閾值檢測到這個過零點,如圖1所示。

這樣做的好處有兩個,一是二階微分關心的是圖像灰度的突變而不強調灰度緩慢變化的區域,對邊緣的定位能力更強;二是Laplacian運算元是各向同性的,即具有旋轉不變性,在一階微分里,是用|dx|+|dy|來近似一個點的梯度,當圖像旋轉一個角度時,這個值就會變化,但對於Laplacian運算元來說,不管圖像怎麼旋轉,得到的相應值是一樣的。

想要確定過零點要以p為中心的一個3×3領域,p點為過零點意味著至少有兩個相對的領域像素的符號不同。有四種要檢測的情況:左/右、上/下、兩個對角。如果g(x,y)的值與一個閾值比較,那麼不僅要求相對領域的符號不同,數值差的絕對值也要超過這個閾值,這時p稱為一個過零點像素。二階微分的定義為:

二階微分在恆定灰度區域的微分值為零,在灰度臺階或斜坡起點處微分值非零,沿著斜坡的微分值為零。與一階微分運算元相比較,一階微分運算元獲得的邊界是比較粗略的邊界,反映的邊界信息較少,但是所反映的邊界比較清晰;二階微分運算元獲得的邊界是比較細緻的邊界,反映的邊界信息包括了許多的細節信息,但是所反映的邊界不是太清晰。

二.Roberts運算元

Roberts運算元又稱為交叉微分演算法,它是基於交叉差分的梯度演算法,通過局部差分計算檢測邊緣線條。常用來處理具有陡峭的低雜訊圖像,當圖像邊緣接近於正45度或負45度時,該演算法處理效果更理想,其缺點是對邊緣的定位不太準確,提取的邊緣線條較粗。

Roberts運算元的模板分為水平方向和垂直方向,如公式(6)所示,從其模板可以看出,Roberts運算元能較好的增強正負45度的圖像邊緣[4]。

如公式(7)所示,分別表示圖像的水平方向和垂直方向的計算公式。

Roberts運算元像素的最終計算公式如下:

在Python中,Roberts運算元主要通過Numpy定義模板,再調用OpenCV的filter2D()函數實現邊緣提取[3]。該函數主要是利用內核實現對圖像的捲積運算,其函數原型如下所示:

  • dst = filter2D(src, ddepth, kernel[, dst[, anchor[, delta[, borderType]]]])
    – src表示輸入圖像
    – dst表示輸出的邊緣圖,其大小和通道數與輸入圖像相同
    – ddepth表示目標圖像所需的深度
    – kernel表示捲積核,一個單通道浮點型矩陣
    – anchor表示內核的基準點,其預設值為(-1,-1),位於中心位置
    – delta表示在儲存目標圖像前可選的添加到像素的值,預設值為0
    – borderType表示邊框模式

在進行Roberts運算元處理之後,還需要調用convertScaleAbs()函數計算絕對值,並將圖像轉換為8點陣圖進行顯示。其演算法原型如下:

  • dst = convertScaleAbs(src[, dst[, alpha[, beta]]])
    – src表示原數組
    – dst表示輸出數組,深度為8位
    – alpha表示比例因數
    – beta表示原數組元素按比例縮放後添加的值

最後調用addWeighted()函數計算水平方向和垂直方向的Roberts運算元。其運行代碼如下:

# -*- coding: utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('luo.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Roberts運算元
kernelx = np.array([[-1,0],[0,1]], dtype=int)
kernely = np.array([[0,-1],[1,0]], dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8 
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Roberts = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = ['原始圖像', 'Roberts運算元'] 
images = [lenna_img, Roberts] 
for i in range(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

其運行結果如圖2所示,左邊為原始圖像,右邊為Roberts運算元圖像銳化提取的邊緣輪廓。

三.Prewitt運算元

Prewitt是一種圖像邊緣檢測的微分運算元,其原理是利用特定區域內像素灰度值產生的差分實現邊緣檢測。由於Prewitt運算元採用3×3模板對區域內的像素值進行計算,而Robert運算元的模板為2×2,故Prewitt運算元的邊緣檢測結果在水平方向和垂直方向均比Robert運算元更加明顯。Prewitt運算元適合用來識別雜訊較多、灰度漸變的圖像,其計算公式如下所示。

具體的水平和垂直方向計算公式如下所示:

Prewitt運算元像素的最終計算如公式(11)所示。

在Python中,Prewitt運算元的實現過程與Roberts運算元比較相似。通過Numpy定義模板,再調用OpenCV的filter2D()函數實現對圖像的捲積運算,最終通過convertScaleAbs()和addWeighted()函數實現邊緣提取,代碼如下所示:

# -*- coding: utf-8 -*-
# By:Eastmount
import cv2  
import numpy as np  
import matplotlib.pyplot as plt
#讀取圖像
img = cv2.imread('luo.png')
lenna_img = cv2.cvtColor(img,cv2.COLOR_BGR2RGB)
#灰度化處理圖像
grayImage = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
#Prewitt運算元
kernelx = np.array([[1,1,1],[0,0,0],[-1,-1,-1]],dtype=int)
kernely = np.array([[-1,0,1],[-1,0,1],[-1,0,1]],dtype=int)
x = cv2.filter2D(grayImage, cv2.CV_16S, kernelx)
y = cv2.filter2D(grayImage, cv2.CV_16S, kernely)
#轉uint8
absX = cv2.convertScaleAbs(x) 
absY = cv2.convertScaleAbs(y) 
Prewitt = cv2.addWeighted(absX,0.5,absY,0.5,0)
#用來正常顯示中文標簽
plt.rcParams['font.sans-serif']=['SimHei']
#顯示圖形
titles = ['原始圖像', 'Prewitt運算元'] 
images = [lenna_img, Prewitt] 
for i in range(2): 
 plt.subplot(1,2,i+1), plt.imshow(images[i], 'gray') 
 plt.title(titles[i]) 
 plt.xticks([]),plt.yticks([]) 
plt.show()

最終運行結果如圖3所示,左邊為原始圖像,右邊為Prewitt運算元圖像銳化提取的邊緣輪廓,其效果圖的邊緣檢測結果在水平方向和垂直方向均比Robert運算元更加明顯。

四.總結

本文主要介紹圖像銳化和邊緣檢測知識,詳細講解了Roberts運算元和Prewitt運算元,並通過小珞珞圖像進行邊緣輪廓提取。圖像銳化和邊緣提取技術可以消除圖像中的雜訊,提取圖像信息中用來表徵圖像的一些變數,為圖像識別提供基礎。

 

點擊關註,第一時間瞭解華為雲新鮮技術~


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 簡介 開發板:EGO1 開發環境:Windows10 + Xilinx Vivado 2020 數字邏輯大作業題目 7: 乒乓球比賽模擬機的設計 乒乓球比賽模擬機用發光二極體(LED)模擬乒乓球運動軌跡,是由甲乙雙方參賽,加上裁判的三人游戲(也可以不用裁判)。 管腳約束代碼: 點擊查看代碼 set_ ...
  • 拋出問題 求任意一個字元串的全排列組合,例如a='123',輸出 123,132,213,231,312,321。(暫時假定字元串沒有重覆) 解決方案 目前有兩種解決的方法 方法一: def str_sort(s=''): if len(s) <= 1: return [s] str_list = ...
  • 一、numpy簡介 numpy官方文檔:https://docs.scipy.org/doc/numpy/reference/?v=20190307135750 numpy是Python的一種開源的數值計算擴展庫。這種庫可用來存儲和處理大型numpy數組,比Python自身的嵌套列表結構要高效的多( ...
  • Go是一種非常受歡迎的編程語言,它具有內置的併發支持和眾多其他優秀的特性。在眾多現代語言中,Go在基本語言設計方面格外出眾。 首先,Go是一種非常簡潔的語言,它的簡潔性使其與像Lua這樣的簡單語言相似。Go設計時十分註重簡潔主義。 其次,Go非常重視語言的穩定性,與許多其他語言形成了鮮明的對比。Go ...
  • 我是車轍,我的掘金小冊《SkyWalking:應用監控和鏈路跟蹤》已經上線啦,這是我的第一本電子書,歡迎大家訂閱。 大家好,我是車轍。在完成小冊後的一段時間,我突然想開發一款個人H5產品。在起初有這樣想法的時候,內心其實還是有不少糾結的。 大家都知道,雖然我是電腦專業,但我從畢業到現在工作4年時間 ...
  • 通過學習C++11移動構造函數我們知道,C++11 標準中藉助右值引用可以為指定類添加移動構造函數,這樣當使用該類的右值對象(可以理解為臨時對象)初始化同類對象時,編譯器會優先選擇移動構造函數。 需要註意,移動構造函數的調用時機是:用同類的右值對象初始化新對象。那麼,用當前類的左值對象(有名稱,能獲 ...
  • Spring Boot常見問題 昔日齷齪不足誇,今朝放蕩思無涯。 1、什麼是 Spring Boot? Spring Boot 是 Spring 開源組織下的子項目,是 Spring 組件一站式解決方案。 主要是簡化了使用Spring 的難度,簡省了繁重的配置,提供了各種啟動器,使開發者能快速上手。 ...
  • 現在的年輕人都開始每天保溫杯里泡枸杞,這怎麼能行呢? 想要每天過的好,美女必然少不了,每天看美女,只為了愉悅心情,心情好了,才長壽。 於是懷揣著愉悅心情的想法,我開始製作GIF動圖生成器,想要用Python來做成美女壁紙,行動起來。 這個小工具製作的目的是為了將多張圖片組合後生成一張動態的GIF圖片 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...