摘要:這篇文章詳細介紹了頂帽運算和底帽運算,它們將為後續的圖像分割和圖像識別提供有效支撐。 本文分享自華為雲社區《[Python從零到壹] 四十九.圖像增強及運算篇之頂帽運算和底帽運算》,作者:eastmount。 數學形態學(Mathematical Morphology)是一種應用於圖像處理和模 ...
摘要:這篇文章詳細介紹了頂帽運算和底帽運算,它們將為後續的圖像分割和圖像識別提供有效支撐。
本文分享自華為雲社區《[Python從零到壹] 四十九.圖像增強及運算篇之頂帽運算和底帽運算》,作者:eastmount。
數學形態學(Mathematical Morphology)是一種應用於圖像處理和模式識別領域的新方法。數學形態學(也稱圖像代數)表示以形態為基礎對圖像進行分析的數學工具,其基本思想是用具有一定形態的結構元素去量度和提取圖像中對應形狀以達到對圖像分析和識別的目的。
一.圖像頂帽運算
圖像頂帽運算(top-hat transformation)又稱為圖像禮帽運算,它是用原始圖像減去圖像開運算後的結果,常用於解決由於光照不均勻圖像分割出錯的問題。其公式定義如下:
圖像頂帽運算是用一個結構元通過開運算從一幅圖像中刪除物體,頂帽運算用於暗背景上的亮物體,它的一個重要用途是校正不均勻光照的影響。其效果圖如圖1所示。
在Python中,圖像頂帽運算主要調用morphologyEx()實現,其中參數cv2.MORPH_TOPHAT表示頂帽處理,函數原型如下:
dst = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)
- src表示原始圖像
- cv2.MORPH_TOPHAT表示圖像頂帽運算
- kernel表示捲積核,可以用numpy.ones()函數構建
假設存在一張光照不均勻的米粒圖像,如圖2所示,我們需要調用圖像頂帽運算解決光照不均勻的問題。
圖像頂帽運算的Python代碼如下所示:
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('test01.png', cv2.IMREAD_UNCHANGED) #設置捲積核 kernel = np.ones((10,10), np.uint8) #圖像頂帽運算 result = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel) #顯示圖像 cv2.imshow("src", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
其運行結果如圖3所示。
下圖展示了“米粒”頂帽運算的效果圖,可以看到頂帽運算後的圖像刪除了大部分非均勻背景,並將米粒與背景分離開來。
為什麼圖像頂帽運算會消除光照不均勻的效果呢?
通常可以利用灰度三維圖來進行解釋該演算法。灰度三維圖主要調用Axes3D包實現,對原圖繪製灰度三維圖的代碼如下:
# -*- coding: utf-8 -*- # By:Eastmount import numpy as np import cv2 as cv import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from matplotlib import cm from matplotlib.ticker import LinearLocator, FormatStrFormatter #讀取圖像 img = cv.imread("test02.png") img = cv.cvtColor(img,cv.COLOR_BGR2GRAY) imgd = np.array(img) #image類轉numpy #準備數據 sp = img.shape h = int(sp[0]) #圖像高度(rows) w = int(sp[1]) #圖像寬度(colums) of image #繪圖初始處理 fig = plt.figure(figsize=(16,12)) ax = fig.gca(projection="3d") x = np.arange(0, w, 1) y = np.arange(0, h, 1) x, y = np.meshgrid(x,y) z = imgd surf = ax.plot_surface(x, y, z, cmap=cm.coolwarm) #自定義z軸 ax.set_zlim(-10, 255) ax.zaxis.set_major_locator(LinearLocator(10)) #設置z軸網格線的疏密 #將z的value字元串轉為float並保留2位小數 ax.zaxis.set_major_formatter(FormatStrFormatter('%.02f')) # 設置坐標軸的label和標題 ax.set_xlabel('x', size=15) ax.set_ylabel('y', size=15) ax.set_zlabel('z', size=15) ax.set_title("surface plot", weight='bold', size=20) #添加右側的色卡條 fig.colorbar(surf, shrink=0.6, aspect=8) plt.show()
運行結果如圖5所示,其中x表示原圖像中的寬度坐標,y表示原圖像中的高度坐標,z表示像素點(x, y)的灰度值。
從圖像中的像素走勢顯示了該圖受各部分光照不均勻的影響,從而造成背景灰度不均現象,其中凹陷對應圖像中灰度值比較小的區域。
通過圖像白帽運算後的圖像灰度三維圖如圖6所示,對應的灰度更集中於10至100區間,由此證明瞭不均勻的背景被大致消除了,有利於後續的閾值分割或圖像分割。
繪製三維圖增加的頂帽運算核心代碼如下:
二.圖像底帽運算
圖像底帽運算(bottom-hat transformation)又稱為圖像黑帽運算,它是用圖像閉運算操作減去原始圖像後的結果,從而獲取圖像內部的小孔或前景色中黑點,也常用於解決由於光照不均勻圖像分割出錯的問題。其公式定義如下:
圖像底帽運算是用一個結構元通過閉運算從一幅圖像中刪除物體,常用於校正不均勻光照的影響。其效果圖如圖8所示。
在Python中,圖像底帽運算主要調用morphologyEx()實現,其中參數cv2.MORPH_BLACKHAT表示底帽或黑帽處理,函數原型如下:
dst = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)
- src表示原始圖像
- cv2.MORPH_BLACKHAT表示圖像底帽或黑帽運算
- kernel表示捲積核,可以用numpy.ones()函數構建
Python實現圖像底帽運算的代碼如下所示:
# -*- coding: utf-8 -*- # By:Eastmount import cv2 import numpy as np #讀取圖片 src = cv2.imread('test02.png', cv2.IMREAD_UNCHANGED) #設置捲積核 kernel = np.ones((10, 10), np.uint8) #圖像黑帽運算 result = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel) #顯示圖像 cv2.imshow("src", src) cv2.imshow("result", result) #等待顯示 cv2.waitKey(0) cv2.destroyAllWindows()
其運行結果如圖9所示:
三.總結
該系列主要講解了圖像數學形態學知識,結合原理和代碼詳細介紹了圖像腐蝕、圖像膨脹、圖像開運算和閉運算、圖像頂帽運算和圖像底帽運算等操作。這篇文章詳細介紹了頂帽運算和底帽運算,它們將為後續的圖像分割和圖像識別提供有效支撐。
參考文獻:
- [1]岡薩雷斯著,阮秋琦譯. 數字圖像處理(第3版)[M]. 北京:電子工業出版社,2013.
- [2]阮秋琦. 數字圖像處理學(第3版)[M]. 北京:電子工業出版社,2008.
- [3]毛星雲,冷雪飛. OpenCV3編程入門[M]. 北京:電子工業出版社,2015.
- [4]Eastmount. [Python圖像處理] 八.圖像腐蝕與圖像膨脹[EB/OL]. (2018-10-31). https://blog.csdn.net/Eastmount/article/details/83581277.