首先,我們來開一下電腦是如何檢測邊緣的。以灰度圖像為例,它的理論基礎是這樣的,如果出現一個邊緣,那麼圖像的灰度就會有一定的變化,為了方便假設由黑漸變為白代表一個邊界,那麼對其灰度分析,在邊緣的灰度函數就是一個一次函數y=kx,對其求一階導數就是其斜率k,就是說邊緣的一階導數是一個常數,而由於非邊緣 ...
首先,我們來開一下電腦是如何檢測邊緣的。以灰度圖像為例,它的理論基礎是這樣的,如果出現一個邊緣,那麼圖像的灰度就會有一定的變化,為了方便假設由黑漸變為白代表一個邊界,那麼對其灰度分析,在邊緣的灰度函數就是一個一次函數y=kx,對其求一階導數就是其斜率k,就是說邊緣的一階導數是一個常數,而由於非邊緣的一階導數為零,這樣通過求一階導數就能初步判斷圖像的邊緣了。通常是X方向和Y方向的導數,也就是梯度。理論上電腦就是通過這種方式來獲得圖像的邊緣。
但是,具體應用到圖像中你會發現這個導數是求不了的,因為沒一個準確的函數讓你去求導,而且電腦在求解析解要比求數值解麻煩得多,所以就想到了一種替代的方式來求導數。就是用一個3×3的視窗來對圖像進行近似求導。拿對X方向求導為例,某一點的導數為第三列的元素之和減去第一列元素之和,這樣就求得了某一點的近似導數。其實也很好理解為什麼它就近似代表導數,導數就代表一個變化率,從第一列變為第三列,灰度值相減,當然就是一個變化率了。這就是所謂的Prewitt運算元。這樣近似X方嚮導數就求出來了。Y方嚮導數與X方嚮導數求法相似,只不過是用第三行元素之和減去第一行元素之和。X方向和Y方嚮導數有了,那麼梯度也就出來了。這樣就可以找出一幅圖中的邊緣了。
還有一個問題,由於求的是3×3中心點的導數,所以給第二列加了一個權重,它的權重為2,第一列和第三列的權重為1,好了,這就是Sobel運算元了。相比Prewitt運算元,Sobel的抗噪能力更強。如圖所示:
這樣,中心點的Y方嚮導數就求出來了。
舉個例子吧。X點以Sobel方式求導數ΔX=1×50+2×30+1×50-(1×50+2×30+1×50)=0。這樣可以看出這個點不是邊界。
好了,瞭解了基本理論之後,我們看看OpenCv下的Sobel函數吧,void cvSobel( const CvArr* src, CvArr* dst, int xorder, int yorder, int aperture_size=3 );src:輸入圖像;dst:輸出圖像;xorder:x 方向上的差分階數;yorder:y 方向上的差分階數;aperture_size 擴展 Sobel 核的大小(既視窗階數),必須是 1(註意這是一個3×1或1×3向量而不是一個方陣), 3, 5 或 7。
其實,這裡是問題的,因為以Sobel方式求完導數後會有負值,還有會大於255的值而你建的Sobel的圖像是 IPL_DEPTH_8U,也就是8位無符號數,所以Sobel建立的圖像位數不夠,要16位有符號的,也就是 IPL_DEPTH_16S。把建立圖像這句改為
sobel=cvCreateImage(cvGetSize(frame),IPL_DEPTH_16S,1);運行,發現不報錯了,但是Sobel圖像顯示不出來,這是什麼原因呢?原來圖像顯示是以8位無符號顯示的,現在是16位有符號,當然顯示會出問題了。所以還要將Sobel轉為8位無符號。OpenCv里提供了一個函數,就是cvConvertScaleAbs( const CvArr* src, CvArr* dst, double scale=1, double shift=0 );src:源圖像;dst:目標圖像;scale:轉化前乘的繫數;shift轉化前加的繫數。這樣新建一個無符號圖像再轉換就可以實現了。
IplImage *sobel8u=cvCreateImage(cvGetSize(sobel),IPL_DEPTH_8U,1);
再在顯示圖像前加上cvConvertScaleAbs(sobel,sobel8u,1,0);這樣就可以看到cvSobel的效果了。可以看X方向或Y方向求導是什麼效果。
代碼如下
1 //Sobel邊緣檢測的程式 2 #include "cv.h" 3 #include "highgui.h" 4 int main( int argc , char** argv) 5 { 6 //以灰度圖格式載入圖像或者用函數cvCvtColor(frame,gray,CV_BGR2GRAY);轉為灰度 7 IplImage* src = cvLoadImage(argv[1],CV_LOAD_IMAGE_GRAYSCALE); 8 //以sobel方式求完導之後會有負數,會有大於255的值,故建立圖像的數據格式 9 //要為IPL_DEPTH_16S 10 IplImage* dst1 = cvCreateImage(cvGetSize(src),IPL_DEPTH_16S,1); 11 IplImage* dst2 = cvCreateImage(cvGetSize(src),IPL_DEPTH_16S,1); 12 IplImage* dst18u = cvCreateImage(cvGetSize(src),IPL_DEPTH_8U,1); 13 IplImage* dst28u = cvCreateImage(cvGetSize(src),IPL_DEPTH_8U,1); 14 //逼近x方向上一階微分的Sobel運算元的效果 15 cvSobel( 16 src, 17 dst1, 18 1, 19 0, 20 3); 21 //逼近y方向上一階微分的Sobel運算元的效果 22 cvSobel( 23 src, 24 dst2, 25 0, 26 1, 27 3); 28 //圖像是以8位無符號顯示的,故要把輸出圖像的數據格式轉化為IPL_DEPTH_8U 29 cvConvertScaleAbs(dst1,dst18u,1,0); 30 cvConvertScaleAbs(dst2,dst28u,1,0); 31 cvNamedWindow("src",1); 32 cvNamedWindow("dst1",1); 33 cvNamedWindow("dst2",1); 34 cvShowImage("src",src); 35 cvShowImage("dst1",dst18u); 36 cvShowImage("dst2",dst28u); 37 cvWaitKey(0); 38 cvReleaseImage(&src); 39 cvReleaseImage(&dst1); 40 cvReleaseImage(&dst2); 41 cvReleaseImage(&dst18u); 42 cvReleaseImage(&dst28u); 43 cvDestroyWindow("src"); 44 cvDestroyWindow("dst1"); 45 cvDestroyWindow("dst2"); 46 return 0; 47 }