1. 圖像梯度
首先我們來看看什么是圖像梯度:圖像梯度可以把圖像看作二維離散函數(shù),圖像梯度就是這個(gè)二維函數(shù)的求導(dǎo),圖像邊緣一般都是通過對(duì)圖像進(jìn)行梯度運(yùn)算來實(shí)現(xiàn)的
在圖像梯度這一部分我們會(huì)接觸查找圖像梯度、邊緣等,這一部分涉及了三個(gè)主要函數(shù):cv.Sobel(),cv.Scharr(),cv.Laplacian(),相對(duì)應(yīng)的,OpenCV提供的三種類型的梯度濾波器(高通濾波器),即Sobel、Scharr和Laplacian
在上一部分2D卷積即圖像過濾內(nèi)容中我們說了低通濾波器(LPF)與高通濾波器(HPF)的主要應(yīng)用方向,LPF用于消除噪聲,HPF用于找到邊緣,在圖像梯度這一部分我們使用三個(gè)高通濾波器來找到圖像中的邊緣
1.1 Sobel和Scharr算子
Sobel算子是高斯平滑與微分操作的結(jié)合體,所以其抗噪聲能力很好,我們可以設(shè)定求導(dǎo)方向(xorder或yorder),還可以設(shè)定使用的卷積核大小ksize
當(dāng)我們?cè)O(shè)定的卷積核的大小為-1時(shí),會(huì)默認(rèn)使用3x3的Scharr濾波器,它的效果比3x3的Sobel效果更好,并且處理速度相同,所以在使用3x3Sobel濾波器時(shí)應(yīng)使用Scharr濾波器代替
從上面所說的概念我們可以理解為:使用3x3內(nèi)核的Sobel濾波器并不等于Scharr濾波器,但Scharr濾波器是一種3x3內(nèi)核的高效濾波器,若我們需要3x3內(nèi)核的Sobel濾波器,那我們建議使用Scharr濾波器,即在使用Sobel濾波器時(shí)設(shè)定其內(nèi)核大小為-1
了解了Sobel和Scharr高通濾波器的內(nèi)核,我們?cè)賮砜纯碿v.Sobel()和cv.Scharr()函數(shù)的參數(shù),cv.Sobel(img,cv.CV_64F,dx,dy,ksize)函數(shù)需要傳遞的參數(shù)分別是原圖像,cv.CV_64F是圖像深度,一般寫作-1就可以了,dx和dy分別表示x軸方向和y軸方向的算子,ksize就是內(nèi)核
而Scharr高通濾波器是3x3的內(nèi)核,所以cv.Scharr()的參數(shù)與cv.Sobel()函數(shù)對(duì)比少傳遞一個(gè)ksize參數(shù)即可
1.2 Laplacian算子
Laplace其實(shí)利用Sobel算子的運(yùn)算,它通過Sobel算子運(yùn)算出圖像在x方向和y方向的導(dǎo)數(shù),得出拉普拉斯變換結(jié)果,它就像Sobel算子的升級(jí)版
下面我們上倆例子方便大家理解
import numpy as np import cv2 as cv from matplotlib import pyplot as plt img = cv.imread(r'E:image est06.png', 0) laplacian = cv.Laplacian(img, cv.CV_64F) sobelx = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=5) sobely = cv.Sobel(img, cv.CV_64F, 0, 1, ksize=5) plt.subplot(2, 2, 1), plt.imshow(img, cmap='gray') plt.title('Original'), plt.xticks([]), plt.yticks([]) plt.subplot(2, 2, 2), plt.imshow(laplacian, cmap='gray') plt.title('Laplacian'), plt.xticks([]), plt.yticks([]) plt.subplot(2, 2, 3), plt.imshow(sobelx, cmap='gray') plt.title('Sobel X'), plt.xticks([]), plt.yticks([]) plt.subplot(2, 2, 4), plt.imshow(sobely, cmap='gray') plt.title('Sobel Y'), plt.xticks([]), plt.yticks([]) plt.show()
注意:在上面的實(shí)例中,輸出的數(shù)據(jù)類型為cv.CV_8U或np.uint8,問題就出在這里,黑色到白色的過渡被視為正斜率(具有正值),而白色到黑色的過渡被視為負(fù)斜率(具有負(fù)值),當(dāng)我們將數(shù)據(jù)轉(zhuǎn)換為np.uint8時(shí),所有負(fù)斜率均設(shè)為零,意思就是我們會(huì)錯(cuò)過這一邊緣信息
當(dāng)要檢測(cè)兩個(gè)邊緣,更好的選擇是將輸出數(shù)據(jù)類型保留為更高的形式,取其絕對(duì)值然后再轉(zhuǎn)回cv.CV_8U
這是一個(gè)必較重要且不容忽略的問題,所以我們?cè)偻ㄟ^一個(gè)例子來看看
import numpy as np import cv2 as cv from matplotlib import pyplot as plt img = cv.imread('E:/image/test07.png', 0) sobelx8u = cv.Sobel(img, cv.CV_8U, 1, 0, ksize=5) sobelx64f = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=5) abs_sobel64f = np.absolute(sobelx64f) sobel_8u = np.uint8(abs_sobel64f) plt.subplot(1, 3, 1), plt.imshow(img, cmap='gray') plt.title('Original'), plt.xticks([]), plt.yticks([]) plt.subplot(1, 3, 2), plt.imshow(sobelx8u, cmap='gray') plt.title('Sobel CV_8U'), plt.xticks([]), plt.yticks([]) plt.subplot(1, 3, 3), plt.imshow(sobel_8u, cmap='gray') plt.title('Sobel abs(CV_64F)'), plt.xticks([]), plt.yticks([]) plt.show()
2. Canny邊緣檢測(cè)
Canny Edge Detection是由John F. Canny發(fā)明的一種流行的邊緣檢測(cè)算法,這是一個(gè)多階段,主要分為:高斯濾波、梯度計(jì)算、非極大值抑制和雙閾值檢測(cè)
2.1 多階段的Canny邊緣檢測(cè)算法
高斯濾波(降噪)
由于邊緣檢測(cè)很容易收到圖像中噪聲的影響,因此我們通過Canny邊緣檢測(cè)算法進(jìn)行圖像處理時(shí)第一步是使用5x5高斯濾波器消除圖像中的噪聲
高斯濾波的具體方法是生成一個(gè)高斯模板,使用卷積進(jìn)行時(shí)進(jìn)行時(shí)域?yàn)V波
梯度計(jì)算
使用Sobel核在水平和垂直方向上對(duì)平滑圖像進(jìn)行濾波,以在水平和垂直方向得到一階導(dǎo)數(shù)
非極大值抑制
在獲得梯度大小和方向后,將對(duì)圖像進(jìn)行全面掃描,以去除可能不構(gòu)成邊緣的所有不需要的像素,為此在每個(gè)像素處檢查像素是都是在其梯度方向上附近的局部最大值
點(diǎn)A在邊緣(垂直方向)上。漸變方向垂直于邊緣。點(diǎn)B和C在梯度方向上。因此,將A點(diǎn)與B點(diǎn)和C點(diǎn)進(jìn)行檢查,看是否形成局部最大值。如果是這樣,則考慮將其用于下一階段,否則將其抑制(置為零)。簡而言之,你得到的結(jié)果是帶有“細(xì)邊”的二進(jìn)制圖像
磁滯閾值(雙閾值檢測(cè))
在這個(gè)階段會(huì)確定哪些邊緣是真正的邊緣,為此我們需要提供兩個(gè)閾值minVal和maxVal,強(qiáng)度梯度大于maxVal的任何邊緣必定是邊緣,而小于minVal的任何邊緣必定不是邊緣,如果講他們連接到邊緣像素。則將他們視為邊緣的一部分否則將被丟棄
邊緣A在maxVal上,因此被視為“確定邊緣”,盡管C低于minVal但它連接到A,因此被視為有效便,我們得到了完整的曲線
但是盡管B在minVal上并且與C處于統(tǒng)一區(qū)域,但是它沒有連接到任何確保邊緣,因此它也會(huì)丟棄
注意:我們必須選擇相應(yīng)的minVal和maxVal才能獲取正確的結(jié)果
2.2 OpenCV中的Canny Edge檢測(cè)
OpenCV將Canny邊緣檢測(cè)算法的四個(gè)階段放在了一個(gè)單數(shù)cv.Canny()中,我們只需要去正確使用它就能獲取我們的邊緣檢測(cè)需求
我們看看cv.Canny()這個(gè)函數(shù)的傳參,第一個(gè)參數(shù)是圖像資源,第二、三個(gè)參數(shù)分別是用于磁滯閾值(雙閾值檢測(cè))階段的兩個(gè)閾值minVal和maxVal,第四個(gè)參數(shù)是picture_size,它用于查找圖像漸變的Sobel內(nèi)核的大小,默認(rèn)為3,第五個(gè)參數(shù)是L2gradient,它指定用于查找梯度的方程式,若為True會(huì)使用更精確的公式,若為False則用默認(rèn)
我們通過一個(gè)例子來看看
import numpy as np import cv2 as cv from matplotlib import pyplot as plt img = cv.imread('E:/image/test08.png', 0) edges = cv.Canny(img, 100, 200) plt.subplot(121), plt.imshow(img, cmap='gray') plt.title('Original Image'), plt.xticks([]), plt.yticks([]) plt.subplot(122), plt.imshow(edges, cmap='gray') plt.title('Edge Image'), plt.xticks([]), plt.yticks([]) plt.show()
3. 圖像金字塔
3.1 金字塔理論基礎(chǔ)
在之前我們學(xué)習(xí)的內(nèi)容中,使用的都是像素大小恒定不變的圖像,但是在一些情況下,我們?cè)谔幚韴D像時(shí)不知道我們所需要的物體的具體尺寸(或物體是以什么樣的尺寸出現(xiàn)在圖像中)
在這種情況下我們需要?jiǎng)?chuàng)建一組具有不同分辨率的相同圖像,并在這些圖像中搜索目標(biāo)對(duì)象,這些具有不同像素大小的圖像集就是我們的圖像金字塔
因?yàn)楫?dāng)它們堆疊在底部時(shí),最高分辨率的圖像位于頂部,最低分辨率的圖像位于頂部時(shí),看起來像金字塔
一般來說有兩種金字塔:高斯金字塔和拉普拉斯金字塔
3.1.1 高斯金字塔
高斯金字塔中的較高級(jí)別(低分辨率)是通過先用高斯核對(duì)圖像進(jìn)行卷積再刪除偶數(shù)行和列,然后較高級(jí)別的每個(gè)像素由基礎(chǔ)級(jí)別的5個(gè)像素的貢獻(xiàn)與高斯權(quán)重形成,通過這樣的操作M x N的圖像變?yōu)镸/2 x N/2圖像,因此面積減少到原來的四分之一,我們稱之為Octave,當(dāng)我們的金字塔越靠上時(shí)這種模式就越繼續(xù)。
向下采樣方法:1.對(duì)圖像進(jìn)行高斯內(nèi)核卷積;2.將所有偶數(shù)行和列去除
圖像的較低級(jí)別(高分辨率)是通過較高級(jí)別(低分辨率)在每個(gè)維度上擴(kuò)大為原來的兩倍,新增的行和列(偶數(shù)行和列)以0填充,然后使用指定的濾波器進(jìn)行卷積去估計(jì)丟失像素的近似值。
向上采樣方法:1.將圖像在每個(gè)維度擴(kuò)大到原來的兩倍,以新增的行和列以0填充;2.使用原先同樣的內(nèi)核(x4)與方法后的圖像卷積,獲得新增像素的近似值在縮放過程中已經(jīng)丟失了一些信息,如果想在縮放過程中減少信息的丟失,就需要用到拉普拉斯金字塔
cv.pyrUp(src)函數(shù):其中只需要傳入一個(gè)參數(shù),代表圖像資源,用于對(duì)圖像做向上采樣
cv.pyrDown()函數(shù):參數(shù)傳遞與cv.pyrUp()一致,用于對(duì)圖像做向下采樣,通常也可以做圖像模糊化處理
3.1.2 拉普拉斯金字塔
拉普拉斯金字塔由高斯金字塔形成,沒有專用的功能,拉普拉斯金字塔圖像僅表示邊緣圖像,它的大多數(shù)元素為0,它們通常用于圖像壓縮
拉普拉斯金字塔的層由高斯金字塔的層與高斯金字塔的高層的擴(kuò)展版本之間的差形成
我們通過一個(gè)例子來展示拉普拉斯金字塔
import numpy as np import cv2 as cv from matplotlib import pyplot as plt img = cv.imread(r'E:image est06.png', ) loser_reso = cv.pyrDown(img) higher_reso = cv.pyrUp(loser_reso) lapPyr = img - higher_reso test = higher_reso loser_reso2 = cv.pyrDown(test) higher_reso2 = cv.pyrUp(loser_reso2) lapPyr2 = test - higher_reso2 cv.imshow('lapPyr', lapPyr) cv.imshow('lapPyr2', lapPyr2) cv.waitKey(0) cv.destroyAllWindows()
3.2 使用圖像金字塔進(jìn)制圖像融合
圖像金字塔的一個(gè)應(yīng)用是圖像融合,如果進(jìn)行簡單的圖像拼接,我們將兩個(gè)圖片堆疊在一起,會(huì)因?yàn)閳D像之間的不連續(xù)性看起來效果不好,在這種情況下金字塔混合圖像可以無縫混合,而不會(huì)在圖像中保留大量數(shù)據(jù)
想要達(dá)到圖像混合的效果,需要完成以下步驟:
加載兩個(gè)需要進(jìn)行混合的圖像
查找兩張圖像的高斯金字塔,然后在其高斯金字塔中找到其拉普拉斯金字塔
在每個(gè)拉普拉斯金字塔級(jí)別中加入兩張圖片的各一半
最后從此聯(lián)合圖像金字塔中重建原始圖像
import cv2 as cv import numpy as np, sys A = cv.imread('E:/image/horse.png') B = cv.imread('E:/image/cow.png') # 生成A的高斯金字塔 G = A.copy() gpA = [G] for i in range(6): G = cv.pyrDown(G) gpA.append(G) # 生成B的高斯金字塔 G = B.copy() gpB = [G] for i in range(6): G = cv.pyrDown(G) gpB.append(G) # 生成A的拉普拉斯金字塔 lpA = [gpA[5]] for i in range(5, 0, -1): GE = cv.pyrUp(gpA[i]) L = cv.subtract(gpA[i - 1], GE) lpA.append(L) # 生成B的拉普拉斯金字塔 lpB = [gpB[5]] for i in range(5, 0, -1): GE = cv.pyrUp(gpB[i]) L = cv.subtract(gpB[i - 1], GE) lpB.append(L) # 現(xiàn)在在每個(gè)級(jí)別中添加左右兩半圖像 LS = [] for la, lb in zip(lpA, lpB): rows, cols, dpt = la.shape ls = np.hstack((la[:, 0:cols / 2], lb[:, cols / 2:])) LS.append(ls) # 現(xiàn)在重建 ls_ = LS[0] for i in range(1, 6): ls_ = cv.pyrUp(ls_) ls_ = cv.add(ls_, LS[i]) # 圖像與直接連接的每一半 real = np.hstack((A[:, :cols / 2], B[:, cols / 2:])) cv.imwrite('Pyramid_blending2.jpg', ls_) cv.imwrite('Direct_blending.jpg', real)
編輯:黃飛
-
圖像處理
+關(guān)注
關(guān)注
27文章
1275瀏覽量
56577 -
低通濾波器
+關(guān)注
關(guān)注
14文章
471瀏覽量
47289 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4284瀏覽量
62325 -
OpenCV
+關(guān)注
關(guān)注
29文章
625瀏覽量
41214
原文標(biāo)題:OpenCV中的圖像處理 —— 圖像梯度+Canny邊緣檢測(cè)+圖像金字塔
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論