0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenCV圖像處理之圖像梯度+Canny邊緣檢測(cè)

新機(jī)器視覺 ? 來源:馬士兵AI程序員 ? 2023-11-14 15:54 ? 次閱讀

1. 圖像梯度

首先我們來看看什么是圖像梯度:圖像梯度可以把圖像看作二維離散函數(shù),圖像梯度就是這個(gè)二維函數(shù)的求導(dǎo),圖像邊緣一般都是通過對(duì)圖像進(jìn)行梯度運(yùn)算來實(shí)現(xiàn)的

在圖像梯度這一部分我們會(huì)接觸查找圖像梯度、邊緣等,這一部分涉及了三個(gè)主要函數(shù):cv.Sobel(),cv.Scharr(),cv.Laplacian(),相對(duì)應(yīng)的,OpenCV提供的三種類型的梯度濾波器高通濾波器),即Sobel、Scharr和Laplacian

在上一部分2D卷積即圖像過濾內(nèi)容中我們說了低通濾波器(LPF)與高通濾波器(HPF)的主要應(yīng)用方向,LPF用于消除噪聲,HPF用于找到邊緣,在圖像梯度這一部分我們使用三個(gè)高通濾波器來找到圖像中的邊緣

1.1 Sobel和Scharr算子

Sobel算子是高斯平滑與微分操作的結(jié)合體,所以其抗噪聲能力很好,我們可以設(shè)定求導(dǎo)方向(xorder或yorder),還可以設(shè)定使用的卷積核大小ksize

當(dāng)我們?cè)O(shè)定的卷積核的大小為-1時(shí),會(huì)默認(rèn)使用3x3的Scharr濾波器,它的效果比3x3的Sobel效果更好,并且處理速度相同,所以在使用3x3Sobel濾波器時(shí)應(yīng)使用Scharr濾波器代替

從上面所說的概念我們可以理解為:使用3x3內(nèi)核的Sobel濾波器并不等于Scharr濾波器,但Scharr濾波器是一種3x3內(nèi)核的高效濾波器,若我們需要3x3內(nèi)核的Sobel濾波器,那我們建議使用Scharr濾波器,即在使用Sobel濾波器時(shí)設(shè)定其內(nèi)核大小為-1

了解了Sobel和Scharr高通濾波器的內(nèi)核,我們?cè)賮砜纯碿v.Sobel()和cv.Scharr()函數(shù)的參數(shù),cv.Sobel(img,cv.CV_64F,dx,dy,ksize)函數(shù)需要傳遞的參數(shù)分別是原圖像,cv.CV_64F是圖像深度,一般寫作-1就可以了,dx和dy分別表示x軸方向和y軸方向的算子,ksize就是內(nèi)核

而Scharr高通濾波器是3x3的內(nèi)核,所以cv.Scharr()的參數(shù)與cv.Sobel()函數(shù)對(duì)比少傳遞一個(gè)ksize參數(shù)即可

1.2 Laplacian算子

Laplace其實(shí)利用Sobel算子的運(yùn)算,它通過Sobel算子運(yùn)算出圖像在x方向和y方向的導(dǎo)數(shù),得出拉普拉斯變換結(jié)果,它就像Sobel算子的升級(jí)版

下面我們上倆例子方便大家理解

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread(r'E:image	est06.png', 0)
laplacian = cv.Laplacian(img, cv.CV_64F)
sobelx = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=5)
sobely = cv.Sobel(img, cv.CV_64F, 0, 1, ksize=5)
plt.subplot(2, 2, 1), plt.imshow(img, cmap='gray')
plt.title('Original'), plt.xticks([]), plt.yticks([])
plt.subplot(2, 2, 2), plt.imshow(laplacian, cmap='gray')
plt.title('Laplacian'), plt.xticks([]), plt.yticks([])
plt.subplot(2, 2, 3), plt.imshow(sobelx, cmap='gray')
plt.title('Sobel X'), plt.xticks([]), plt.yticks([])
plt.subplot(2, 2, 4), plt.imshow(sobely, cmap='gray')
plt.title('Sobel Y'), plt.xticks([]), plt.yticks([])
plt.show()

a08eaaea-82a0-11ee-939d-92fbcf53809c.png

注意:在上面的實(shí)例中,輸出的數(shù)據(jù)類型為cv.CV_8U或np.uint8,問題就出在這里,黑色到白色的過渡被視為正斜率(具有正值),而白色到黑色的過渡被視為負(fù)斜率(具有負(fù)值),當(dāng)我們將數(shù)據(jù)轉(zhuǎn)換為np.uint8時(shí),所有負(fù)斜率均設(shè)為零,意思就是我們會(huì)錯(cuò)過這一邊緣信息

當(dāng)要檢測(cè)兩個(gè)邊緣,更好的選擇是將輸出數(shù)據(jù)類型保留為更高的形式,取其絕對(duì)值然后再轉(zhuǎn)回cv.CV_8U

這是一個(gè)必較重要且不容忽略的問題,所以我們?cè)偻ㄟ^一個(gè)例子來看看

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread('E:/image/test07.png', 0)
sobelx8u = cv.Sobel(img, cv.CV_8U, 1, 0, ksize=5)

sobelx64f = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=5)
abs_sobel64f = np.absolute(sobelx64f)
sobel_8u = np.uint8(abs_sobel64f)
plt.subplot(1, 3, 1), plt.imshow(img, cmap='gray')
plt.title('Original'), plt.xticks([]), plt.yticks([])
plt.subplot(1, 3, 2), plt.imshow(sobelx8u, cmap='gray')
plt.title('Sobel CV_8U'), plt.xticks([]), plt.yticks([])
plt.subplot(1, 3, 3), plt.imshow(sobel_8u, cmap='gray')
plt.title('Sobel abs(CV_64F)'), plt.xticks([]), plt.yticks([])
plt.show()

a0b64d16-82a0-11ee-939d-92fbcf53809c.png

2. Canny邊緣檢測(cè)

Canny Edge Detection是由John F. Canny發(fā)明的一種流行的邊緣檢測(cè)算法,這是一個(gè)多階段,主要分為:高斯濾波、梯度計(jì)算、非極大值抑制和雙閾值檢測(cè)

2.1 多階段的Canny邊緣檢測(cè)算法

高斯濾波(降噪)

由于邊緣檢測(cè)很容易收到圖像中噪聲的影響,因此我們通過Canny邊緣檢測(cè)算法進(jìn)行圖像處理時(shí)第一步是使用5x5高斯濾波器消除圖像中的噪聲

高斯濾波的具體方法是生成一個(gè)高斯模板,使用卷積進(jìn)行時(shí)進(jìn)行時(shí)域?yàn)V波

梯度計(jì)算

使用Sobel核在水平和垂直方向上對(duì)平滑圖像進(jìn)行濾波,以在水平和垂直方向得到一階導(dǎo)數(shù)

非極大值抑制

在獲得梯度大小和方向后,將對(duì)圖像進(jìn)行全面掃描,以去除可能不構(gòu)成邊緣的所有不需要的像素,為此在每個(gè)像素處檢查像素是都是在其梯度方向上附近的局部最大值

a0e62fea-82a0-11ee-939d-92fbcf53809c.png

點(diǎn)A在邊緣(垂直方向)上。漸變方向垂直于邊緣。點(diǎn)B和C在梯度方向上。因此,將A點(diǎn)與B點(diǎn)和C點(diǎn)進(jìn)行檢查,看是否形成局部最大值。如果是這樣,則考慮將其用于下一階段,否則將其抑制(置為零)。簡而言之,你得到的結(jié)果是帶有“細(xì)邊”的二進(jìn)制圖像

磁滯閾值(雙閾值檢測(cè))

在這個(gè)階段會(huì)確定哪些邊緣是真正的邊緣,為此我們需要提供兩個(gè)閾值minVal和maxVal,強(qiáng)度梯度大于maxVal的任何邊緣必定是邊緣,而小于minVal的任何邊緣必定不是邊緣,如果講他們連接到邊緣像素。則將他們視為邊緣的一部分否則將被丟棄

邊緣A在maxVal上,因此被視為“確定邊緣”,盡管C低于minVal但它連接到A,因此被視為有效便,我們得到了完整的曲線

但是盡管B在minVal上并且與C處于統(tǒng)一區(qū)域,但是它沒有連接到任何確保邊緣,因此它也會(huì)丟棄

注意:我們必須選擇相應(yīng)的minVal和maxVal才能獲取正確的結(jié)果

2.2 OpenCV中的Canny Edge檢測(cè)

OpenCV將Canny邊緣檢測(cè)算法的四個(gè)階段放在了一個(gè)單數(shù)cv.Canny()中,我們只需要去正確使用它就能獲取我們的邊緣檢測(cè)需求

我們看看cv.Canny()這個(gè)函數(shù)的傳參,第一個(gè)參數(shù)是圖像資源,第二、三個(gè)參數(shù)分別是用于磁滯閾值(雙閾值檢測(cè))階段的兩個(gè)閾值minVal和maxVal,第四個(gè)參數(shù)是picture_size,它用于查找圖像漸變的Sobel內(nèi)核的大小,默認(rèn)為3,第五個(gè)參數(shù)是L2gradient,它指定用于查找梯度的方程式,若為True會(huì)使用更精確的公式,若為False則用默認(rèn)

我們通過一個(gè)例子來看看

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread('E:/image/test08.png', 0)
edges = cv.Canny(img, 100, 200)
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Original Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(edges, cmap='gray')
plt.title('Edge Image'), plt.xticks([]), plt.yticks([])
plt.show()

a1031e34-82a0-11ee-939d-92fbcf53809c.png

3. 圖像金字塔

3.1 金字塔理論基礎(chǔ)

在之前我們學(xué)習(xí)的內(nèi)容中,使用的都是像素大小恒定不變的圖像,但是在一些情況下,我們?cè)谔幚韴D像時(shí)不知道我們所需要的物體的具體尺寸(或物體是以什么樣的尺寸出現(xiàn)在圖像中)

在這種情況下我們需要?jiǎng)?chuàng)建一組具有不同分辨率的相同圖像,并在這些圖像中搜索目標(biāo)對(duì)象,這些具有不同像素大小的圖像集就是我們的圖像金字塔

因?yàn)楫?dāng)它們堆疊在底部時(shí),最高分辨率的圖像位于頂部,最低分辨率的圖像位于頂部時(shí),看起來像金字塔

一般來說有兩種金字塔:高斯金字塔和拉普拉斯金字塔

3.1.1 高斯金字塔

高斯金字塔中的較高級(jí)別(低分辨率)是通過先用高斯核對(duì)圖像進(jìn)行卷積再刪除偶數(shù)行和列,然后較高級(jí)別的每個(gè)像素由基礎(chǔ)級(jí)別的5個(gè)像素的貢獻(xiàn)與高斯權(quán)重形成,通過這樣的操作M x N的圖像變?yōu)镸/2 x N/2圖像,因此面積減少到原來的四分之一,我們稱之為Octave,當(dāng)我們的金字塔越靠上時(shí)這種模式就越繼續(xù)。

向下采樣方法:1.對(duì)圖像進(jìn)行高斯內(nèi)核卷積;2.將所有偶數(shù)行和列去除

圖像的較低級(jí)別(高分辨率)是通過較高級(jí)別(低分辨率)在每個(gè)維度上擴(kuò)大為原來的兩倍,新增的行和列(偶數(shù)行和列)以0填充,然后使用指定的濾波器進(jìn)行卷積去估計(jì)丟失像素的近似值。

向上采樣方法:1.將圖像在每個(gè)維度擴(kuò)大到原來的兩倍,以新增的行和列以0填充;2.使用原先同樣的內(nèi)核(x4)與方法后的圖像卷積,獲得新增像素的近似值在縮放過程中已經(jīng)丟失了一些信息,如果想在縮放過程中減少信息的丟失,就需要用到拉普拉斯金字塔

cv.pyrUp(src)函數(shù):其中只需要傳入一個(gè)參數(shù),代表圖像資源,用于對(duì)圖像做向上采樣

cv.pyrDown()函數(shù):參數(shù)傳遞與cv.pyrUp()一致,用于對(duì)圖像做向下采樣,通常也可以做圖像模糊化處理

3.1.2 拉普拉斯金字塔

拉普拉斯金字塔由高斯金字塔形成,沒有專用的功能,拉普拉斯金字塔圖像僅表示邊緣圖像,它的大多數(shù)元素為0,它們通常用于圖像壓縮

拉普拉斯金字塔的層由高斯金字塔的層與高斯金字塔的高層的擴(kuò)展版本之間的差形成

我們通過一個(gè)例子來展示拉普拉斯金字塔

import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

img = cv.imread(r'E:image	est06.png', )
loser_reso = cv.pyrDown(img)
higher_reso = cv.pyrUp(loser_reso)
lapPyr = img - higher_reso
test = higher_reso
loser_reso2 = cv.pyrDown(test)
higher_reso2 = cv.pyrUp(loser_reso2)
lapPyr2 = test - higher_reso2
cv.imshow('lapPyr', lapPyr)
cv.imshow('lapPyr2', lapPyr2)
cv.waitKey(0)
cv.destroyAllWindows()

a1388f1a-82a0-11ee-939d-92fbcf53809c.png

3.2 使用圖像金字塔進(jìn)制圖像融合

圖像金字塔的一個(gè)應(yīng)用是圖像融合,如果進(jìn)行簡單的圖像拼接,我們將兩個(gè)圖片堆疊在一起,會(huì)因?yàn)閳D像之間的不連續(xù)性看起來效果不好,在這種情況下金字塔混合圖像可以無縫混合,而不會(huì)在圖像中保留大量數(shù)據(jù)

想要達(dá)到圖像混合的效果,需要完成以下步驟:

加載兩個(gè)需要進(jìn)行混合的圖像

查找兩張圖像的高斯金字塔,然后在其高斯金字塔中找到其拉普拉斯金字塔

在每個(gè)拉普拉斯金字塔級(jí)別中加入兩張圖片的各一半

最后從此聯(lián)合圖像金字塔中重建原始圖像

import cv2 as cv
import numpy as np, sys

A = cv.imread('E:/image/horse.png')
B = cv.imread('E:/image/cow.png')
# 生成A的高斯金字塔
G = A.copy()
gpA = [G]
for i in range(6):
    G = cv.pyrDown(G)
    gpA.append(G)
# 生成B的高斯金字塔
G = B.copy()
gpB = [G]
for i in range(6):
    G = cv.pyrDown(G)
    gpB.append(G)
# 生成A的拉普拉斯金字塔
lpA = [gpA[5]]
for i in range(5, 0, -1):
    GE = cv.pyrUp(gpA[i])
    L = cv.subtract(gpA[i - 1], GE)
    lpA.append(L)
# 生成B的拉普拉斯金字塔
lpB = [gpB[5]]
for i in range(5, 0, -1):
    GE = cv.pyrUp(gpB[i])
    L = cv.subtract(gpB[i - 1], GE)
    lpB.append(L)
# 現(xiàn)在在每個(gè)級(jí)別中添加左右兩半圖像
LS = []
for la, lb in zip(lpA, lpB):
    rows, cols, dpt = la.shape
    ls = np.hstack((la[:, 0:cols / 2], lb[:, cols / 2:]))
    LS.append(ls)
# 現(xiàn)在重建
ls_ = LS[0]
for i in range(1, 6):
    ls_ = cv.pyrUp(ls_)
    ls_ = cv.add(ls_, LS[i])
# 圖像與直接連接的每一半
real = np.hstack((A[:, :cols / 2], B[:, cols / 2:]))
cv.imwrite('Pyramid_blending2.jpg', ls_)
cv.imwrite('Direct_blending.jpg', real)

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1275

    瀏覽量

    56577
  • 低通濾波器
    +關(guān)注

    關(guān)注

    14

    文章

    471

    瀏覽量

    47289
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4284

    瀏覽量

    62325
  • OpenCV
    +關(guān)注

    關(guān)注

    29

    文章

    625

    瀏覽量

    41214

原文標(biāo)題:OpenCV中的圖像處理 —— 圖像梯度+Canny邊緣檢測(cè)+圖像金字塔

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Canny雙閾值邊緣檢測(cè)和弱邊緣連接詳解

    在上一篇FPGA圖像處理--Canny邊緣檢測(cè)(一)里介紹了Canny
    的頭像 發(fā)表于 11-18 17:07 ?2344次閱讀

    基于FPGA的實(shí)時(shí)邊緣檢測(cè)系統(tǒng)設(shè)計(jì),Sobel圖像邊緣檢測(cè),F(xiàn)PGA圖像處理

    的主要特征提取手段 。由于實(shí)時(shí)視頻圖像邊緣檢測(cè)需要處理的數(shù)據(jù)量非常大,所以采用一般的軟件方法實(shí)現(xiàn)起來處理速度慢,無法滿足實(shí)時(shí)性的要求。 隨
    發(fā)表于 05-24 07:45

    基于Canny邊緣檢測(cè)算子的圖像檢索算法

    【摘要】:針對(duì)依賴傳統(tǒng)Canny算子的基于邊緣圖像檢索系統(tǒng)所存在的不足,提出一種基于Canny邊緣檢測(cè)
    發(fā)表于 04-24 10:03

    【Z-turn Board試用體驗(yàn)】+ 基于Z-turn的圖像邊緣檢測(cè)系統(tǒng)(三)

    部分,首先是最重要的部分,sobel邊緣檢測(cè)(硬件加速模塊)Sobel算子主要用作邊緣檢測(cè),在技術(shù)上,它是一離散性一階差分算子,用來運(yùn)算圖像
    發(fā)表于 07-07 20:41

    【DragonBoard 410c試用體驗(yàn)】OpenCVcanny算子邊緣檢測(cè)

    有顯著變化的點(diǎn)凸顯出來。在具體編程實(shí)現(xiàn)時(shí),可通過計(jì)算梯度幅值來確定。 檢測(cè):經(jīng)過增強(qiáng)的圖像,往往鄰域中有很多點(diǎn)的梯度值比較大,而在特定的應(yīng)用中,這些點(diǎn)并不是我們要找的
    發(fā)表于 09-11 23:24

    關(guān)于canny算子邊緣檢測(cè)的問題

    本帖最后由 豆吖豆 于 2017-4-4 23:14 編輯 grd=edge(Egray,'canny',0.09,'both');大神門 問一下這個(gè)后面的0.09和both什么意思是指的是Egray圖像的上下大小還是,另外可以的話能大概說說這個(gè)
    發(fā)表于 04-04 22:27

    Labview圖像處理——邊緣檢測(cè)

    。Sobel算子檢測(cè)方法對(duì)灰度漸變和噪聲較多的圖像處理效果較好,sobel算子對(duì)邊緣定位不是很準(zhǔn)確,圖像
    發(fā)表于 12-01 12:16

    基于Canny 法的紅外小目標(biāo)邊緣檢測(cè)方法

    從紅外圖像的特點(diǎn)出發(fā),基于Canny算法進(jìn)行了目標(biāo)邊緣檢測(cè)。首先,對(duì)源圖像進(jìn)行小波分解和重構(gòu),對(duì)圖像
    發(fā)表于 05-27 15:02 ?12次下載

    基于Canny邊緣檢測(cè)算子的圖像檢索算法

      針對(duì)依賴傳統(tǒng)Canny算子的基于邊緣圖像檢索系統(tǒng)所存在的不足,提出一種基于Canny邊緣
    發(fā)表于 02-11 11:22 ?28次下載

    基于Canny算法的改進(jìn)Kirsch人臉邊緣檢測(cè)方法

    針對(duì)Kirsch邊緣檢測(cè)算法的不足,提出了一種基于Canny算法改進(jìn)的Kirsch人臉邊緣檢測(cè)算法。該算法先對(duì)原始
    發(fā)表于 02-23 14:31 ?10次下載

    小波變換在圖像邊緣檢測(cè)中的應(yīng)用

    目前,被廣泛使用的經(jīng)典邊緣檢測(cè)算子有Sobel算子,Prewitt算子,Roberts算子,Log算子,Canny算子等等。這些算子的核心思想是圖像
    發(fā)表于 08-13 16:14 ?54次下載
    小波變換在<b class='flag-5'>圖像</b><b class='flag-5'>邊緣</b><b class='flag-5'>檢測(cè)</b>中的應(yīng)用

    canny邊緣檢測(cè)

    OpenCV3編程入門》書本配套源代碼canny邊緣檢測(cè)
    發(fā)表于 06-06 15:20 ?2次下載

    OpenCV使用深度學(xué)習(xí)做邊緣檢測(cè)的流程

    導(dǎo)讀 分析了Canny的優(yōu)劣,并給出了OpenCV使用深度學(xué)習(xí)做邊緣檢測(cè)的流程。 在這篇文章中,我們將學(xué)習(xí)如何在OpenCV中使用基于深度學(xué)
    的頭像 發(fā)表于 05-08 11:05 ?2218次閱讀
    <b class='flag-5'>OpenCV</b>使用深度學(xué)習(xí)做<b class='flag-5'>邊緣</b><b class='flag-5'>檢測(cè)</b>的流程

    Canny圖像算法仿真驗(yàn)證原理與實(shí)現(xiàn)

    是一種非常流行的邊緣檢測(cè)算法,是John Canny在1986年提出的。它是一個(gè)多階段的算法,即由多個(gè)步驟構(gòu)成:圖像降噪、計(jì)算圖像
    的頭像 發(fā)表于 10-15 09:10 ?1855次閱讀

    opencv圖像識(shí)別有什么算法

    圖像識(shí)別算法: 邊緣檢測(cè)邊緣檢測(cè)圖像識(shí)別中的基本步驟之一,用于識(shí)別
    的頭像 發(fā)表于 07-16 10:40 ?747次閱讀