0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在OpenCV中使用基于深度學(xué)習(xí)的邊緣檢測(cè)?

新機(jī)器視覺(jué) ? 來(lái)源:ANKIT SACHAN ? 2023-05-18 10:10 ? 次閱讀

什么是邊緣檢測(cè)?

邊緣檢測(cè)是計(jì)算機(jī)視覺(jué)中一個(gè)非常古老的問(wèn)題,它涉及到檢測(cè)圖像中的邊緣來(lái)確定目標(biāo)的邊界,從而分離感興趣的目標(biāo)。最流行的邊緣檢測(cè)技術(shù)之一是Canny邊緣檢測(cè),它已經(jīng)成為大多數(shù)計(jì)算機(jī)視覺(jué)研究人員和實(shí)踐者的首選方法。讓我們快速看一下Canny邊緣檢測(cè)。

Canny邊緣檢測(cè)算法

1983年,John Canny在麻省理工學(xué)院發(fā)明了Canny邊緣檢測(cè)。它將邊緣檢測(cè)視為一個(gè)信號(hào)處理問(wèn)題。其核心思想是,如果你觀察圖像中每個(gè)像素的強(qiáng)度變化,它在邊緣的時(shí)候非常高。

在下面這張簡(jiǎn)單的圖片中,強(qiáng)度變化只發(fā)生在邊界上。所以,你可以很容易地通過(guò)觀察像素強(qiáng)度的變化來(lái)識(shí)別邊緣。

a0d539a4-ed38-11ed-90ce-dac502259ad0.png

現(xiàn)在,看下這張圖片。強(qiáng)度不是恒定的,但強(qiáng)度的變化率在邊緣處最高。(微積分復(fù)習(xí):變化率可以用一階導(dǎo)數(shù)(梯度)來(lái)計(jì)算。)

a0d99184-ed38-11ed-90ce-dac502259ad0.png

Canny邊緣檢測(cè)器通過(guò)4步來(lái)識(shí)別邊緣:

去噪:因?yàn)檫@種方法依賴于強(qiáng)度的突然變化,如果圖像有很多隨機(jī)噪聲,那么會(huì)將噪聲作為邊緣。所以,使用5×5的高斯濾波器平滑你的圖像是一個(gè)非常好的主意。

梯度計(jì)算:下一步,我們計(jì)算圖像中每個(gè)像素的強(qiáng)度的梯度(強(qiáng)度變化率)。我們也計(jì)算梯度的方向。

a0e30db8-ed38-11ed-90ce-dac502259ad0.png

梯度方向垂直于邊緣,它被映射到四個(gè)方向中的一個(gè)(水平、垂直和兩個(gè)對(duì)角線方向)。

非極大值抑制:現(xiàn)在,我們想刪除不是邊緣的像素(設(shè)置它們的值為0)。你可能會(huì)說(shuō),我們可以簡(jiǎn)單地選取梯度值最高的像素,這些就是我們的邊。然而,在真實(shí)的圖像中,梯度不是簡(jiǎn)單地在只一個(gè)像素處達(dá)到峰值,而是在臨近邊緣的像素處都非常高。因此我們?cè)谔荻确较蛏先?×3附近的局部最大值。

a0ecbcdc-ed38-11ed-90ce-dac502259ad0.png

遲滯閾值化:在下一步中,我們需要決定一個(gè)梯度的閾值,低于這個(gè)閾值所有的像素都將被抑制(設(shè)置為0)。而Canny邊緣檢測(cè)器則采用遲滯閾值法。遲滯閾值法是一種非常簡(jiǎn)單而有效的方法。我們使用兩個(gè)閾值來(lái)代替只用一個(gè)閾值:

高閾值 = 選擇一個(gè)非常高的值,這樣任何梯度值高于這個(gè)值的像素都肯定是一個(gè)邊緣。

低閾值 = 選擇一個(gè)非常低的值,任何梯度值低于該值的像素絕對(duì)不是邊緣。

在這兩個(gè)閾值之間有梯度的像素會(huì)被檢查,如果它們和邊緣相連,就會(huì)留下,否則就會(huì)去掉。

a0f77898-ed38-11ed-90ce-dac502259ad0.jpg

遲滯閾值化

Canny 邊緣檢測(cè)的問(wèn)題:

由于Canny邊緣檢測(cè)器只關(guān)注局部變化,沒(méi)有語(yǔ)義(理解圖像的內(nèi)容)理解,精度有限(很多時(shí)候是這樣)。

a100dad2-ed38-11ed-90ce-dac502259ad0.png

Canny邊緣檢測(cè)器在這種情況下會(huì)失敗,因?yàn)闆](méi)有理解圖像的上下文

語(yǔ)義理解對(duì)于邊緣檢測(cè)是至關(guān)重要的,這就是為什么使用機(jī)器學(xué)習(xí)深度學(xué)習(xí)的基于學(xué)習(xí)的檢測(cè)器比canny邊緣檢測(cè)器產(chǎn)生更好的結(jié)果。

OpenCV中基于深度學(xué)習(xí)的邊緣檢測(cè)

OpenCV在其全新的DNN模塊中集成了基于深度學(xué)習(xí)的邊緣檢測(cè)技術(shù)。你需要OpenCV 3.4.3或更高版本。這種技術(shù)被稱為整體嵌套邊緣檢測(cè)或HED,是一種基于學(xué)習(xí)的端到端邊緣檢測(cè)系統(tǒng),使用修剪過(guò)的類似vgg的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像到圖像的預(yù)測(cè)任務(wù)。

HED利用了中間層的輸出。之前的層的輸出稱為side output,將所有5個(gè)卷積層的輸出進(jìn)行融合,生成最終的預(yù)測(cè)。由于在每一層生成的特征圖大小不同,它可以有效地以不同的尺度查看圖像。

a11cd3cc-ed38-11ed-90ce-dac502259ad0.png

網(wǎng)絡(luò)結(jié)構(gòu):整體嵌套邊緣檢測(cè)

HED方法不僅比其他基于深度學(xué)習(xí)的方法更準(zhǔn)確,而且速度也比其他方法快得多。這就是為什么OpenCV決定將其集成到新的DNN模塊中。以下是這篇論文的結(jié)果:

a1305942-ed38-11ed-90ce-dac502259ad0.png

在OpenCV中訓(xùn)練深度學(xué)習(xí)邊緣檢測(cè)的代碼

OpenCV使用的預(yù)訓(xùn)練模型已經(jīng)在Caffe框架中訓(xùn)練過(guò)了,可以這樣加載:

shdownload_pretrained.sh

網(wǎng)絡(luò)中有一個(gè)crop層,默認(rèn)是沒(méi)有實(shí)現(xiàn)的,所以我們需要自己實(shí)現(xiàn)一下。

classCropLayer(object):
def__init__(self,params,blobs):
self.xstart=0
self.xend=0
self.ystart=0
self.yend=0

#Ourlayerreceivestwoinputs.Weneedtocropthefirstinputblob
#tomatchashapeofthesecondone(keepingbatchsizeandnumberofchannels)
defgetMemoryShapes(self,inputs):
inputShape,targetShape=inputs[0],inputs[1]
batchSize,numChannels=inputShape[0],inputShape[1]
height,width=targetShape[2],targetShape[3]

self.ystart=(inputShape[2]-targetShape[2])//2
self.xstart=(inputShape[3]-targetShape[3])//2
self.yend=self.ystart+height
self.xend=self.xstart+width

return[[batchSize,numChannels,height,width]]

defforward(self,inputs):
return[inputs[0][:,:,self.ystart:self.yend,self.xstart:self.xend]]

現(xiàn)在,我們可以重載這個(gè)類,只需用一行代碼注冊(cè)該層。

cv.dnn_registerLayer('Crop',CropLayer)

現(xiàn)在,我們準(zhǔn)備構(gòu)建網(wǎng)絡(luò)圖并加載權(quán)重,這可以通過(guò)OpenCV的dnn.readNe函數(shù)。

net=cv.dnn.readNet(args.prototxt,args.caffemodel)

現(xiàn)在,下一步是批量加載圖像,并通過(guò)網(wǎng)絡(luò)運(yùn)行它們。為此,我們使用cv2.dnn.blobFromImage方法。該方法從輸入圖像中創(chuàng)建四維blob。

blob=cv.dnn.blobFromImage(image,scalefactor,size,mean,swapRB,crop)

其中:

image:是我們想要發(fā)送給神經(jīng)網(wǎng)絡(luò)進(jìn)行推理的輸入圖像。

scalefactor:圖像縮放常數(shù),很多時(shí)候我們需要把uint8的圖像除以255,這樣所有的像素都在0到1之間。默認(rèn)值是1.0,不縮放。

size:輸出圖像的空間大小。它將等于后續(xù)神經(jīng)網(wǎng)絡(luò)作為blobFromImage輸出所需的輸入大小。

swapRB:布爾值,表示我們是否想在3通道圖像中交換第一個(gè)和最后一個(gè)通道。OpenCV默認(rèn)圖像為BGR格式,但如果我們想將此順序轉(zhuǎn)換為RGB,我們可以將此標(biāo)志設(shè)置為True,這也是默認(rèn)值。

mean:為了進(jìn)行歸一化,有時(shí)我們計(jì)算訓(xùn)練數(shù)據(jù)集上的平均像素值,并在訓(xùn)練過(guò)程中從每幅圖像中減去它。如果我們?cè)谟?xùn)練中做均值減法,那么我們必須在推理中應(yīng)用它。這個(gè)平均值是一個(gè)對(duì)應(yīng)于R, G, B通道的元組。例如Imagenet數(shù)據(jù)集的均值是R=103.93, G=116.77, B=123.68。如果我們使用swapRB=False,那么這個(gè)順序?qū)⑹?B, G, R)。

crop:布爾標(biāo)志,表示我們是否想居中裁剪圖像。如果設(shè)置為True,則從中心裁剪輸入圖像時(shí),較小的尺寸等于相應(yīng)的尺寸,而其他尺寸等于或大于該尺寸。然而,如果我們將其設(shè)置為False,它將保留長(zhǎng)寬比,只是將其調(diào)整為固定尺寸大小。

在我們這個(gè)場(chǎng)景下:

inp=cv.dnn.blobFromImage(frame,scalefactor=1.0,size=(args.width,args.height),
mean=(104.00698793,116.66876762,122.67891434),swapRB=False,
crop=False)

現(xiàn)在,我們只需要調(diào)用一下前向方法。

net.setInput(inp)
out=net.forward()
out=out[0,0]
out=cv.resize(out,(frame.shape[1],frame.shape[0]))
out=255*out
out=out.astype(np.uint8)
out=cv.cvtColor(out,cv.COLOR_GRAY2BGR)
con=np.concatenate((frame,out),axis=1)
cv.imshow(kWinName,con)

結(jié)果:

a13f59ce-ed38-11ed-90ce-dac502259ad0.png

中間的圖像是人工標(biāo)注的圖像,右邊是HED的結(jié)果

a14cc92e-ed38-11ed-90ce-dac502259ad0.png

中間的圖像是人工標(biāo)注的圖像,右邊是HED的結(jié)果。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 信號(hào)處理器
    +關(guān)注

    關(guān)注

    1

    文章

    250

    瀏覽量

    25172
  • OpenCV
    +關(guān)注

    關(guān)注

    29

    文章

    622

    瀏覽量

    41089
  • 圖像邊緣檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    6537
  • 高斯濾波器
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    1722

原文標(biāo)題:在OpenCV中基于深度學(xué)習(xí)的邊緣檢測(cè)

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    何在深度學(xué)習(xí)中使用紋理分析

    如果圖像數(shù)據(jù)集具有豐富的基于紋理的特征,如果將額外的紋理特征提取技術(shù)作為端到端體系結(jié)構(gòu)的一部分,則深度學(xué)習(xí)技術(shù)會(huì)更有效。
    發(fā)表于 09-29 10:24 ?1286次閱讀

    何在OpenCV中使用基于深度學(xué)習(xí)邊緣檢測(cè)?

    在這篇文章中,我們將學(xué)習(xí)何在OpenCV中使用基于深度學(xué)習(xí)
    的頭像 發(fā)表于 05-19 09:52 ?1925次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>OpenCV</b><b class='flag-5'>中使</b>用基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>邊緣</b><b class='flag-5'>檢測(cè)</b>?

    Rayeager PX2開(kāi)發(fā)板測(cè)試opencv邊緣檢測(cè)效果

    ``Rayeager PX2開(kāi)發(fā)板測(cè)試opencv邊緣檢測(cè)效果,運(yùn)算速率測(cè)試因?yàn)闆](méi)法加鏈接,所以視頻請(qǐng)?jiān)趦?yōu)酷搜索標(biāo)題名稱,更多詳情大家可以在芯客網(wǎng)論壇查看,謝謝!``
    發(fā)表于 01-14 15:20

    【DragonBoard 410c試用體驗(yàn)】之OpenCV中canny算子邊緣檢測(cè)

    `具體介紹之前,先來(lái)一起看看邊緣檢測(cè)的一般步驟 濾波:邊緣檢測(cè)的算法主要是基于圖像強(qiáng)度的一階和二階導(dǎo)數(shù),但導(dǎo)數(shù)通常對(duì)噪聲很敏感,因此必須采用濾波器來(lái)改善與噪聲有關(guān)的
    發(fā)表于 09-11 23:24

    openCV邊緣檢測(cè)原理是什么?

    openCV是通過(guò)什么原理來(lái)實(shí)現(xiàn)邊緣檢測(cè)
    發(fā)表于 10-10 06:21

    邊緣檢測(cè)綜合示例_OpenCV3版書(shū)本配套示例程序60

    OpenCV3編程入門》書(shū)本配套源代碼:邊緣檢測(cè)綜合示例,邊緣檢測(cè)綜合示例——Canny算子,Sobel算子,Laplace算子,Scha
    發(fā)表于 06-06 15:25 ?0次下載

    何在您選擇的邊緣計(jì)算框架中使用EdgeScale

    如何使用EdgeScale管理一組異構(gòu)邊緣計(jì)算節(jié)點(diǎn),以及如何在您選擇的邊緣計(jì)算框架(AWS Greengrass、Azure IoT Edge等)中使用EdgeScale。
    的頭像 發(fā)表于 01-23 07:06 ?2342次閱讀
    如<b class='flag-5'>何在</b>您選擇的<b class='flag-5'>邊緣</b>計(jì)算框架<b class='flag-5'>中使</b>用EdgeScale

    什么是邊緣檢測(cè)邊緣檢測(cè)的算法由來(lái)

    在這篇文章中,我們將學(xué)習(xí)何在OpenCV中使用基于深度學(xué)習(xí)
    的頭像 發(fā)表于 03-12 10:00 ?8486次閱讀

    何在OpenCV中使用基于深度學(xué)習(xí)邊緣檢測(cè)

    邊緣檢測(cè)是計(jì)算機(jī)視覺(jué)中一個(gè)非常古老的問(wèn)題,它涉及到檢測(cè)圖像中的邊緣來(lái)確定目標(biāo)的邊界,從而分離感興趣的目標(biāo)。最流行的邊緣
    的頭像 發(fā)表于 04-18 10:25 ?1756次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>OpenCV</b><b class='flag-5'>中使</b>用基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的<b class='flag-5'>邊緣</b><b class='flag-5'>檢測(cè)</b>

    OpenCV使用深度學(xué)習(xí)邊緣檢測(cè)的流程

    導(dǎo)讀 分析了Canny的優(yōu)劣,并給出了OpenCV使用深度學(xué)習(xí)邊緣檢測(cè)的流程。 在這篇文章中,我們將學(xué)
    的頭像 發(fā)表于 05-08 11:05 ?2171次閱讀
    <b class='flag-5'>OpenCV</b>使用<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>做<b class='flag-5'>邊緣</b><b class='flag-5'>檢測(cè)</b>的流程

    在MFC中使OpenCV的教程下載

    在MFC中使OpenCV的教程下載
    發(fā)表于 06-26 14:35 ?2次下載

    何在OpenCV中實(shí)現(xiàn)CUDA加速

    OpenCV4.x中關(guān)于CUDA加速的內(nèi)容主要有兩個(gè)部分,第一部分是之前OpenCV支持的圖像處理與對(duì)象檢測(cè)傳統(tǒng)算法的CUDA加速;第二部分是OpenCV4.2版本之后開(kāi)始支持的針對(duì)
    的頭像 發(fā)表于 09-05 10:03 ?4906次閱讀

    何在深度學(xué)習(xí)結(jié)構(gòu)中使用紋理特征

    來(lái)源:AI公園,作者:TraptiKalra編譯:ronghuaiyang導(dǎo)讀這是前一篇文章的繼續(xù),在這篇文章中,我們將討論紋理分析在圖像分類中的重要性,以及如何在深度學(xué)習(xí)中使用紋理分
    的頭像 發(fā)表于 10-10 09:15 ?888次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>結(jié)構(gòu)<b class='flag-5'>中使</b>用紋理特征

    OpenCV庫(kù)在圖像處理和深度學(xué)習(xí)中的應(yīng)用

    本文深入淺出地探討了OpenCV庫(kù)在圖像處理和深度學(xué)習(xí)中的應(yīng)用。從基本概念和操作,到復(fù)雜的圖像變換和深度學(xué)習(xí)模型的使用,文章以詳盡的代碼和解
    的頭像 發(fā)表于 08-18 11:33 ?748次閱讀

    何在汽車CAN應(yīng)用中使用負(fù)邊緣觸發(fā)觸發(fā)器節(jié)省電力

    電子發(fā)燒友網(wǎng)站提供《如何在汽車CAN應(yīng)用中使用負(fù)邊緣觸發(fā)觸發(fā)器節(jié)省電力.pdf》資料免費(fèi)下載
    發(fā)表于 09-13 10:06 ?0次下載
    如<b class='flag-5'>何在</b>汽車CAN應(yīng)用<b class='flag-5'>中使</b>用負(fù)<b class='flag-5'>邊緣</b>觸發(fā)觸發(fā)器節(jié)省電力