0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是邊緣檢測?邊緣檢測的算法由來

新機(jī)器視覺 ? 來源:AI公園 ? 作者:ANKIT SACHAN ? 2021-03-12 10:00 ? 次閱讀

導(dǎo)讀

分析了Canny的優(yōu)劣,并給出了OpenCV使用深度學(xué)習(xí)做邊緣檢測的流程,文末有代碼鏈接。

在這篇文章中,我們將學(xué)習(xí)如何在OpenCV中使用基于深度學(xué)習(xí)的邊緣檢測,它比目前流行的canny邊緣檢測器更精確。邊緣檢測在許多用例中是有用的,如視覺顯著性檢測,目標(biāo)檢測,跟蹤和運動分析,結(jié)構(gòu)從運動,3D重建,自動駕駛,圖像到文本分析等等。

什么是邊緣檢測?

邊緣檢測是計算機(jī)視覺中一個非常古老的問題,它涉及到檢測圖像中的邊緣來確定目標(biāo)的邊界,從而分離感興趣的目標(biāo)。最流行的邊緣檢測技術(shù)之一是Canny邊緣檢測,它已經(jīng)成為大多數(shù)計算機(jī)視覺研究人員和實踐者的首選方法。讓我們快速看一下Canny邊緣檢測。

Canny邊緣檢測算法

1983年,John Canny在麻省理工學(xué)院發(fā)明了Canny邊緣檢測。它將邊緣檢測視為一個信號處理問題。其核心思想是,如果你觀察圖像中每個像素的強(qiáng)度變化,它在邊緣的時候非常高。

在下面這張簡單的圖片中,強(qiáng)度變化只發(fā)生在邊界上。所以,你可以很容易地通過觀察像素強(qiáng)度的變化來識別邊緣。

現(xiàn)在,看下這張圖片。強(qiáng)度不是恒定的,但強(qiáng)度的變化率在邊緣處最高。(微積分復(fù)習(xí):變化率可以用一階導(dǎo)數(shù)(梯度)來計算。)

Canny邊緣檢測器通過4步來識別邊緣:

去噪:因為這種方法依賴于強(qiáng)度的突然變化,如果圖像有很多隨機(jī)噪聲,那么會將噪聲作為邊緣。所以,使用5×5的高斯濾波器平滑你的圖像是一個非常好的主意。

梯度計算:下一步,我們計算圖像中每個像素的強(qiáng)度的梯度(強(qiáng)度變化率)。我們也計算梯度的方向。

梯度方向垂直于邊緣,它被映射到四個方向中的一個(水平、垂直和兩個對角線方向)。

非極大值抑制:現(xiàn)在,我們想刪除不是邊緣的像素(設(shè)置它們的值為0)。你可能會說,我們可以簡單地選取梯度值最高的像素,這些就是我們的邊。然而,在真實的圖像中,梯度不是簡單地在只一個像素處達(dá)到峰值,而是在臨近邊緣的像素處都非常高。因此我們在梯度方向上取3×3附近的局部最大值。

遲滯閾值化:在下一步中,我們需要決定一個梯度的閾值,低于這個閾值所有的像素都將被抑制(設(shè)置為0)。而Canny邊緣檢測器則采用遲滯閾值法。遲滯閾值法是一種非常簡單而有效的方法。我們使用兩個閾值來代替只用一個閾值:

高閾值 = 選擇一個非常高的值,這樣任何梯度值高于這個值的像素都肯定是一個邊緣。

低閾值 = 選擇一個非常低的值,任何梯度值低于該值的像素絕對不是邊緣。

在這兩個閾值之間有梯度的像素會被檢查,如果它們和邊緣相連,就會留下,否則就會去掉。

遲滯閾值化

Canny 邊緣檢測的問題:

由于Canny邊緣檢測器只關(guān)注局部變化,沒有語義(理解圖像的內(nèi)容)理解,精度有限(很多時候是這樣)。

Canny邊緣檢測器在這種情況下會失敗,因為沒有理解圖像的上下文

語義理解對于邊緣檢測是至關(guān)重要的,這就是為什么使用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的基于學(xué)習(xí)的檢測器比canny邊緣檢測器產(chǎn)生更好的結(jié)果。

OpenCV中基于深度學(xué)習(xí)的邊緣檢測

OpenCV在其全新的DNN模塊中集成了基于深度學(xué)習(xí)的邊緣檢測技術(shù)。你需要OpenCV 3.4.3或更高版本。這種技術(shù)被稱為整體嵌套邊緣檢測或HED,是一種基于學(xué)習(xí)的端到端邊緣檢測系統(tǒng),使用修剪過的類似vgg的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像到圖像的預(yù)測任務(wù)。

HED利用了中間層的輸出。之前的層的輸出稱為side output,將所有5個卷積層的輸出進(jìn)行融合,生成最終的預(yù)測。由于在每一層生成的特征圖大小不同,它可以有效地以不同的尺度查看圖像。

網(wǎng)絡(luò)結(jié)構(gòu):整體嵌套邊緣檢測

HED方法不僅比其他基于深度學(xué)習(xí)的方法更準(zhǔn)確,而且速度也比其他方法快得多。這就是為什么OpenCV決定將其集成到新的DNN模塊中。以下是這篇論文的結(jié)果:

在OpenCV中訓(xùn)練深度學(xué)習(xí)邊緣檢測的代碼

OpenCV使用的預(yù)訓(xùn)練模型已經(jīng)在Caffe框架中訓(xùn)練過了,可以這樣加載:

sh download_pretrained.sh

網(wǎng)絡(luò)中有一個crop層,默認(rèn)是沒有實現(xiàn)的,所以我們需要自己實現(xiàn)一下。

class CropLayer(object):

def __init__(self, params, blobs):

self.xstart = 0

self.xend = 0

self.ystart = 0

self.yend = 0

# Our layer receives two inputs. We need to crop the first input blob

# to match a shape of the second one (keeping batch size and number of channels)

def getMemoryShapes(self, inputs):

inputShape, targetShape = inputs[0], inputs[1]

batchSize, numChannels = inputShape[0], inputShape[1]

height, width = targetShape[2], targetShape[3]

self.ystart = (inputShape[2] - targetShape[2]) // 2

self.xstart = (inputShape[3] - targetShape[3]) // 2

self.yend = self.ystart + height

self.xend = self.xstart + width

return [[batchSize, numChannels, height, width]]

def forward(self, inputs):

return [inputs[0][:,:,self.ystart:self.yend,self.xstart:self.xend]]

現(xiàn)在,我們可以重載這個類,只需用一行代碼注冊該層。

cv.dnn_registerLayer(‘Crop’, CropLayer)

現(xiàn)在,我們準(zhǔn)備構(gòu)建網(wǎng)絡(luò)圖并加載權(quán)重,這可以通過OpenCV的dnn.readNe函數(shù)。

net = cv.dnn.readNet(args.prototxt, args.caffemodel)

現(xiàn)在,下一步是批量加載圖像,并通過網(wǎng)絡(luò)運行它們。為此,我們使用cv2.dnn.blobFromImage方法。該方法從輸入圖像中創(chuàng)建四維blob。

blob = cv.dnn.blobFromImage(image, scalefactor, size, mean, swapRB, crop)

其中:

image:是我們想要發(fā)送給神經(jīng)網(wǎng)絡(luò)進(jìn)行推理的輸入圖像。

scalefactor:圖像縮放常數(shù),很多時候我們需要把uint8的圖像除以255,這樣所有的像素都在0到1之間。默認(rèn)值是1.0,不縮放。

size:輸出圖像的空間大小。它將等于后續(xù)神經(jīng)網(wǎng)絡(luò)作為blobFromImage輸出所需的輸入大小。

swapRB:布爾值,表示我們是否想在3通道圖像中交換第一個和最后一個通道。OpenCV默認(rèn)圖像為BGR格式,但如果我們想將此順序轉(zhuǎn)換為RGB,我們可以將此標(biāo)志設(shè)置為True,這也是默認(rèn)值。

mean:為了進(jìn)行歸一化,有時我們計算訓(xùn)練數(shù)據(jù)集上的平均像素值,并在訓(xùn)練過程中從每幅圖像中減去它。如果我們在訓(xùn)練中做均值減法,那么我們必須在推理中應(yīng)用它。這個平均值是一個對應(yīng)于R, G, B通道的元組。例如Imagenet數(shù)據(jù)集的均值是R=103.93, G=116.77, B=123.68。如果我們使用swapRB=False,那么這個順序?qū)⑹牵˙, G, R)。

crop:布爾標(biāo)志,表示我們是否想居中裁剪圖像。如果設(shè)置為True,則從中心裁剪輸入圖像時,較小的尺寸等于相應(yīng)的尺寸,而其他尺寸等于或大于該尺寸。然而,如果我們將其設(shè)置為False,它將保留長寬比,只是將其調(diào)整為固定尺寸大小。

在我們這個場景下:

inp = cv.dnn.blobFromImage(frame, scalefactor=1.0, size=(args.width, args.height),

mean=(104.00698793, 116.66876762, 122.67891434), swapRB=False,

crop=False)

現(xiàn)在,我們只需要調(diào)用一下前向方法。

net.setInput(inp)

out = net.forward()

out = out[0, 0]

out = cv.resize(out, (frame.shape[1], frame.shape[0]))

out = 255 * out

out = out.astype(np.uint8)

out=cv.cvtColor(out,cv.COLOR_GRAY2BGR)

con=np.concatenate((frame,out),axis=1)

cv.imshow(kWinName,con)

結(jié)果:

中間的圖像是人工標(biāo)注的圖像,右邊是HED的結(jié)果

中間的圖像是人工標(biāo)注的圖像,右邊是HED的結(jié)果

文中的代碼:

https://github.com/sankit1/cv-tricks.com/tree/master/OpenCV/Edge_detection

英文原文:https://cv-tricks.com/opencv-dnn/edge-detection-hed/
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 邊緣檢測
    +關(guān)注

    關(guān)注

    0

    文章

    91

    瀏覽量

    18162
  • 計算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1685

    瀏覽量

    45811
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120593

原文標(biāo)題:在OpenCV中基于深度學(xué)習(xí)的邊緣檢測

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DSP國產(chǎn)教學(xué)實驗箱_實驗案例_操作教程:5-11 邊緣檢測

    檢測算法是具有嚴(yán)格定義的、可以提供良好可靠檢測的方法之一。由于它具有滿足邊緣檢測的三個標(biāo)準(zhǔn)和實現(xiàn)過程簡單的優(yōu)勢,成為邊緣
    發(fā)表于 07-19 10:38

    圖像邊緣檢測系統(tǒng)的設(shè)計流程

    圖像邊緣檢測系統(tǒng)的設(shè)計流程是一個涉及多個步驟的復(fù)雜過程,它旨在從圖像中提取出重要的結(jié)構(gòu)信息,如邊界、輪廓等。這些邊緣信息對于圖像分析、機(jī)器視覺、圖像壓縮等領(lǐng)域至關(guān)重要。以下是一個詳細(xì)的圖像邊緣
    的頭像 發(fā)表于 07-17 16:39 ?199次閱讀

    基于FPGA的實時邊緣檢測系統(tǒng)設(shè)計,Sobel圖像邊緣檢測,F(xiàn)PGA圖像處理

    摘要 :本文設(shè)計了一種 基于 FPGA 的實時邊緣檢測系統(tǒng) ,使用OV5640 攝像頭模塊獲取實時的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計和 并行運算加速
    發(fā)表于 05-24 07:45

    主流邊緣AI算法,在安防、零售、交通等領(lǐng)域的應(yīng)用

    邊緣AI可以應(yīng)用在哪些場景實現(xiàn)哪些功能。 ? 市面上主流的邊緣AI算法應(yīng)用 ? 目前市面上比較主流的邊緣AI算法應(yīng)用,包括人臉及關(guān)鍵點
    的頭像 發(fā)表于 05-13 01:56 ?2613次閱讀

    算法系列:基于 FPGA 的圖像邊緣檢測系統(tǒng)設(shè)計(sobel算法

    )為邊緣點。 用的是邊緣檢測算法。 難點: (1)掌握了 3*3 像素陣列,Gx 與 Gy 就很好計算了。 注意問題:為了避免計算過程中出現(xiàn)負(fù)值,所以將正負(fù)值分開單獨計算,具體見代碼
    發(fā)表于 03-26 16:40

    OpenCV邊緣檢測算子Laplace、LoG詳解

    一階導(dǎo)數(shù)算子(例如 Sobel 算子)通過對圖像求導(dǎo)來確定圖像的邊緣,數(shù)值絕對值較高的點對應(yīng)了圖像的邊緣。如果繼續(xù)求二階導(dǎo),原先數(shù)值絕對值較高的點對應(yīng)了過零點。因此,也可以通過找到二階導(dǎo)數(shù)的過零點來檢測
    的頭像 發(fā)表于 12-21 16:34 ?1600次閱讀
    OpenCV<b class='flag-5'>邊緣</b><b class='flag-5'>檢測</b>算子Laplace、LoG詳解

    國產(chǎn)嵌入式實驗箱操作教程_創(chuàng)龍教儀:5-12 邊緣檢測(LCD顯示)

    ,Canny邊緣檢測算法是具有嚴(yán)格定義的、可以提供良好可靠檢測的方法之一。由于它具有滿足邊緣檢測的三個標(biāo)準(zhǔn)和實現(xiàn)過程簡單的優(yōu)勢,成為
    發(fā)表于 12-14 14:09

    圖像處理算法——邊緣檢測

    基于邊緣檢測的分析不易受整體光照強(qiáng)度變化的影響,同時利用邊緣信息容易凸顯目標(biāo)信息和達(dá)到簡化處理的目的,因此很多圖像理解方法都以邊緣為基礎(chǔ)。邊緣
    的頭像 發(fā)表于 11-30 16:56 ?759次閱讀
    圖像處理<b class='flag-5'>算法</b>——<b class='flag-5'>邊緣</b><b class='flag-5'>檢測</b>

    Canny雙閾值邊緣檢測和弱邊緣連接詳解

    在上一篇FPGA圖像處理--Canny邊緣檢測(一)里介紹了Canny邊緣檢測的NMS計算,這里就介紹一下雙閾值邊緣
    的頭像 發(fā)表于 11-18 17:07 ?1955次閱讀

    python中用Canny邊緣檢測和霍夫變實現(xiàn)車道線檢測方法

    Canny邊緣檢測+霍夫變換 顏色閾值+圖像掩模的方法雖然簡單,但是只能應(yīng)對一些固定顏色車道線的場景。圖像像素受光照影響將是一個極其常見的問題。 canny邊緣檢測+霍夫變換是另外一種
    的頭像 發(fā)表于 11-17 16:55 ?676次閱讀
    python中用Canny<b class='flag-5'>邊緣</b><b class='flag-5'>檢測</b>和霍夫變實現(xiàn)車道線<b class='flag-5'>檢測</b>方法

    FPGA圖像處理之Canny邊緣檢測

    邊緣檢測算法里面Sobel是比較簡單的一個算法,但是其檢測出來的邊緣往往是比較粗的,效果不是很好,因為我們最理想的
    的頭像 發(fā)表于 11-17 09:10 ?1305次閱讀
    FPGA圖像處理之Canny<b class='flag-5'>邊緣</b><b class='flag-5'>檢測</b>

    對于形狀近似矩形但邊緣有規(guī)則起伏的情況,可以使用OpenCV庫中的approxPolyDP函數(shù)進(jìn)行多邊形擬合和矩形檢測

    對于形狀近似矩形但邊緣有規(guī)則起伏的情況,可以使用OpenCV庫中的approxPolyDP函數(shù)進(jìn)行多邊形擬合和矩形檢測。 approxPolyDP函數(shù)通過在給定的點集上使用動態(tài)規(guī)劃算法,計算出近似
    發(fā)表于 11-01 09:23

    什么是邊緣計算盒子(AI算法盒子)?

    邊緣計算盒子是一種基于邊緣計算和人工智能技術(shù)的智能設(shè)備,它內(nèi)置了靈活可配的多樣化AI算法庫,所以也被稱為AI算法盒子或智能邊緣分析一體機(jī),可
    的頭像 發(fā)表于 10-31 14:29 ?2298次閱讀
    什么是<b class='flag-5'>邊緣</b>計算盒子(AI<b class='flag-5'>算法</b>盒子)?

    openCV邊緣檢測原理是什么?

    openCV是通過什么原理來實現(xiàn)邊緣檢測
    發(fā)表于 10-10 06:21

    迅為RK3568開發(fā)板Scharr濾波器算子邊緣檢測

    : 使用 Scharr 算子進(jìn)行邊緣檢測。 函數(shù)原型: dst = cv2.Scharr(src, ddepth, dx, dy[, dst[, scale[, delta[, borderType
    發(fā)表于 10-09 11:03