0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RPN:Region Proposal Networks (區(qū)域候選網(wǎng)絡(luò))

jf_96884364 ? 來源:jf_96884364 ? 作者:jf_96884364 ? 2023-01-11 16:55 ? 次閱讀

區(qū)域建議網(wǎng)絡(luò)(RPN)首先在faster rcnn中提出。

得到用來預(yù)測(cè)的feature map

圖片在輸入網(wǎng)絡(luò)后,依次經(jīng)過一系列卷積+ReLU得到的51×39×256維feature map,準(zhǔn)備后續(xù)用來選取proposal。

生成Anchors

anchor是固定尺寸的bbox。具體做法是:把feature map每個(gè)點(diǎn)映射回原圖的感受野的中心點(diǎn)當(dāng)成一個(gè)基準(zhǔn)點(diǎn),然后圍繞這個(gè)基準(zhǔn)點(diǎn)選取k個(gè)不同的尺寸和比例的anchor。對(duì)于W×H大小的卷積feature map(通常為2400),總共有W×H×k個(gè)錨點(diǎn)。默認(rèn)使用3個(gè)尺度和3個(gè)縱橫比,在每個(gè)滑動(dòng)位置上產(chǎn)生k=9個(gè)anchor。在feature map上的每個(gè)特征點(diǎn)預(yù)測(cè)多個(gè)region proposals。例如對(duì)于像素點(diǎn)個(gè)數(shù)為 51×39 的一幅feature map上就會(huì)產(chǎn)生 51×39×9 個(gè)候選框。雖然anchors是基于卷積特征圖定義的,但最終的 anchors是相對(duì)于原始圖片的。

圖1 九個(gè)候選框(anchor)示意圖

針對(duì)該像素點(diǎn)的每個(gè)候選框需要判斷其是不是目標(biāo)區(qū)域,如果是目標(biāo)區(qū)域,其邊框位置如何確定,具體過程如圖2所示,在RPN頭部 ,通過以下結(jié)構(gòu)生成 k個(gè)anchor。

圖 2 RPN 過程示意圖

如圖2所示,針對(duì)特征圖中的某一個(gè)位置的像素點(diǎn),對(duì)應(yīng)會(huì)有9個(gè)候選框。因?yàn)檩斎隦PN中有256個(gè)通道的特征圖,所以要同時(shí)對(duì)每個(gè)通道該位置的像素點(diǎn)都使用不同的3×3的滑動(dòng)窗口進(jìn)行卷積,最后將所有通道得到的該位置像素點(diǎn)的卷積值都加起來,得到一個(gè)新的特征值,最終使用256組這樣的3×3的卷積核,就會(huì)得到一個(gè)新的256維的向量,這個(gè)256維的向量就是用來預(yù)測(cè)該位置的像素點(diǎn)的,該像素點(diǎn)對(duì)應(yīng)的9個(gè)候選框共享這256維向量。

256維向量后面對(duì)應(yīng)兩條分支,一條目標(biāo)和背景的二分類(classification),通過1×1×256×18的卷積核得到 2k 個(gè)分?jǐn)?shù),k等于候選框的個(gè)數(shù)9,表示這9個(gè)anchor是背景的score和anchor是目標(biāo)的score。如果候選框是目標(biāo)區(qū)域,就去判斷該目標(biāo)區(qū)域的候選框位置在哪,這個(gè)時(shí)候另一條分支就過1×1×256×36的卷積核得到4k個(gè)坐標(biāo),每個(gè)框包含4個(gè)坐標(biāo)(x,y,w,h),就是9個(gè)候選區(qū)域?qū)?yīng)的框應(yīng)該偏移的具體位置Δxcenter,Δycenter,Δwidth,Δheight。如果候選框不是目標(biāo)區(qū)域,就直接將該候選框去除掉,不再進(jìn)行后續(xù)位置信息的判斷操作。

分類分支

考察訓(xùn)練集中的每張圖像(含有人工標(biāo)定的gt box) 的所有anchor劃分正負(fù)樣本:

(1)對(duì)每個(gè)標(biāo)定的gt box區(qū)域,與其重疊比例最大的anchor記為正樣本,保證每個(gè)gt至少對(duì)應(yīng)一個(gè)正樣本anchor

(2)對(duì)(1)中剩余的anchor,如果其與某個(gè)標(biāo)定區(qū)域重疊比例大于0.7,記為正樣本(每個(gè)gt可能會(huì)對(duì)應(yīng)多個(gè)正樣本anchor。但每個(gè)正樣本anchor只可能對(duì)應(yīng)一個(gè)gt;如果其與任意一個(gè)標(biāo)定的重疊比例都小于0.3,記為負(fù)樣本。

回歸分支

x,y,w,h分別表示box的中心坐標(biāo)和寬高,x, x_a ,x分別表示predicted box, anchor box, and ground truth box (y,w,h同理)t_i表示predict box相對(duì)于anchor box的偏移,t_i表示ground true box相對(duì)于anchor box的偏移,學(xué)習(xí)目標(biāo)就是讓前者接近后者的值。

在 RPN中部,分類分支(cls)和邊框回歸分支(bbox reg)分別對(duì)這堆a(bǔ)nchor進(jìn)行各種計(jì)算。在RPN末端,通過對(duì)兩個(gè)分支的結(jié)果進(jìn)行匯總,來實(shí)現(xiàn)對(duì)anchor的初步篩除(先剔除越界的anchor,再根據(jù)cls結(jié)果通過非極大值抑制(NMS)算法去重)和初步偏移(根據(jù)bbox reg結(jié)果),此時(shí)輸出的都bbox改頭換面叫 Proposal 了

偏移公式如下。An就是anchor的框,pro就是最終得出回歸后的邊界框,到這里我們的proposals就選好了:

非極大值抑制(Non-maximum suppression)

由于anchor一般是有重疊的overlap,因此,相同object的proposals也存在重疊。為了解決重疊proposal問題,采用NMS算法處理:兩個(gè)proposal間IoU大于預(yù)設(shè)閾值,則丟棄score較低的proposal。

IoU閾值的預(yù)設(shè)需要謹(jǐn)慎處理,如果IoU值太小,可能丟失objects的一些 proposals;如果IoU值過大,可能會(huì)導(dǎo)致objects出現(xiàn)很多proposals。IoU典型值為0.6。

Proposal選擇

NMS處理后,根據(jù)sore對(duì)top N個(gè)proposals排序。在Faster R-CNN論文中 N=2000,其值也可以小一點(diǎn),如50,仍然能得到好的結(jié)果。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像處理
    +關(guān)注

    關(guān)注

    26

    文章

    1268

    瀏覽量

    56369
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7387

    瀏覽量

    88208
  • MAP
    MAP
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    15106
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AD 如何挖空Solid Region

    我用的AD17,用place-solid Region花了一大塊銅皮連接電源網(wǎng)絡(luò),直接覆蓋了幾個(gè)電容的焊盤,現(xiàn)在想把這些電容的焊盤做成熱焊盤的樣子,要不然焊接的時(shí)候散熱太快,但是沒有辦法用keep out和pour cutout來做挖空
    發(fā)表于 07-24 17:33

    OMAPL138的EDMA3中Global region和Shadow region的區(qū)別?

    通道了,我怕DSP端使用后對(duì)ARM端有干擾,影響系統(tǒng)的穩(wěn)定性和健壯性。其實(shí)對(duì)這部分內(nèi)容的理解我始終有點(diǎn)困惑,Global region區(qū)域的東西是不是對(duì)ARM和DSP都是可見的?Shadow
    發(fā)表于 06-21 10:08

    請(qǐng)問C6678的EDMA3中Global region和Shadow region有什么區(qū)別?

    各位好!EDMA3 userguide中提到EDMA3通道控制器被分為global region和shadow region兩種區(qū)域,二者都是用來限定特定programmer對(duì)該區(qū)域進(jìn)
    發(fā)表于 08-07 07:28

    請(qǐng)問RPN和RPIn pin有什么區(qū)別?

    看一下dsPIC33EP512MC806(64-TQFP)引腳圖,一些可重新映射的引腳稱為RPn(示例:RP99/RF3),而另一些稱為RPIn(示例:RPI60/RC12)。RPN和RPIn
    發(fā)表于 06-25 06:07

    什么是Active Networks

    什么是Active Networks  英文縮寫: Active Networks 中文譯名: 主動(dòng)網(wǎng)絡(luò) 分  類: 網(wǎng)
    發(fā)表于 02-22 09:50 ?903次閱讀

    什么是個(gè)人區(qū)域網(wǎng)(PAN)

    什么是個(gè)人區(qū)域網(wǎng)(PAN) 個(gè)人區(qū)域網(wǎng)絡(luò)是利用短距離、低功率無線傳輸技術(shù),配合Ad Hoc網(wǎng)路架構(gòu)(Ad Hoc networks) 連接居家環(huán)境之資訊家電、辦公室個(gè)人桌上型或手提電
    發(fā)表于 03-22 10:22 ?1.2w次閱讀

    無線個(gè)人區(qū)域網(wǎng)(WPAN)是什么意思

    無線個(gè)人區(qū)域網(wǎng)(WPAN)是什么意思 個(gè)人區(qū)域網(wǎng)絡(luò)是利用短距離、低功率無線傳輸技術(shù),配合Ad Hoc網(wǎng)路架構(gòu)(Ad Hoc networks) 連接居家環(huán)境之
    發(fā)表于 03-22 10:24 ?6951次閱讀

    深度卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)中的進(jìn)展

    , HyperNet, SDP-CRC, YOLO,G-CNN, SSD等越來越快速和準(zhǔn)確的目標(biāo)檢測(cè)方法?;?b class='flag-5'>Region Proposal的方法該類方法的基本思想是:先得到候選區(qū)域再對(duì)候選區(qū)
    發(fā)表于 11-16 01:41 ?5141次閱讀
    深度卷積神經(jīng)<b class='flag-5'>網(wǎng)絡(luò)</b>在目標(biāo)檢測(cè)中的進(jìn)展

    引入Mask R-CNN思想通過語義分割進(jìn)行任意形狀文本檢測(cè)與識(shí)別

    網(wǎng)絡(luò)架構(gòu)由四部分組成,骨干網(wǎng)feature pyramid network (FPN) ,文本候選區(qū)域生成網(wǎng)絡(luò)region proposal
    的頭像 發(fā)表于 08-07 14:24 ?1.4w次閱讀

    引入錨框掩碼網(wǎng)絡(luò)機(jī)制的孿生RPN模型

    針對(duì)孿生區(qū)域候選網(wǎng)絡(luò)RPN)易受干擾且目標(biāo)丟失后無法跟蹤的問題,引人錨框掩碼網(wǎng)絡(luò)機(jī)制,設(shè)計(jì)種新型孿生R
    發(fā)表于 06-08 14:58 ?18次下載

    深度學(xué)習(xí)技術(shù)應(yīng)用于目標(biāo)視覺檢測(cè)時(shí)存在的困難和挑戰(zhàn)

    目標(biāo)視覺檢測(cè)的根本問題是估計(jì)特定類型目標(biāo)出現(xiàn)在圖像中的哪些位置.如圖 1所示, 目標(biāo)視覺檢測(cè)技術(shù)在流程上大致分為三個(gè)步驟:區(qū)域建議(Region proposal)、特征表示(Feature representation)和
    發(fā)表于 12-21 11:54 ?2351次閱讀

    SiamFC:用于目標(biāo)跟蹤的全卷積孿生網(wǎng)絡(luò) fully-convolutional siamese networks for object tracking

    原文鏈接 SiamFC網(wǎng)絡(luò) 圖中z代表的是模板圖像,算法中使用的是第一幀的ground truth;x代表的是search region,代表在后面的待跟蹤幀中的候選框搜索區(qū)域;?代表
    的頭像 發(fā)表于 01-11 17:35 ?1240次閱讀
    SiamFC:用于目標(biāo)跟蹤的全卷積孿生<b class='flag-5'>網(wǎng)絡(luò)</b> fully-convolutional siamese <b class='flag-5'>networks</b> for object tracking

    SiamRPN:High Performance Visual Tracking with Siamese Region Proposal Network 孿生網(wǎng)絡(luò)

    Siamese-RPN,它能夠利用大尺度的圖像對(duì)離線端到端訓(xùn)練。具體來講,這個(gè)結(jié)構(gòu)包含用于特征提取的 孿生子網(wǎng)絡(luò) (Siamese subnetwork)和 候選區(qū)域生成網(wǎng)絡(luò)
    的頭像 發(fā)表于 01-11 17:41 ?950次閱讀
    SiamRPN:High Performance Visual Tracking with Siamese <b class='flag-5'>Region</b> <b class='flag-5'>Proposal</b> Network 孿生<b class='flag-5'>網(wǎng)絡(luò)</b>

    GA-RPNRegion Proposal by Guided Anchoring 引導(dǎo)錨點(diǎn)的建議區(qū)域網(wǎng)絡(luò)

    Detection Toolbox and Benchmark 1.RPN RPNRegion Proposal Network,是用RON來選擇感興趣
    的頭像 發(fā)表于 01-12 09:32 ?639次閱讀
    GA-<b class='flag-5'>RPN</b>:<b class='flag-5'>Region</b> <b class='flag-5'>Proposal</b> by Guided Anchoring 引導(dǎo)錨點(diǎn)的建議<b class='flag-5'>區(qū)域</b><b class='flag-5'>網(wǎng)絡(luò)</b>

    Palo Alto Networks與IBM攜手,深化網(wǎng)絡(luò)安全合作

    網(wǎng)絡(luò)安全領(lǐng)域的兩大巨頭Palo Alto Networks和IBM近日宣布建立全面合作伙伴關(guān)系,共同推動(dòng)網(wǎng)絡(luò)安全領(lǐng)域的創(chuàng)新發(fā)展。根據(jù)協(xié)議,Palo Alto Networks將收購IB
    的頭像 發(fā)表于 05-22 09:40 ?418次閱讀