0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于反向傳播PnP優(yōu)化的端到端可學(xué)習(xí)幾何視覺(jué)介紹

3D視覺(jué)工坊 ? 來(lái)源:泡泡機(jī)器人SLAM ? 2023-02-06 16:46 ? 次閱讀

摘要

深度網(wǎng)絡(luò)在從大量數(shù)據(jù)中學(xué)習(xí)模式方面表現(xiàn)出色。另一方面,許多幾何視覺(jué)任務(wù)被指定為優(yōu)化問(wèn)題。

為了將深度學(xué)習(xí)和幾何視覺(jué)無(wú)縫地結(jié)合起來(lái),至關(guān)重要的是進(jìn)行端到端的學(xué)習(xí)和幾何優(yōu)化。

為了實(shí)現(xiàn)這一目標(biāo),我們提出了BPnP,這是一個(gè)新穎的網(wǎng)絡(luò)模塊,通過(guò)Perspective-nPoints(PnP)求解器反向傳播梯度,以指導(dǎo)神經(jīng)網(wǎng)絡(luò)參數(shù)更新。

基于隱式微分,我們表明一個(gè) "獨(dú)立的 "PnP求解器的梯度可以被準(zhǔn)確有效地導(dǎo)出,就像優(yōu)化器塊是一個(gè)可微分的函數(shù)。

我們通過(guò)將BPnP納入一個(gè)深度模型來(lái)驗(yàn)證它,該模型可以從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)相機(jī)的內(nèi)在因素、相機(jī)的外在因素(姿勢(shì))和三維結(jié)構(gòu)。

此外,我們開(kāi)發(fā)了一個(gè)用于物體姿勢(shì)估計(jì)的端到端可訓(xùn)練管道,該管道通過(guò)將基于特征的熱圖損失與二維-三維重投影誤差相結(jié)合,實(shí)現(xiàn)了更高的準(zhǔn)確性。

由于我們的方法可以擴(kuò)展到其他優(yōu)化問(wèn)題,我們的工作有助于以一種原則性的方式實(shí)現(xiàn)可學(xué)習(xí)的幾何視覺(jué)。

主要貢獻(xiàn)

我們的主要貢獻(xiàn)是一個(gè)名為BPnP的新型網(wǎng)絡(luò)模塊,它包含了一個(gè)PnP求解器。BPnP通過(guò)PnP "層 "反向傳播梯度,以指導(dǎo)神經(jīng)網(wǎng)絡(luò)權(quán)重的更新,從而利用既定的目標(biāo)函數(shù)(二維-三維重投影誤差的平方和)和幾何視覺(jué)問(wèn)題的求解器實(shí)現(xiàn)端到端的學(xué)習(xí)。

盡管只結(jié)合了一個(gè)PnP求解器,我們展示了BPnP如何被用來(lái)學(xué)習(xí)有效的深度特征表征,用于多種幾何視覺(jué)任務(wù)(姿勢(shì)估計(jì)、運(yùn)動(dòng)結(jié)構(gòu)、相機(jī)校準(zhǔn))。

我們還將我們的方法與最先進(jìn)的幾何視覺(jué)任務(wù)的方法進(jìn)行比較。從根本上說(shuō),我們的方法是基于隱式微分的。

主要方法

反向傳播的PnP算法: 讓g表示一個(gè) "函數(shù) "形式的PnP求解器

7e1ebcc0-a402-11ed-bfe3-dac502259ad0.png

從n個(gè)2D-3D的對(duì)應(yīng)關(guān)系中返回?cái)z像機(jī)的6DOF姿態(tài)y和其內(nèi)部參數(shù)K∈R3×3

7e4a7a40-a402-11ed-bfe3-dac502259ad0.png

其中(xi , zi)是第i個(gè)對(duì)應(yīng)關(guān)系。讓?duì)?-|y, K)是三維點(diǎn)在圖像平面上的投影變換,姿態(tài)為y,相機(jī)本征為K。

從本質(zhì)上講,g的 "評(píng)估 "需要解決優(yōu)化問(wèn)題如下:

7e66062a-a402-11ed-bfe3-dac502259ad0.png

7e926062-a402-11ed-bfe3-dac502259ad0.png

ri表示第i對(duì)對(duì)應(yīng)關(guān)系的重投影誤差。

7ea00474-a402-11ed-bfe3-dac502259ad0.png

πi是三維點(diǎn)zi在圖像平面上的投影。

我們的最終目標(biāo)是將g納入一個(gè)可學(xué)習(xí)的模型中,其中x、z和K可以是一個(gè)深度網(wǎng)絡(luò)的(中間)輸出。此外,公式(4)的求解器應(yīng)該被用來(lái)參與網(wǎng)絡(luò)參數(shù)的學(xué)習(xí)。為此,我們需要把g當(dāng)作一個(gè)可微調(diào)的函數(shù),這樣它的"梯度 "就可以反向傳播到網(wǎng)絡(luò)的其他部分。接下來(lái)我們將詳細(xì)介紹如何對(duì)反向傳播的梯度進(jìn)行計(jì)算。

1. 隱式函數(shù)定理(IFT) 這里簡(jiǎn)單公式推導(dǎo)了IFT隱式函數(shù)定理。

7eaeabb4-a402-11ed-bfe3-dac502259ad0.png

7edbe502-a402-11ed-bfe3-dac502259ad0.png

7f04826e-a402-11ed-bfe3-dac502259ad0.png

IFT允許計(jì)算一個(gè)函數(shù)g相對(duì)于其輸入a的導(dǎo)數(shù),而不需要函數(shù)的明確形式,但有一個(gè)函數(shù)f約束a和g(a)。

2. 構(gòu)造約束函數(shù)f

為了調(diào)用隱式微分的IFT,我們首先需要定義約束函數(shù)f(a, b)。對(duì)于我們的問(wèn)題,我們使用所有四個(gè)變量x、y、z和K來(lái)構(gòu)造f。

但我們將f視為一個(gè)雙變量函數(shù)f(a, b),其中a在{x, z, K}中取值--取決于要得到的偏導(dǎo)--而b=y(即g的輸出姿勢(shì))。

為了維護(hù)約束函數(shù)f(a,b),我們利用了優(yōu)化過(guò)程的靜止約束。

在這里,將PnP求解器的目標(biāo)函數(shù)g表示為:

7f12e598-a402-11ed-bfe3-dac502259ad0.png

由于PnP求解器的輸出姿態(tài)y是目標(biāo)函數(shù)的局部最優(yōu),所以可以通過(guò)對(duì)目標(biāo)的一階導(dǎo)數(shù)與y的關(guān)系來(lái)建立一個(gè)靜止約束,即:

7f384cde-a402-11ed-bfe3-dac502259ad0.png

給出一個(gè)PnP求解器的輸出姿勢(shì)y = [y1, ..., ym] T,我們構(gòu)建f,可以寫(xiě)為:

7f641742-a402-11ed-bfe3-dac502259ad0.png

7f963ce0-a402-11ed-bfe3-dac502259ad0.png

3. 前向和反向傳播

我們對(duì)g的PnP公式基本上是執(zhí)行最小二乘法(LS)估計(jì),這對(duì)離群值(x、z和K的惡劣誤差)并不穩(wěn)健。

另外,我們可以采用一個(gè)更穩(wěn)健的目標(biāo),如加入M-估計(jì)器[56]或使離群值的數(shù)量最大化[15]。

然而,我們的結(jié)果表明,LS實(shí)際上更合適,因?yàn)樗鼘?duì)輸入測(cè)量中的誤差的敏感性鼓勵(lì)學(xué)習(xí)快速收斂到不產(chǎn)生x、z和K中的異常值的參數(shù)。

相反,一個(gè)穩(wěn)健的目標(biāo)會(huì)阻止異常值的誤差信號(hào),導(dǎo)致學(xué)習(xí)過(guò)程不穩(wěn)定。

鑒于(4),解算器的選擇仍然存在。

為了進(jìn)行隱式微分,我們不需要精確地解決(4),因?yàn)閏ij只是(4)的靜止條件,任何局部最小值都能滿(mǎn)足。

為此,我們采用Levenberg-Marquardt(LM)算法,該算法保證了局部收斂。

作為一種迭代算法,LM在求解(4)時(shí)需要初始化y(0)。

我們通過(guò)將(1)重寫(xiě)為:"(1)"來(lái)明確這種依賴(lài)關(guān)系:

7fd1889a-a402-11ed-bfe3-dac502259ad0.png

在反向傳播中,我們首先構(gòu)建f,然后得到g相對(duì)于其每個(gè)輸入的雅可比系數(shù),即:

800098a6-a402-11ed-bfe3-dac502259ad0.png

給出輸出梯度,BPnP返回輸入梯度:

80179bd2-a402-11ed-bfe3-dac502259ad0.png

算法流程如下圖所示:

802578b0-a402-11ed-bfe3-dac502259ad0.png

主要結(jié)果:

805896b4-a402-11ed-bfe3-dac502259ad0.png80e32fae-a402-11ed-bfe3-dac502259ad0.png812bd664-a402-11ed-bfe3-dac502259ad0.png








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:BPnP:基于反向傳播PnP優(yōu)化的端到端可學(xué)習(xí)幾何視覺(jué)

文章出處:【微信號(hào):3D視覺(jué)工坊,微信公眾號(hào):3D視覺(jué)工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于WiMAX接入技術(shù)的網(wǎng)絡(luò)架構(gòu)

    基于WiMAX接入技術(shù)的網(wǎng)絡(luò)架構(gòu) 本文首先分析了WiMAX技術(shù)的市場(chǎng)驅(qū)動(dòng)力和影響其成功部署的關(guān)鍵因素,隨后介紹了一個(gè)基于WiMAX接入技術(shù)的
    發(fā)表于 10-20 21:03 ?718次閱讀

    物聯(lián)網(wǎng)解決方案

    英特爾打造核心技術(shù)物聯(lián)網(wǎng)解決方案
    發(fā)表于 12-28 18:12 ?0次下載

    反向傳播算法的工作原理

    反向傳播算法(BP算法)是目前用來(lái)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)的最常用且最有效的算法。作為谷歌機(jī)器學(xué)習(xí)速成課程的配套材料,谷歌推出一個(gè)演示網(wǎng)站,直觀地介紹
    的頭像 發(fā)表于 07-02 16:01 ?9962次閱讀
    <b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法的工作原理

    深讀解析反向傳播算法在解決模型優(yōu)化問(wèn)題的方面應(yīng)用

    反向傳播算法隸屬于深度學(xué)習(xí),它在解決模型優(yōu)化問(wèn)題的方面有著重要的地位。
    的頭像 發(fā)表于 11-01 15:48 ?5475次閱讀
    深讀解析<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法在解決模型<b class='flag-5'>優(yōu)化</b>問(wèn)題的方面應(yīng)用

    的自動(dòng)駕駛研發(fā)系統(tǒng)介紹

    Nvidia是比較早做控制車(chē)輛工作的公司,其方法訓(xùn)練CNN模型完成從單個(gè)前向攝像頭的圖像像素車(chē)輛控制的映射。 其系統(tǒng)自動(dòng)學(xué)習(xí)一些處理
    的頭像 發(fā)表于 07-13 09:30 ?4768次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自動(dòng)駕駛研發(fā)系統(tǒng)<b class='flag-5'>介紹</b>

    基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法

    人工設(shè)計(jì)的算法分別進(jìn)行優(yōu)化近年來(lái),基于深度神經(jīng)網(wǎng)絡(luò)的圖像壓縮方法在圖像壓縮中取得了豐碩的成果,相比傳統(tǒng)方法,
    發(fā)表于 04-08 09:30 ?16次下載
    基于深度神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像壓縮方法

    基于生成式對(duì)抗網(wǎng)絡(luò)的圖像去霧模型

    圖像中霧的特征;其次,采用殘差學(xué)習(xí)思想直接從退化圖像中學(xué)習(xí)清晣圖像的特征,實(shí)現(xiàn)的去霧;最
    發(fā)表于 04-12 15:03 ?20次下載
    基于生成式對(duì)抗網(wǎng)絡(luò)的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像去霧模型

    的IO鏈接解決方案

    的IO鏈接解決方案
    發(fā)表于 05-10 10:43 ?1次下載
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的IO鏈接解決方案

    結(jié)合深度學(xué)習(xí)的自編碼器物理層優(yōu)化方案

    碼器物理層優(yōu)化方案。通過(guò)兩階段訓(xùn)練模式提髙神經(jīng)網(wǎng)絡(luò)的泛化性,同時(shí)利用自編碼器壓縮特性量化信道狀態(tài)信息(CSI)并進(jìn)行重建,降低CSI反饋導(dǎo)致的系統(tǒng)開(kāi)銷(xiāo)。仿真結(jié)果表明,該方案通過(guò)分
    發(fā)表于 05-24 15:18 ?7次下載

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡(luò)介紹及公式推導(dǎo)

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡(luò)介紹及公式推導(dǎo)(電源和地電氣安全間距)-該文檔為BP(BackPropagation)反向傳播
    發(fā)表于 07-26 10:31 ?48次下載
    BP(BackPropagation)<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>介紹</b>及公式推導(dǎo)

    一種對(duì)紅細(xì)胞和白細(xì)胞圖像分類(lèi)任務(wù)的主動(dòng)學(xué)習(xí)工作流程

    細(xì)胞成像的分割和分類(lèi)等技術(shù)是一個(gè)快速發(fā)展的領(lǐng)域研究。就像在其他機(jī)器學(xué)習(xí)領(lǐng)域一樣,數(shù)據(jù)的標(biāo)注是非常昂貴的,并且對(duì)于數(shù)據(jù)標(biāo)注的質(zhì)量要求也非常的高。針對(duì)這一問(wèn)題,本篇文章介紹一種對(duì)紅細(xì)胞和白細(xì)胞圖像分類(lèi)任務(wù)的主動(dòng)學(xué)習(xí)
    的頭像 發(fā)表于 08-13 10:27 ?1085次閱讀

    構(gòu)建的流程體系

    所謂流程的架構(gòu)體系,就是一套有層次的流程管理體系。這種層次體現(xiàn)在由上至下、由整體
    的頭像 發(fā)表于 06-01 15:09 ?1749次閱讀
    構(gòu)建<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的流程體系

    神經(jīng)網(wǎng)絡(luò)前向傳播反向傳播區(qū)別

    神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)模型,廣泛應(yīng)用于各種領(lǐng)域,如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等。神經(jīng)網(wǎng)絡(luò)的核心是前向傳播反向傳播算法。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-02 14:18 ?355次閱讀

    神經(jīng)網(wǎng)絡(luò)反向傳播算法的優(yōu)缺點(diǎn)有哪些

    神經(jīng)網(wǎng)絡(luò)反向傳播算法(Backpropagation Algorithm)是一種廣泛應(yīng)用于深度學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)化算法,用于訓(xùn)練多層前饋
    的頭像 發(fā)表于 07-03 11:24 ?324次閱讀

    測(cè)試用例怎么寫(xiě)

    編寫(xiě)測(cè)試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個(gè)詳細(xì)的指南,介紹如何編寫(xiě)
    的頭像 發(fā)表于 09-20 10:29 ?70次閱讀