0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種基于NeRF的六自由度姿態(tài)估計方法

3D視覺工坊 ? 來源:計算機視覺工坊 ? 作者:一杯紅茶 ? 2022-11-21 10:07 ? 次閱讀

主要內(nèi)容: 提出了一種基于NeRF的六自由度姿態(tài)估計方法,即當給定單個RGB查詢圖像時通過最小化NeRF模型渲染的圖像像素與查詢圖像中的像素之間的殘差來估計相機的平移和旋轉(zhuǎn)。

算法基于動量的相機外參優(yōu)化算法集成到Instant Neural Graphics Primitives(一種最近非??焖俚腘eRF實現(xiàn),也是NVIDIA提出的),通過在姿態(tài)估計任務(wù)中引入并行蒙特卡羅采樣來克服問題總是收斂到局部極小值的問題,論文還研究了不同的基于像素的損失函數(shù)減少誤差的程度,最終的實驗也表明其方法可以在合成基準和真實基準上實現(xiàn)較好的泛化和魯棒性

Nerf(Neural Radiance Fields):神經(jīng)輻射場,它提供了一種僅從一個或幾個RGB圖像中捕獲復雜3D和光學結(jié)構(gòu)的機制,Nerf為在訓練或測試期間在沒有網(wǎng)格模型的情況下將合成-分析應(yīng)用到更廣泛的現(xiàn)實場景提供了機會,NeRF將場景的密度和顏色參數(shù)化為3D場景坐標的函數(shù),該函數(shù)既可以從給定相機姿態(tài)的多視圖圖像中學習,也可以給定一個或幾個輸入圖像通過生成模型直接預測。

Instant NGP:其提出是用來降低Nerf的訓練和推理代價,采用由可訓練的特征向量的多分辨率哈希表增強的小神經(jīng)網(wǎng)絡(luò),允許網(wǎng)絡(luò)消除哈希沖突的歧義,使其易于在GPU上并行化,實現(xiàn)了幾個數(shù)量級的組合加速,允許在在線訓練和推理等時間受限的環(huán)境中使用

出發(fā)點: 將Nerf用在姿態(tài)估計任務(wù)中的第一篇工作則是inerf,即反轉(zhuǎn)Nerf,此論文基于inerf,進一步探索了Nerf在姿態(tài)估計任務(wù)中的應(yīng)用,普遍認為NeRF的一個缺點是其計算開銷很大,為了克服這一限制,本文利用了他們之前提出的快速NeRF,即即時神經(jīng)圖形原件(Instant NGP),Instant NGP的結(jié)構(gòu)允許并行優(yōu)化,這可以用來克服局部最小值問題,從而實現(xiàn)比iNeRF更大的魯棒性。 Inerf:假設(shè)已經(jīng)得到了權(quán)重θ參數(shù)化的NeRF模型,并且相機內(nèi)參已知,iNeRF旨在恢復查詢圖像I的相機姿態(tài)T

d6316d28-6928-11ed-8abf-dac502259ad0.png

Contributions:

提出了一種基于NeRF模型的估計6-DoF姿態(tài)方法。

將并行蒙特卡羅采樣引入到姿態(tài)估計任務(wù)中,展示了基于像素的損失函數(shù)選擇對魯棒性的重要性

通過合成和真實世界基準進行定量演示,證明所提出的方法改進了泛化和魯棒性

Pipeline:

d641ca60-6928-11ed-8abf-dac502259ad0.png

三個輸入:單個RGB圖像、初始粗略姿態(tài)估計(通過向真值添加干擾得到)以及從目標的多個視圖中訓練的即時NGP模型。

基于動量的相機外參優(yōu)化:

相對于標準Nerf,對相機姿態(tài)和梯度表示進行了修改,允許梯度更新的動態(tài)性結(jié)合基于動量的方法來增強優(yōu)化。

首先,相機姿態(tài)由平移分量(位置)和旋轉(zhuǎn)分量(方向)組成,通常由特殊歐式群建模,即SE(3),NeRF中外參優(yōu)化的目標是找到那些通過梯度下降將圖像空間損失最小化的相機姿態(tài),梯度更新在特殊的歐式群上的李代數(shù)se(3)中計算,然后生成結(jié)合旋轉(zhuǎn)和平移的相機姿態(tài)更新,作者認為使用SE(3)/se3表示有一個缺點,即相機姿勢更新的旋轉(zhuǎn)中心不在相機原點,而是在旋轉(zhuǎn)軸上,這將相機位置和方向耦合起來,這種耦合導致某些情況下次優(yōu)梯度更新,如下圖所示,

d678081e-6928-11ed-8abf-dac502259ad0.png

為了解耦平移和旋轉(zhuǎn)更新,作者將相機姿態(tài)建模為笛卡爾積SO(3)×T(3)(以及相應(yīng)的李代數(shù)空間上so(3)×t(3)),其在T(3)上采用加法結(jié)構(gòu),在SO(3)上采用乘積結(jié)構(gòu),梯度更新將沿直線移動,從而實現(xiàn)更高效的優(yōu)化。

其次,基于動量的優(yōu)化在經(jīng)驗上證明了比基于標準梯度的方法更有效,尤其是當與自適應(yīng)更新相結(jié)合時,在NeRF中每個像素對應(yīng)于具有原點o和方向d的射線,沿著該射線,基于沿射線的移動距離ti得到pi=o+ti.d,損失的梯度與相機距離的叉積定義了每像素(光線)更新影響:

d69a3628-6928-11ed-8abf-dac502259ad0.png

基于剛體力學,對上式有一種物理解釋,即由外力對相機產(chǎn)生的一個扭矩,該外力由基于圖像的損失函數(shù)梯度產(chǎn)生,應(yīng)用于光線導出點,就像它剛性地連接到相機一樣。

因此將此分解應(yīng)用于Adam優(yōu)化器,將Adam的第一個moment轉(zhuǎn)化為相機的物理動量,因為相機被用作力矩的梯度“推動”,盡管Adam的第二moment和指數(shù)衰減沒有直接的物理類似物,由于物理系統(tǒng)遵循最小動作路徑,可以推斷相機在解耦參數(shù)化中遵循從其初始姿態(tài)到其優(yōu)化姿態(tài)的有效路徑。

并行蒙特卡洛采樣: 由于優(yōu)化的損失函數(shù)在6-DoF空間上是非凸的,單相機姿態(tài)假設(shè)很容易陷入局部極小值,由于Instant NGP的計算能力能夠同時從多個假設(shè)開始優(yōu)化,但是一個簡單的多起點思想是低效的,特別是在一個大的搜索空間中,其中許多假設(shè)在優(yōu)化過程中會偏離,因此它們無法對最終優(yōu)化做出貢獻,且占用了大量計算資源,從粒子濾波框架中獲得靈感,提出了一種簡單有效的姿勢假設(shè)更新策略來處理這個問題。

將優(yōu)化過程分為兩個階段,自由探索和重采樣更新。 在第一階段,圍繞起始姿態(tài)生成相機姿態(tài)假設(shè),平移和旋轉(zhuǎn)偏移分別在歐式空間和SO(3)中均勻采樣,相機姿態(tài)假設(shè)將進行獨立優(yōu)化,這樣其中一些可以相對接近實際情況。 之后第二階段,比較所有假設(shè)的損失,并將其作為采樣權(quán)重的參考。

不同損失函數(shù)的影響: 通過合成視圖進行姿態(tài)估計的方法最大挑戰(zhàn)之一是與原視圖相比,視圖材質(zhì)具有不同的視覺表面,包括許多干擾、環(huán)境噪聲、照明條件變化和遮擋等都可能導致這個問題。

之前inerf使用L2損失,但作者研究了更多的損失選項以測量渲染像素和觀察像素之間的差異,不同的損失具有不同的收斂特性,進而影響優(yōu)化過程

研究了L1(平等的對待error)、L2(懲罰較大的error,寬容較小的error)、Log L1(是L1損耗的對數(shù)版本,它試圖平滑收斂曲線,尤其是對于較大的誤差)、Relative L2(它對高強度目標像素與低強度目標像素錯位的情況更敏感)、MAPE(MAPE表示平均絕對百分比誤差,作為基于誤差相對百分比的精度度量,它也可以被視為相對L2損耗的L1等效值,它與規(guī)模無關(guān),對負錯誤的懲罰更重)、sMAPE(是MAPE的對稱版本,解決MAPE的不對稱問題,但當預測和GT都具有低強度時,它可能是不穩(wěn)定的)、Smooth L1(平滑L1損失被設(shè)計為對異常值不太敏感,并且可以防止梯度爆炸)

最終通過實驗發(fā)現(xiàn)常用的L2損失未必是最好的,MAPE在其數(shù)據(jù)集測試上實現(xiàn)了最好的性能。

實驗: 在Nerf合成數(shù)據(jù)集和真實數(shù)據(jù)集LLFF與inerf進行了比較

d6b84e60-6928-11ed-8abf-dac502259ad0.pngd6d94c1e-6928-11ed-8abf-dac502259ad0.png

不同損失函數(shù)對結(jié)果性能的比較:

d6ec3e5a-6928-11ed-8abf-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4749

    瀏覽量

    100434
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    797

    瀏覽量

    58342
  • NGP
    NGP
    +關(guān)注

    關(guān)注

    0

    文章

    12

    瀏覽量

    6667

原文標題:并行Nerf逆過程解決姿態(tài)估計問題?。ˋrxiv 2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DSP在自由度電磁跟蹤系統(tǒng)中的應(yīng)用

    自由度電磁跟蹤系統(tǒng)根據(jù)電磁感應(yīng)的原理來計算出目標的自由度參數(shù),從而唯確定目標的位置和姿態(tài)
    發(fā)表于 01-25 00:11 ?1288次閱讀
    DSP在<b class='flag-5'>六</b><b class='flag-5'>自由度</b>電磁跟蹤系統(tǒng)中的應(yīng)用

    基于FPGA EtherCAT的自由度機器人視覺伺服控制設(shè)計

    和增強系統(tǒng)處理圖像的實時性,本文提出了一種伊瑟特的自由度機器人視覺伺服控制系統(tǒng),將攝像頭集成到基于 Zynq的伊瑟特主站上,提高了視覺伺服的實時性.經(jīng)測試,該平臺能夠?qū)σ曈X檢測目標的變化做出及時的反應(yīng)
    發(fā)表于 05-29 16:17

    基于STM32、以太網(wǎng)、Labview的自由度Stewart并聯(lián)運動平臺模型

    自由度Stewart并聯(lián)運動平臺模型-X,Y,Z平移、旋轉(zhuǎn)測試自由度Stewart并聯(lián)運動平臺-Z向旋轉(zhuǎn)正弦波復現(xiàn)
    發(fā)表于 04-16 23:25

    關(guān)于自由度座椅的控制

    最近在參與自由度座椅控制的課題,需要查閱哪些方面的相關(guān)書籍,有什么推薦嗎?謝謝各位
    發(fā)表于 01-13 14:46

    一種改進的單神經(jīng)元二自由度PID控制

    提出一種單神經(jīng)元二自由度PID 控制方法,將前饋型二自由度PID 的五個參數(shù)分別對應(yīng)于單神經(jīng)元的五個權(quán)值,將二次型性能指標Pe2 (k) + QΔu 2 (k)作為控制算法中加權(quán)系數(shù)學
    發(fā)表于 08-27 08:35 ?11次下載

    基于單親遺傳算法二自由度PID控制器設(shè)計

    針對二自由度PID 控制器參數(shù)整定困難的問題,提出了一種基于單親遺傳算法的二自由度參數(shù)整定方法。運用該算法分別對單自由度PID 控制器和二
    發(fā)表于 12-26 13:56 ?23次下載

    自由度內(nèi)??刂?b class='flag-5'>方法

    針對典型的工業(yè)過程控制對象,提出了一種自由度內(nèi)模控制方法,此方法可以使系統(tǒng)同時具有良好的目標值跟蹤特性、干擾抑制特性和魯棒性,改進了常規(guī)內(nèi)??刂频牟蛔?而且控制算法簡
    發(fā)表于 05-23 15:12 ?27次下載
    二<b class='flag-5'>自由度</b>內(nèi)??刂?b class='flag-5'>方法</b>

    自由度轉(zhuǎn)臺的設(shè)計與實現(xiàn)

    基于MSP430F149單片機設(shè)計了一種自由度轉(zhuǎn)臺系統(tǒng)。在該系統(tǒng)中,利用旋轉(zhuǎn)編碼器的信息反饋,通過對電機的閉環(huán)控制,使三自由度轉(zhuǎn)臺能夠模擬飛機的飛行姿態(tài)
    發(fā)表于 09-26 13:58 ?2525次閱讀
    三<b class='flag-5'>自由度</b>轉(zhuǎn)臺的設(shè)計與實現(xiàn)

    一種新型7自由度冗余繩驅(qū)動機械臂

    針對傳統(tǒng)機械臂負載白重比小、臂身慣量大、人機交互安全性弱等問題,對繩驅(qū)動機械臂的結(jié)構(gòu)、繩驅(qū)關(guān)節(jié)耦合、冗余運動學等方面進行了研究,創(chuàng)新設(shè)計了一種新型7自由度冗余繩驅(qū)動機械臂。采用繩索間接驅(qū)動前端4個
    發(fā)表于 02-27 14:33 ?7次下載
    <b class='flag-5'>一種</b>新型7<b class='flag-5'>自由度</b>冗余繩驅(qū)動機械臂

    一種基于自由度IMU和動力學的車身姿態(tài)和側(cè)向速度估計方法

    如前文所述,本文建立了三個估計器,在小側(cè)向激勵工況下,可通過基于動力學模型的估計估計出側(cè)向車速,進步使用該側(cè)向車速估計出由于平動產(chǎn)生的側(cè)
    的頭像 發(fā)表于 07-31 14:26 ?1w次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>六</b><b class='flag-5'>自由度</b>IMU和動力學的車身<b class='flag-5'>姿態(tài)</b>和側(cè)向速度<b class='flag-5'>估計</b><b class='flag-5'>方法</b>

    磁致伸縮位移傳感器在自由度運動平臺上的應(yīng)用解析

    自由度運動平臺是典型的并聯(lián)運動機構(gòu),由支作動筒,上、下各只萬向鉸鏈和上、下兩個平臺組成,下平臺固定在基礎(chǔ)上,借助支作動筒的伸縮運動,
    發(fā)表于 03-07 16:54 ?1469次閱讀

    ADIS16495:戰(zhàn)術(shù)級自由度慣性傳感器數(shù)據(jù)表

    ADIS16495:戰(zhàn)術(shù)級自由度慣性傳感器數(shù)據(jù)表
    發(fā)表于 05-25 18:04 ?9次下載
    ADIS16495:戰(zhàn)術(shù)級<b class='flag-5'>六</b><b class='flag-5'>自由度</b>慣性傳感器數(shù)據(jù)表

    自由度視覺定位

    基于三維模型的視覺定位通過在查詢圖像和三維模型間建立 2D-3D 對應(yīng)關(guān)系,估計相機自由度的位姿。傳統(tǒng)的視覺定位方法通常采用人工設(shè)計的局部特征,如 SIFT,來實現(xiàn) 2D-3D 匹配
    的頭像 發(fā)表于 04-20 10:07 ?1080次閱讀

    自由度激光跟蹤儀的特點

    GTS6000激光跟蹤儀與空間姿態(tài)探頭配合組成自由度激光跟蹤儀,能夠根據(jù)合作目標的精確空間姿態(tài)對被測工件的內(nèi)部特征、隱藏特征或曲面等復雜特征進行快速、高精度的測量。
    的頭像 發(fā)表于 07-21 10:58 ?667次閱讀
    <b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟蹤儀的特點

    文讀懂自由度激光跟蹤儀

    激光跟蹤儀與空間姿態(tài)探頭(iProbe 6D姿態(tài)探頭)配合使用,就組成自由度激光跟蹤儀。它能夠根據(jù)合作目標的精確空間姿態(tài)對被測工件的內(nèi)部特
    的頭像 發(fā)表于 12-12 09:39 ?683次閱讀
    <b class='flag-5'>一</b>文讀懂<b class='flag-5'>六</b><b class='flag-5'>自由度</b>激光跟蹤儀