0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-19 09:58 ? 次閱讀

0. 筆者個人體會

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose,是一個用于 6D 姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像,F(xiàn)oundationPose就可以在測試時立即應(yīng)用于新物體,無需任何微調(diào),關(guān)鍵是各項(xiàng)指標(biāo)明顯優(yōu)于專為每個任務(wù)設(shè)計(jì)的SOTA方案。

下面一起來閱讀一下這項(xiàng)工作,文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實(shí)現(xiàn)了新物體的6D姿態(tài)估計(jì)和跟蹤,支持基于模型和無模型設(shè)置。在這四個任務(wù)中的每一個上,F(xiàn)oundationPose都優(yōu)于專用任務(wù)的SOTA方案。(·表示僅RGB,×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計(jì)方法:算法梳理與代碼實(shí)現(xiàn)》。

adfd5652-9dfa-11ee-8b88-92fbcf53809c.jpg

2. 具體原理是什么?

為減少大規(guī)模訓(xùn)練的人工工作,F(xiàn)oundationPose利用3D模型數(shù)據(jù)庫、大型語言模型和擴(kuò)散模型等新技術(shù),開發(fā)了一種新的合成數(shù)據(jù)生成Pipeline。為了彌補(bǔ)無模型和基于模型的設(shè)置之間的差距,F(xiàn)oundationPose利用以對象為中心的神經(jīng)場來進(jìn)行隨后的渲染和新視圖RGBD渲染。

對于姿態(tài)估計(jì),首先在物體周圍均勻地初始化全局姿態(tài),然后通過細(xì)化網(wǎng)絡(luò)對其進(jìn)行細(xì)化。最后將改進(jìn)的位姿轉(zhuǎn)發(fā)給姿態(tài)選擇模塊,預(yù)測位姿的分?jǐn)?shù),輸出得分最高的位姿。

ae1028e0-9dfa-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法對比如何?

YCB-Video數(shù)據(jù)集上Model-free方案的位姿估計(jì)定量結(jié)果對比。

ae219558-9dfa-11ee-8b88-92fbcf53809c.jpg

YCB-Video數(shù)據(jù)集上位姿跟蹤的定量對比。這里也推薦工坊推出的新課程《單目深度估計(jì)方法:算法梳理與代碼實(shí)現(xiàn)》。

ae35a2aa-9dfa-11ee-8b88-92fbcf53809c.jpg

對更多實(shí)驗(yàn)結(jié)果和文章細(xì)節(jié)感興趣的讀者,可以閱讀一下論文原文~

4. 論文信息

標(biāo)題:FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者:Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機(jī)構(gòu):NVIDIA

原文鏈接:https://arxiv.org/abs/2312.08344

代碼鏈接:https://github.com/NVlabs/FoundationPose








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4855

    瀏覽量

    102711
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    797

    瀏覽量

    58338

原文標(biāo)題:通用性超強(qiáng)!同時實(shí)現(xiàn)6D位姿估計(jì)和跟蹤!

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    光學(xué)跟蹤測量系統(tǒng)如何工作的

    、姿態(tài)等參數(shù),實(shí)現(xiàn)對目標(biāo)物體的精確跟蹤和測量。其工作原理主要包括以下幾個步驟: 光源發(fā)射:光學(xué)跟蹤測量系統(tǒng)首先需要光源,
    的頭像 發(fā)表于 08-29 17:26 ?482次閱讀

    意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實(shí)現(xiàn)精確姿態(tài)識別應(yīng)用

    憑借3核、6軸傳感架構(gòu),意法半導(dǎo)體新款MEMS IMU LSM6DSV32X能夠進(jìn)行卓越的邊緣計(jì)算處理,是智能手機(jī)的高精度感測和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態(tài)
    的頭像 發(fā)表于 08-01 10:15 ?691次閱讀

    包含具有多種類型信息的3D模型

    Desktop是3D建模CAD程序,用于多種繪圖和設(shè)計(jì),涵蓋建筑、土木和機(jī)械工程,以及室內(nèi)設(shè)計(jì)、產(chǎn)品設(shè)計(jì)、景觀建筑甚至游戲開發(fā)。它通常用于
    發(fā)表于 03-28 17:18

    國產(chǎn)6D激光跟蹤儀測量大尺寸空間姿態(tài)

    與普通CMM相比,激光跟蹤儀的特點(diǎn)是能夠測量大型測量目標(biāo)物。隨著工業(yè)制造的發(fā)展和智能化的要求,對精度和效率的需求越來越高。激光跟蹤儀具有的高精度、高速度、非接觸式測量等優(yōu)勢,可以滿足工業(yè)制造中對精確
    發(fā)表于 02-03 10:39 ?0次下載

    激光跟蹤儀|國產(chǎn)6D跟蹤儀測量大尺寸空間姿態(tài)

    激光跟蹤儀基于激光干涉和測距原理,能測量大型目標(biāo)物,具有高精度、高速度和非接觸式測量等優(yōu)勢。它在工業(yè)制造領(lǐng)域有廣泛應(yīng)用,如汽車制造和航空航天制造。技術(shù)創(chuàng)新與發(fā)展趨勢主要體現(xiàn)在精度和穩(wěn)定性提升、應(yīng)用領(lǐng)域擴(kuò)大、可靠性和穩(wěn)定性改進(jìn)以及自動化應(yīng)用推進(jìn)。
    的頭像 發(fā)表于 01-31 09:14 ?558次閱讀
    激光<b class='flag-5'>跟蹤</b>儀|國產(chǎn)<b class='flag-5'>6D</b><b class='flag-5'>跟蹤</b>儀測量大尺寸空間<b class='flag-5'>姿態(tài)</b>

    高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

    我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大
    的頭像 發(fā)表于 01-30 15:56 ?755次閱讀
    高分工作!Uni3<b class='flag-5'>D</b>:3<b class='flag-5'>D</b>基礎(chǔ)大<b class='flag-5'>模型</b>,刷新多個SOTA!

    【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

    這里主要還是感覺上期說的些對于人體姿態(tài)估計(jì)模型的前期調(diào)研,進(jìn)行后期的部署的些嘗試。下面主要
    發(fā)表于 01-22 10:46

    【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

    這里主要還是感覺上期說的些對于人體姿態(tài)估計(jì)模型的前期調(diào)研,進(jìn)行后期的部署的些嘗試。下面主要
    發(fā)表于 01-21 00:49

    【先楫HPM5361EVK開發(fā)板試用體驗(yàn)】06-基于MPU9250的姿態(tài)解算

    采用歐拉角、四元數(shù)或旋轉(zhuǎn)矩陣等方式來表示物體的姿態(tài),歐拉角會更加直觀點(diǎn)。 而歐拉角是用于描述物體在三維空間中姿態(tài)的表示方法,它通過三
    發(fā)表于 01-17 14:55

    陀螺儀LSM6DSV16X與AI集成(5)----6D方向檢測功能

    、4.Y軸反向旋轉(zhuǎn)、5.Z軸正向旋轉(zhuǎn)、6.Z軸反向旋轉(zhuǎn) 通過檢測陀螺儀在每個方向上的旋轉(zhuǎn),可以確定物體的旋轉(zhuǎn)姿態(tài)和方向,從而用于導(dǎo)航、飛行控制等應(yīng)用。
    的頭像 發(fā)表于 01-09 16:14 ?996次閱讀
    陀螺儀LSM<b class='flag-5'>6</b>DSV16X與AI集成(5)----<b class='flag-5'>6D</b>方向檢測功能

    使用愛芯派Pro開發(fā)板部署人體姿態(tài)估計(jì)模型

    部署模型的整體架構(gòu)。接下來就回到最開始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對些輕量化人體姿態(tài)
    的頭像 發(fā)表于 01-09 09:50 ?1329次閱讀
    使用愛芯派Pro開發(fā)板部署人體<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計(jì)</b><b class='flag-5'>模型</b>

    【愛芯派 Pro 開發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署前期準(zhǔn)備

    部署模型的整體架構(gòu)。接下來就回到最開始定的主線上了——人體姿態(tài)估計(jì)。這篇文章就是記錄對些輕量化人體姿態(tài)
    發(fā)表于 01-01 01:04

    基于YOLOv8實(shí)現(xiàn)自定義姿態(tài)評估模型訓(xùn)練

    Hello大家好,今天給大家分享下如何基于YOLOv8姿態(tài)評估模型,實(shí)現(xiàn)在自定義數(shù)據(jù)集上,完成自定義姿態(tài)評估模型的訓(xùn)練與推理。
    的頭像 發(fā)表于 12-25 11:29 ?2732次閱讀
    基于YOLOv8實(shí)現(xiàn)自定義<b class='flag-5'>姿態(tài)</b>評估<b class='flag-5'>模型</b>訓(xùn)練

    文讀懂六自由度激光跟蹤

    激光跟蹤儀與空間姿態(tài)探頭(iProbe 6D姿態(tài)探頭)配合使用,就組成六自由度激光跟蹤儀。它能夠根據(jù)合作目標(biāo)的精確空間
    的頭像 發(fā)表于 12-12 09:39 ?683次閱讀
    <b class='flag-5'>一</b>文讀懂六自由度激光<b class='flag-5'>跟蹤</b>儀

    基于飛控的姿態(tài)估計(jì)算法作用及原理

    ? 姿態(tài)估計(jì)的作用? 姿態(tài)估計(jì)是飛控算法的基礎(chǔ)部分,而且十分重要。為了完成飛行器平穩(wěn)的
    發(fā)表于 11-13 11:00 ?899次閱讀
    基于飛控的<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計(jì)</b>算法作用及原理