0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用RayDF方法突破3D形狀重建方案

3D視覺工坊 ? 來源:3DCV ? 2023-11-10 15:04 ? 次閱讀

1.摘要

傳統(tǒng)的三維形狀表示方法存在離散化和內(nèi)存占用等問題,而基于深度學(xué)習(xí)的方法在恢復(fù)三維幾何結(jié)構(gòu)方面取得了顯著的進展。然而,這些方法的離散形狀表示受到空間分辨率和內(nèi)存占用的限制。因此,本文提出了一種新的三維形狀表示方法,即射線-表面距離場(RayDF),通過學(xué)習(xí)射線與表面之間的距離來表示三維形狀。與現(xiàn)有的基于坐標(biāo)和射線的方法相比,RayDF具有更高的效率和更準(zhǔn)確的三維幾何重建能力。同時,本文還引入了多視角一致性優(yōu)化模塊,以提高學(xué)習(xí)到的射線-表面距離場在不同視角下的一致性。通過在多個數(shù)據(jù)集上的實驗證明,RayDF方法在三維形狀重建的準(zhǔn)確性和效率方面優(yōu)于現(xiàn)有的方法。

2.研究思路

本研究的研究思路是通過神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)三維形狀的表面距離,并保持多視角一致性。我們提出了一種稱為RayDF的方法,它包括三個關(guān)鍵組件:

主要的射線-表面距離網(wǎng)絡(luò)

輔助的雙射線可見性分類器

多視角一致性優(yōu)化模塊

3.貢獻

我們采用了直觀的射線-表面距離場來表示三維形狀,這種表示方法比現(xiàn)有的基于坐標(biāo)的表示更高效。

我們設(shè)計了一種新的雙射線可見性分類器,用于學(xué)習(xí)任意一對射線的空間關(guān)系,使學(xué)到的射線-表面距離場具有多視角幾何一致性。

我們在多個數(shù)據(jù)集上展示了優(yōu)越的三維形狀重建準(zhǔn)確性和效率,相比于現(xiàn)有的基于坐標(biāo)和基于射線的基線方法,取得了顯著更好的結(jié)果。

4.研究問題的解決方法

通過訓(xùn)練主要的射線-表面距離網(wǎng)絡(luò)和輔助的雙射線可見性分類器,并引入多視角一致性優(yōu)化模塊來訓(xùn)練這兩個網(wǎng)絡(luò)。具體而言,我們的訓(xùn)練模塊包括兩個階段:

階段1:訓(xùn)練雙射線可見性分類器。關(guān)鍵是創(chuàng)建正確的數(shù)據(jù)對,將原始深度值轉(zhuǎn)換為射線-表面距離值,并生成射線對和0/1標(biāo)簽。采用標(biāo)準(zhǔn)的交叉熵損失函數(shù)來優(yōu)化雙射線可見性分類器。

階段2:訓(xùn)練射線-表面距離網(wǎng)絡(luò)。將所有深度圖像轉(zhuǎn)換為射線-表面距離,為特定的3D場景生成訓(xùn)練射線-距離對。通過采樣多視角射線并利用訓(xùn)練好的可見性分類器,優(yōu)化射線-表面距離網(wǎng)絡(luò),使其不僅適應(yīng)已見射線的距離,還能準(zhǔn)確估計未見射線的距離,從而實現(xiàn)多視角一致性。

5.RayDF網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程

網(wǎng)絡(luò)結(jié)構(gòu)

RayDF模型包括主要的射線-表面距離網(wǎng)絡(luò)、輔助的雙射線可見性分類器和多視角一致性優(yōu)化模塊。

8ba363a4-7f54-11ee-939d-92fbcf53809c.png

訓(xùn)練過程

第一階段是訓(xùn)練雙射線可見性分類器

首先,將所有原始深度值轉(zhuǎn)換為射線-表面距離值。對于第k張圖像中的第i條射線(像素),將其射線-表面點投影回剩余的(K-1)個掃描中,得到相應(yīng)的(K-1)個距離值。設(shè)置10毫米作為接近閾值,確定投影的(K-1)條射線在(K-1)個圖像中是否可見??偣采蒏* H * W * (K-1)對射線,以及0/1標(biāo)簽。采用標(biāo)準(zhǔn)的交叉熵損失函數(shù)來優(yōu)化雙射線可見性分類器。推薦三維重建課程基于深度學(xué)習(xí)的三維重建MVSNet系列 [論文+源碼+應(yīng)用+科研]

第二階段是訓(xùn)練射線-表面距離網(wǎng)絡(luò)

首先,將所有深度圖像轉(zhuǎn)換為射線-表面距離,為特定的3D場景生成K * H * W個訓(xùn)練射線-距離對。然后,對于特定的訓(xùn)練射線,稱為主射線,我們在以表面點p為球心的球中均勻采樣M條射線,稱為多視角射線。

8ba9eaa8-7f54-11ee-939d-92fbcf53809c.png

然后,計算表面點p與沿著每條多視角射線的邊界球之間的距離,得到多視角距離。

接下來,建立M對射線并將它們輸入到訓(xùn)練好的可見性分類器中,推斷它們的可見性得分。

8bb0938a-7f54-11ee-939d-92fbcf53809c.png

然后,將主射線和所有采樣的M條多視角射線輸入到射線-表面距離網(wǎng)絡(luò)中,估計它們的表面距離。

8bb4b8fc-7f54-11ee-939d-92fbcf53809c.png

最后,使用多視角一致性損失函數(shù)來(公式如下)優(yōu)化射線-表面距離網(wǎng)絡(luò),使其不僅適應(yīng)主射線的表面距離,還滿足可見的多視角射線也具有準(zhǔn)確的距離估計。

6.創(chuàng)新點

主要體現(xiàn)在以下幾個方面:

提出了一種新的神經(jīng)網(wǎng)絡(luò)模型,稱為RayDF,用于學(xué)習(xí)三維場景的表面距離。與傳統(tǒng)的基于點云或體素的方法不同,RayDF利用射線與表面的交點來表示場景的幾何形狀,從而更準(zhǔn)確地捕捉細節(jié)和形狀變化。

引入了多視角一致性約束,通過訓(xùn)練網(wǎng)絡(luò)來學(xué)習(xí)不同視角下的一致性信息。這種約束可以提高模型在新視角下的泛化能力,使其能夠更好地處理未見過的場景。

提出了雙射線可見性分類器,用于判斷射線是否與表面相交。這個分類器可以幫助網(wǎng)絡(luò)學(xué)習(xí)更準(zhǔn)確的表面距離,并提高模型在測試階段的性能。

在實驗中,本研究在多個真實世界的三維數(shù)據(jù)集上進行了評估,并與其他基線方法進行了比較。

7.實驗方法

本研究采用了兩組實驗方法進行評估。第一組實驗方法是基于多視角深度圖像的三維形狀表示。在這組實驗中,我們使用了多視角深度圖像作為輸入,通過訓(xùn)練模型來學(xué)習(xí)三維場景的形狀表示。我們與其他基線方法進行了比較,包括OF、DeepSDF、NDF、NeuS、DS-NeRF、LFN和PRIF。通過對六個ScanNet數(shù)據(jù)集場景的評估,我們發(fā)現(xiàn)我們的方法在ADE指標(biāo)上表現(xiàn)明顯優(yōu)于其他方法,展示了我們方法在顯式表面恢復(fù)方面的明顯優(yōu)勢。第二組實驗方法是基于多視角RGB圖像和深度圖像的三維形狀和外觀表示。在這組實驗中,我們使用了多視角RGB圖像和深度圖像作為輸入,通過訓(xùn)練模型來學(xué)習(xí)三維場景的形狀和外觀表示。我們與NeuS、DS-NeRF、LFN和PRIF等基線方法進行了比較。通過對DM-SR數(shù)據(jù)集的評估,我們發(fā)現(xiàn)我們的方法在ADE指標(biāo)上再次超越了所有基線方法,展示了我們方法在形狀恢復(fù)方面的優(yōu)勢。同時,我們的方法在PSNR、SSIM和LPIPS等指標(biāo)上也取得了可比較的性能。

8bbfd6ba-7f54-11ee-939d-92fbcf53809c.png

8bc49ef2-7f54-11ee-939d-92fbcf53809c.png

8bcd0e34-7f54-11ee-939d-92fbcf53809c.png

8.結(jié)論

本文的研究旨在提出一種稱為RayDF的方法,用于準(zhǔn)確地表示三維形狀。該方法基于射線-表面距離場的概念,通過訓(xùn)練一個主要的射線-表面距離網(wǎng)絡(luò)和一個輔助的雙射線可見性分類器,以及一個多視角一致性優(yōu)化模塊來實現(xiàn)。主要網(wǎng)絡(luò)直接將射線作為輸入,并推斷射線起點與其在表面上的擊中點之間的距離。輔助網(wǎng)絡(luò)則以一對射線作為輸入,并預(yù)測它們的相互可見性。通過訓(xùn)練輔助網(wǎng)絡(luò),可以有效地利用學(xué)到的雙射線可見性來訓(xùn)練主網(wǎng)絡(luò),從而使學(xué)到的射線-表面距離在任何已見或未見的視角下保持多視角一致性。研究結(jié)果表明,相比于現(xiàn)有的基于坐標(biāo)的表示方法,RayDF方法在效率上具有優(yōu)勢,而相比于現(xiàn)有的基于射線的方法,RayDF方法在學(xué)習(xí)準(zhǔn)確的三維幾何形狀方面表現(xiàn)出色。在多個數(shù)據(jù)集上的實驗證明了RayDF方法在三維形狀重建的準(zhǔn)確性和效率方面的優(yōu)越性。

編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:香港理工大學(xué)最新提出精確3D重建的突破性方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    3d全息風(fēng)扇燈條|3D全息風(fēng)扇方案|3d全息風(fēng)扇PCBA

    我公司專業(yè)從事3D全息風(fēng)扇研發(fā)生產(chǎn),主要生產(chǎn)供應(yīng)3D全息風(fēng)扇PCBA,也可出售整機,其他配件可免費提供供應(yīng)商信息或者代購,歡迎咨詢 劉先生:*** 微信同號3d全息風(fēng)扇燈條3d全息風(fēng)扇
    發(fā)表于 08-02 09:50

    PYNQ框架下如何快速完成3D數(shù)據(jù)重建

    來實現(xiàn)基于這些約束的三維重建的完整管道?! ≡谶@個項目中,作者的目標(biāo)是朝著實時生成3D視覺數(shù)據(jù)邁進一步。首先,在CPU上生成3D點云,然后使用Mesh Lab可視化它。由于Mesh Lab不適合實時
    發(fā)表于 01-07 17:25

    在Altium Designer創(chuàng)建不尋常的3D形狀

    在AltiumDesigner?中使用PCB庫編輯器中包含的線條拉伸,圓柱和球形形狀類型創(chuàng)建逼真的3D機械形狀通常非常簡單。但是,有些形狀可能很棘手。 本文是一個客戶要求的創(chuàng)建環(huán)形線圈
    發(fā)表于 01-08 07:10

    使用結(jié)構(gòu)光的3D掃描介紹

    隨著很多全新技術(shù)的涌現(xiàn),人們越來越需要用3D方法來表示現(xiàn)實世界中的物體。特別是機器視覺和機器人技術(shù),它們都得益于精確和自適應(yīng)的3D捕捉功能。其它針對3D掃描的應(yīng)用包括生物識別、安防、工
    發(fā)表于 11-16 07:48

    光學(xué)3D表面輪廓儀可以測金屬嗎?

    重建物體的三維模型。這種測量方式具有非接觸性、高精度、高速度等優(yōu)點,非常適合用于金屬等材料的表面測量。 光學(xué)3D表面輪廓儀可以測量金屬的形狀、表面缺陷、幾何尺寸等多個方面: 1、形狀
    發(fā)表于 08-21 13:41

    創(chuàng)想三維:3D掃描儀在3D打印機上的運用

    3D打印機的工作原理產(chǎn)生好奇。 ? ? ? ?什么是3D掃描? ? ? ? ?3D掃描是分析來自現(xiàn)實世界的對象,收集所有數(shù)據(jù)以便以數(shù)字方式重建形狀
    發(fā)表于 04-19 15:50 ?623次閱讀

    3D的感知技術(shù)及實踐

    測量表面法向量估計 幾何測量平面提取 3D重建從離散點云得到光滑曲面 3D重建ICP點云配準(zhǔn) 3D重建
    的頭像 發(fā)表于 10-23 09:40 ?3098次閱讀
    <b class='flag-5'>3D</b>的感知技術(shù)及實踐

    音圈模組3D打印助力肌腱和韌帶重建

    音圈模組3D打印助力肌腱和韌帶重建。BellaSeno是一家開發(fā)由可吸收聚合物制成的3D打印乳房重建支架的初創(chuàng)公司,該公司現(xiàn)在已經(jīng)開始一項計劃,旨在設(shè)計和評估用于肌腱和韌帶
    發(fā)表于 09-01 14:57 ?320次閱讀

    大規(guī)模3D重建的Power Bundle Adjustment

    BA (BA) 是一個經(jīng)典的計算機視覺問題,它構(gòu)成了許多 3D 重建和運動結(jié)構(gòu) (SfM) 算法的核心組成部分。它指的是通過最小化非線性重投影誤差來聯(lián)合估計相機參數(shù)和 3D 地標(biāo)位置。
    的頭像 發(fā)表于 12-15 11:20 ?574次閱讀

    英偉達提出了同時對未知物體進行6D追蹤和3D重建方法

    一種用于新穎未知動態(tài)物體的因果 6 自由度姿態(tài)跟蹤和 3D 重建的新方法。該方法利用了并發(fā)跟蹤和神經(jīng)重建過程的新穎共同設(shè)計,能夠在幾乎實時的
    的頭像 發(fā)表于 07-03 10:49 ?421次閱讀
    英偉達提出了同時對未知物體進行6<b class='flag-5'>D</b>追蹤和<b class='flag-5'>3D</b><b class='flag-5'>重建</b>的<b class='flag-5'>方法</b>

    基于未知物體進行6D追蹤和3D重建方法

    如今,計算機視覺社區(qū)已經(jīng)廣泛展開了對物體姿態(tài)的 6D 追蹤和 3D 重建。本文中英偉達提出了同時對未知物體進行 6D 追蹤和 3D
    的頭像 發(fā)表于 07-03 11:24 ?484次閱讀
    基于未知物體進行6<b class='flag-5'>D</b>追蹤和<b class='flag-5'>3D</b><b class='flag-5'>重建</b>的<b class='flag-5'>方法</b>

    基于3D形狀重建網(wǎng)絡(luò)的機器人抓取規(guī)劃方法

    一個帶有分割掩碼的輸入RGB-D圖像被提供給兩個神經(jīng)網(wǎng)絡(luò),分別產(chǎn)生一個6自由度的抓取姿勢和一個物體的3D點云重建。通過將抓取姿勢投影到點云中最近的點來優(yōu)化抓取姿勢,從而產(chǎn)生最終的輸出抓取。
    發(fā)表于 11-02 10:39 ?380次閱讀
    基于<b class='flag-5'>3D</b><b class='flag-5'>形狀</b><b class='flag-5'>重建</b>網(wǎng)絡(luò)的機器人抓取規(guī)劃<b class='flag-5'>方法</b>

    使用Python從2D圖像進行3D重建過程詳解

    有許多不同的方法和算法可用于從2D圖像執(zhí)行3D重建。選擇的方法取決于諸如輸入圖像的質(zhì)量、攝像機校準(zhǔn)信息的可用性以及
    的頭像 發(fā)表于 12-05 14:07 ?2111次閱讀
    使用Python從2<b class='flag-5'>D</b>圖像進行<b class='flag-5'>3D</b><b class='flag-5'>重建</b>過程詳解

    提供3D打印材料與解決方案,助力3D打印產(chǎn)業(yè)發(fā)展

    提供3D打印材料與解決方案,助力3D打印產(chǎn)業(yè)發(fā)展
    的頭像 發(fā)表于 12-12 11:12 ?389次閱讀

    三維掃描與3D打印在法醫(yī)頭骨重建中的突破性應(yīng)用

    隨著科技的飛速發(fā)展,三維掃描和3D打印技術(shù)已經(jīng)逐漸滲透到醫(yī)療領(lǐng)域的各個環(huán)節(jié),為臨床診斷、治療和醫(yī)學(xué)研究帶來了前所未有的便利。特別是在法醫(yī)學(xué)領(lǐng)域,三維掃描和3D打印技術(shù)的應(yīng)用更是為頭骨重建、身份鑒定等
    的頭像 發(fā)表于 04-19 10:26 ?283次閱讀
    三維掃描與<b class='flag-5'>3D</b>打印在法醫(yī)頭骨<b class='flag-5'>重建</b>中的<b class='flag-5'>突破</b>性應(yīng)用