0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么目前落地的主流SLAM技術(shù)很少用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取?

新機器視覺 ? 來源:知乎 ? 2023-05-19 10:25 ? 次閱讀

8a05c3f2-f5b6-11ed-90ce-dac502259ad0.png

SLAM目前在各領(lǐng)域都已經(jīng)有很多的應(yīng)用,但為什么大部分已經(jīng)落地的都用的還是最傳統(tǒng)的方法,比如目前最主流的ORB-SLAM,即使到ORB3也依舊用的是傳統(tǒng)的FAST和BRIEF方法來檢測和提取特征點,而不用CV領(lǐng)域里早已經(jīng)普遍的神經(jīng)網(wǎng)絡(luò)如VGG等來提取特征點。當(dāng)然最新的很多語義SLAM論文里都已經(jīng)用到了如GCN等神經(jīng)網(wǎng)絡(luò)提取特征,但為什么目前落地和應(yīng)用的大部分還用的是傳統(tǒng)的方法?提取速度和所需算力應(yīng)該不會有太大差異才是?*

作者:心態(tài)炸裂男孩

談一下個人看法,可能不對。

首先slam是一個偏工程化的應(yīng)用技術(shù)。因此算力成本是一個非常重要的因素。傳統(tǒng)的特征提取速度快,算力成本低,可以在cpu運行。如果利用深度學(xué)習(xí)特征提取,算力包括gpu,深度學(xué)習(xí)特征帶來的額外CPU和內(nèi)存成本。問題是傳統(tǒng)方法特征提取已經(jīng)能滿足大部分場景了。

深度學(xué)習(xí)提取的特征就一定好?顯然不是的。因為數(shù)據(jù)集的原因,利用深度學(xué)習(xí)訓(xùn)練出的特征子適用性并不一定好。貌似網(wǎng)上有一篇論文,利用orbslam框架,對比了orb和superpoint的效果。發(fā)現(xiàn)有幾組superpoint效果確實好,但是有幾個序列視頻利用superpoint的slam直接track lost.這就表現(xiàn)的不好了。

因此在大多數(shù)場景下,傳統(tǒng)特征可以解決。利用深度學(xué)習(xí)特征就顯得畫蛇添足了,沒有必要。當(dāng)然在某些場景利用傳統(tǒng)特征就不可行。如光照變化劇烈,相機運動劇烈等場景。在long term slam這個話題下,深度學(xué)習(xí)特征效果明顯。

slam方法不僅僅是為了定位,個人覺得slam終極目的是復(fù)用地圖。顯然長時間定位這塊大部分人的目光都是投入到深度學(xué)習(xí)特征上,去superpoints.r2d2特征。畢竟長時間定位會有時間,天氣,光照,動態(tài)物體變化,傳統(tǒng)方法根本就不能解決。而深度學(xué)習(xí)特征卻可以保證長時間定位的準(zhǔn)確度。

所以個人看法,雖然深度學(xué)習(xí)特征雖然用的不多。但未來基于深度學(xué)習(xí)特征slam會越來越多。

作者:余世杰

其他答主都說了好多了,算力問題以及提升率啥的。

我個人是覺得還有個原因是,特征匹配在視覺SLAM中的重要性沒有到夸張的地步,在傳統(tǒng)算法情況下,有一定的錯誤匹配也能得到較好的結(jié)果,前端重要的同時,后端更加重要。

那么多SLAM算法,前端都大同小異,而且?guī)g的位姿變換好多都是先用勻速模型做初始值,去適配優(yōu)化,實在不行再進(jìn)行特征點的匹配求位姿。真正區(qū)別還是關(guān)鍵幀的處理,強調(diào)運動的整體性,而不是兩張圖之間單純的匹配精度。

這是我個人的觀點,有不對的還請大佬指正。

--以上來自2020年9月,回過頭2023年5月自己使用測試過之后發(fā)現(xiàn),目前的特征提取依賴性并不強,傳統(tǒng)的也能做得比較好,反而神經(jīng)網(wǎng)絡(luò)的提取穩(wěn)定性和重復(fù)性可能不夠強。

但是對描述子的計算和匹配上,還是有一定參考性,更實用,感興趣的朋友可以自己也測試看看

作者:劉國慶

談?wù)勎业目捶ò?,不一定正確,僅供參考:

1、算力和功耗問題,背后也是成本問題,也是最致命的問題。即使是TX2這類面向嵌入式的GPU,耗電和成本也非常可觀……FPGA硬件實現(xiàn)網(wǎng)絡(luò),或者做訂制ASIC可以同時解決算力和功耗問題,不過貌似學(xué)術(shù)界貌似認(rèn)為這些不是它們應(yīng)該解決的問題,而且結(jié)果復(fù)現(xiàn)嚴(yán)重依賴硬件,不太爽。算力相對受限這一點也是我個人做東西沒有用基于學(xué)習(xí)的特征的原因。

另對于題主所言“提取速度和所需算力不會有太大差異”,請問是使用哪一種特征提取網(wǎng)絡(luò),又是和哪一種傳統(tǒng)特征提取算法,在何種計算平臺進(jìn)行的對比測試所得到的結(jié)論呢?我沒做過詳細(xì)的耗時和算力需求對比,但是我還是對該結(jié)論有點懷疑。

2、夠用就好,盲目追求高精度在落地應(yīng)用方面是不可取的。好比Nvidia RTX 20系顯卡,2080Ti價格比2080S提高了接近一倍,性能提升只有20%~30%,對于成本敏感的落地應(yīng)用而言,你會做這個交易嗎?何況2080s算力本身也不算差。

3、應(yīng)該有正在推進(jìn)中的落地應(yīng)用,只是涉及到商業(yè)機密,你我不知道罷了。

原文鏈接:https://www.zhihu.com/question/419264201/answer/1467534631

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4718

    瀏覽量

    100060
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    406

    瀏覽量

    31724
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5424

    瀏覽量

    120628

原文標(biāo)題:為什么目前落地的主流SLAM技術(shù)很少用神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提?。?/p>

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景及優(yōu)缺點

    1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)模型,它通過模擬人類視覺系統(tǒng)的工作方式,對輸入數(shù)據(jù)進(jìn)行特征提取和分類。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-11 14:45 ?265次閱讀

    BP神經(jīng)網(wǎng)絡(luò)在語言特征信號分類中的應(yīng)用

    Network),即反向傳播神經(jīng)網(wǎng)絡(luò),作為一種強大的多層前饋神經(jīng)網(wǎng)絡(luò),憑借其優(yōu)異的非線性映射能力和高效的學(xué)習(xí)機制,在語言特征信號分類中展現(xiàn)出了巨大的潛力。本文將從BP神經(jīng)網(wǎng)絡(luò)的基本原
    的頭像 發(fā)表于 07-10 15:44 ?198次閱讀

    深度神經(jīng)網(wǎng)絡(luò)與基本神經(jīng)網(wǎng)絡(luò)的區(qū)別

    在探討深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks, DNNs)與基本神經(jīng)網(wǎng)絡(luò)(通常指傳統(tǒng)神經(jīng)網(wǎng)絡(luò)或前向神經(jīng)網(wǎng)絡(luò))的區(qū)別時,我們需要從多個維度
    的頭像 發(fā)表于 07-04 13:20 ?359次閱讀

    如何設(shè)計人臉識別的神經(jīng)網(wǎng)絡(luò)

    識別技術(shù)主要分為兩個步驟:人臉檢測和人臉特征提取。人臉檢測是指在圖像中定位出人臉的位置和大小,人臉特征提取是指從人臉圖像中提取出能夠表征人臉特征
    的頭像 發(fā)表于 07-04 09:20 ?375次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實現(xiàn)原理

    、訓(xùn)練過程以及應(yīng)用場景。 卷積神經(jīng)網(wǎng)絡(luò)的基本原理 1.1 卷積操作 卷積神經(jīng)網(wǎng)絡(luò)的核心是卷積操作。卷積操作是一種數(shù)學(xué)運算,用于提取輸入數(shù)據(jù)的特征。在圖像處理中,卷積操作通常用于
    的頭像 發(fā)表于 07-03 10:49 ?397次閱讀

    如何使用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模和預(yù)測

    神經(jīng)網(wǎng)絡(luò)是一種強大的機器學(xué)習(xí)技術(shù),可以用于建模和預(yù)測變量之間的關(guān)系。 神經(jīng)網(wǎng)絡(luò)的基本概念 神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的計算模型,由大量的節(jié)點(神經(jīng)
    的頭像 發(fā)表于 07-03 10:23 ?418次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)和工作原理

    和工作原理。 1. 引言 在深度學(xué)習(xí)領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是一種非常重要的模型。它通過模擬人類視覺系統(tǒng),能夠自動學(xué)習(xí)圖像中的特征,從而實現(xiàn)對圖像的識別和分類。與傳統(tǒng)的機器學(xué)習(xí)方法相比,CNN具有更強的特征提取能力,能夠處理更復(fù)雜的數(shù)
    的頭像 發(fā)表于 07-03 09:38 ?259次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的是什么

    、訓(xùn)練過程以及應(yīng)用場景。 1. 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 1.1 卷積神經(jīng)網(wǎng)絡(luò)的定義 卷積神經(jīng)網(wǎng)絡(luò)是一種前饋深度學(xué)習(xí)模型,其核心思想是利用卷積操作提取輸入數(shù)據(jù)的局部
    的頭像 發(fā)表于 07-03 09:15 ?225次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的原理與實現(xiàn)

    核心思想是通過卷積操作提取輸入數(shù)據(jù)的特征。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享和局部連接的特點,這使得其在處理圖像等高維數(shù)據(jù)時具有更高的效率和更好的性能。 卷積層 卷積層是卷
    的頭像 發(fā)表于 07-02 16:47 ?334次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及其功能

    。 引言 深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,它通過模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和功能,實現(xiàn)對數(shù)據(jù)的自動學(xué)習(xí)和特征提取。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中的一種重要模型,它通過卷積操作和池化操作,有效地提取
    的頭像 發(fā)表于 07-02 14:45 ?575次閱讀

    神經(jīng)網(wǎng)絡(luò)在圖像識別中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域的應(yīng)用日益廣泛。神經(jīng)網(wǎng)絡(luò)以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進(jìn)步。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-01 14:19 ?429次閱讀

    基于毫米波雷達(dá)的手勢識別神經(jīng)網(wǎng)絡(luò)

    方面的高精度。這一成功可以歸因于訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)之間的特征相似性??傊?,這些結(jié)果證實了我們提出的神經(jīng)網(wǎng)絡(luò)模型在提取相關(guān)運動特征進(jìn)行魯棒手
    發(fā)表于 05-23 12:12

    咳嗽檢測深度神經(jīng)網(wǎng)絡(luò)算法

    哮喘、支氣管炎和百日咳發(fā)生時的咳嗽音頻信號的方法。在此,使用巴特沃斯高通濾波器進(jìn)行預(yù)處理,并使用MFCC進(jìn)行特征提取。此外,使用咳嗽特征的訓(xùn)練數(shù)據(jù)集,使用改進(jìn)的CNN完成了咳嗽聲音的分
    發(fā)表于 05-15 19:05

    基于胎心儀的胎兒心臟診斷神經(jīng)網(wǎng)絡(luò)

    ,然后使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)并行處理 數(shù)據(jù)。最后,我們采用投票的方式來確定胎心率記錄 的類別。我們還做了對比實驗,采用基于基礎(chǔ)統(tǒng)計的 特征提取方法來提取胎心率的特征。然后將這些
    發(fā)表于 05-14 18:47

    基于卷積神經(jīng)網(wǎng)絡(luò)的雙重特征提取方法

    機器學(xué)習(xí)技術(shù)已被廣泛接受,并且很適合此類分類問題?;诰矸e神經(jīng)網(wǎng)絡(luò)的雙重特征提取方法。提出的模型使用Radon拉冬變換進(jìn)行第一次特征提取,然
    發(fā)表于 10-16 11:30 ?543次閱讀
    基于卷積<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的雙重<b class='flag-5'>特征提取</b>方法