0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

視覺SLAM技術(shù)淺談

領(lǐng)銜資訊 ? 2019-08-09 17:31 ? 次閱讀

近年來,SLAM技術(shù)取得了驚人的發(fā)展,領(lǐng)先一步的激光SLAM已成熟的應(yīng)用于各大場景中,視覺SLAM雖在落地應(yīng)用上不及激光SLAM,但也是目前研究的一大熱點(diǎn),今天我們就來詳細(xì)聊聊視覺SLAM的那些事兒。

視覺SLAM是什么?

視覺SLAM主要是基于相機(jī)來完成環(huán)境的感知工作,相對(duì)而言,相機(jī)成本較低,容易放到商品硬件上,且圖像信息豐富,因此視覺SLAM也備受關(guān)注。

目前,視覺SLAM可分為單目、雙目(多目)、RGBD這三類,另還有魚眼、全景等特殊相機(jī),但目前在研究和產(chǎn)品中還屬于少數(shù),此外,結(jié)合慣性測量器件(Inertial Measurement Unit,IMU)的視覺SLAM也是現(xiàn)在研究熱點(diǎn)之一。從實(shí)現(xiàn)難度上來說,大致將這三類方法排序?yàn)椋簡文恳曈X>雙目視覺>RGBD。

單目相機(jī)SLAM簡稱MonoSLAM,僅用一支攝像頭就能完成SLAM。最大的優(yōu)點(diǎn)是傳感器簡單且成本低廉,但同時(shí)也有個(gè)大問題,就是不能確切的得到深度。

一方面是由于絕對(duì)深度未知,單目SLAM不能得到機(jī)器人運(yùn)動(dòng)軌跡及地圖的真實(shí)大小,如果把軌跡和房間同時(shí)放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計(jì)一個(gè)相對(duì)深度。另一方面,單目相機(jī)無法依靠一張圖像獲得圖像中物體離自己的相對(duì)距離。為了估計(jì)這個(gè)相對(duì)深度,單目SLAM要靠運(yùn)動(dòng)中的三角測量,來求解相機(jī)運(yùn)動(dòng)并估計(jì)像素的空間位置。即是說,它的軌跡和地圖,只有在相機(jī)運(yùn)動(dòng)之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動(dòng)時(shí),就無法得知像素的位置。同時(shí),相機(jī)運(yùn)動(dòng)還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來了一些麻煩。

而雙目相機(jī)與單目不同的是,立體視覺既可以在運(yùn)動(dòng)時(shí)估計(jì)深度,亦可在靜止時(shí)估計(jì),消除了單目視覺的許多麻煩。不過,雙目或多目相機(jī)配置與標(biāo)定均較為復(fù)雜,其深度量程也隨雙目的基線與分辨率限制。通過雙目圖像計(jì)算像素距離,是一件非常消耗計(jì)算量的事情,現(xiàn)在多用FPGA來完成。

RGBD相機(jī)是2010年左右開始興起的一種相機(jī),它最大的特點(diǎn)是可以通過紅外結(jié)構(gòu)光或TOF原理,直接測出圖像中各像素離相機(jī)的距離。因此,它比傳統(tǒng)相機(jī)能夠提供更豐富的信息,也不必像單目或雙目那樣費(fèi)時(shí)費(fèi)力地計(jì)算深度。

視覺SLAM框架解讀

1.傳感器數(shù)據(jù)

在視覺SLAM中主要為相機(jī)圖像信息的讀取和預(yù)處理。如果在機(jī)器人中,還可能有碼盤,慣性傳感器等信息的讀取和同步。

2.視覺里程計(jì)

視覺里程計(jì)的主要任務(wù)是估算相鄰圖像間相機(jī)運(yùn)動(dòng)以及局部地圖的樣子,最簡單的是兩張圖像之間的運(yùn)動(dòng)關(guān)系。計(jì)算機(jī)是如何通過圖像確定相機(jī)的運(yùn)動(dòng)的。在圖像上,我們只能看到一個(gè)個(gè)的像素,知道他們是某些空間點(diǎn)在相機(jī)的成像平面投影的結(jié)果。所以必須先了解相機(jī)跟空間點(diǎn)的幾何關(guān)系。

Vo(又稱為前端)能夠通過相鄰幀間的圖像估計(jì)相機(jī)運(yùn)動(dòng),并恢復(fù)場景的空間結(jié)構(gòu),稱它為里程計(jì)。被稱為里程計(jì)是因?yàn)樗挥?jì)算相鄰時(shí)刻的運(yùn)動(dòng),而和再往前的過去信息沒有關(guān)聯(lián)。相鄰時(shí)刻運(yùn)動(dòng)串聯(lián)起來,就構(gòu)成了機(jī)器人的運(yùn)動(dòng)軌跡,從而解決了定位問題。另一方面,根據(jù)每一時(shí)刻的相機(jī)位置,計(jì)算出各像素對(duì)應(yīng)的空間點(diǎn)的位置,就得到了地圖。

3.后端優(yōu)化

后端優(yōu)化主要是處理slam過程中噪聲的問題。任何傳感器都有噪聲,所以除了要處理“如何從圖像中估計(jì)出相機(jī)運(yùn)動(dòng)”,還要關(guān)心這個(gè)估計(jì)帶有多大的噪聲。

前端給后端提供待優(yōu)化的數(shù)據(jù),以及這些數(shù)據(jù)的初始值,而后端負(fù)責(zé)整體的優(yōu)化過程,它往往面對(duì)的只有數(shù)據(jù),不必關(guān)系這些數(shù)據(jù)來自哪里。在視覺slam中,前端和計(jì)算接視覺研究領(lǐng)域更為相關(guān),比如圖像的特征提取與匹配等,后端則主要是濾波和非線性優(yōu)化算法。

4.回環(huán)檢測

回環(huán)檢測也可以稱為閉環(huán)檢測,是指機(jī)器人識(shí)別曾到達(dá)場景的能力。如果檢測成功,可以顯著地減小累積誤差?;丨h(huán)檢測實(shí)質(zhì)上是一種檢測觀測數(shù)據(jù)相似性的算法。對(duì)于視覺SLAM,多數(shù)系統(tǒng)采用目前較為成熟的詞袋模型(Bag-of-Words, BoW)。詞袋模型把圖像中的視覺特征(SIFT, SURF等)聚類,然后建立詞典,進(jìn)而尋找每個(gè)圖中含有哪些“單詞”(word)。也有研究者使用傳統(tǒng)模式識(shí)別的方法,把回環(huán)檢測建構(gòu)成一個(gè)分類問題,訓(xùn)練分類器進(jìn)行分類。

5.建圖

建圖主要是根據(jù)估計(jì)的軌跡建立與任務(wù)要求對(duì)應(yīng)的地圖,在機(jī)器人學(xué)中,地圖的表示主要有柵格地圖、直接表征法、拓?fù)涞貓D以及特征點(diǎn)地圖這4種。而特征點(diǎn)地圖是用有關(guān)的幾何特征(如點(diǎn)、直線、面)表示環(huán)境,常見于視覺SLAM技術(shù)中。這種地圖一般通過如GPS、UWB以及攝像頭配合稀疏方式的vSLAM算法產(chǎn)生,優(yōu)點(diǎn)是相對(duì)數(shù)據(jù)存儲(chǔ)量和運(yùn)算量比較小,多見于最早的SLAM算法中。

視覺SLAM工作原理

大多數(shù)視覺SLAM系統(tǒng)的工作方式是通過連續(xù)的相機(jī)幀,跟蹤設(shè)置關(guān)鍵點(diǎn),以三角算法定位其3D位置,同時(shí)使用此信息來逼近推測相機(jī)自己的姿態(tài)。簡單來說,這些系統(tǒng)的目標(biāo)是繪制與自身位置相關(guān)的環(huán)境地圖。這個(gè)地圖可以用于機(jī)器人系統(tǒng)在該環(huán)境中導(dǎo)航作用。與其他形式的SLAM技術(shù)不同,只需一個(gè)3D視覺攝像頭,就可以做到這一點(diǎn)。

通過跟蹤攝像頭視頻幀中足夠數(shù)量的關(guān)鍵點(diǎn),可以快速了解傳感器的方向和周圍物理環(huán)境的結(jié)構(gòu)。所有視覺SLAM系統(tǒng)都在不斷的工作,以使重新投影誤差(Reprojection Error)或投影點(diǎn)與實(shí)際點(diǎn)之間的差異最小化,通常是通過一種稱為Bundle Adjustment(BA)的算法解決方案。vSLAM系統(tǒng)需要實(shí)時(shí)操作,這涉及到大量的運(yùn)算,因此位置數(shù)據(jù)和映射數(shù)據(jù)經(jīng)常分別進(jìn)行Bundle Adjustment,但同時(shí)進(jìn)行,便于在最終合并之前加快處理速度。

視覺SLAM與激光SLAM有什么區(qū)別?

在業(yè)內(nèi),視覺SLAM與激光SLAM誰更勝一籌,誰將成為未來主流趨勢這一問題,成為大家關(guān)注的熱點(diǎn),不同的人也有不同的看法及見解,以下將從成本、應(yīng)用場景、地圖精度、易用性幾個(gè)方面來進(jìn)行詳細(xì)闡述。

1.成本

從成本上來說,激光雷達(dá)普遍價(jià)格較高,但目前國內(nèi)也有低成本的激光雷達(dá)解決方案,而VSLAM主要是通過攝像頭來采集數(shù)據(jù)信息,跟激光雷達(dá)一對(duì)比,攝像頭的成本顯然要低很多。但激光雷達(dá)能更高精度的測出障礙點(diǎn)的角度和距離,方便定位導(dǎo)航。

2.應(yīng)用場景

從應(yīng)用場景來說,VSLAM的應(yīng)用場景要豐富很多。VSLAM在室內(nèi)外環(huán)境下均能開展工作,但是對(duì)光的依賴程度高,在暗處或者一些無紋理區(qū)域是無法進(jìn)行工作的。而激光SLAM目前主要被應(yīng)用在室內(nèi),用來進(jìn)行地圖構(gòu)建和導(dǎo)航工作。

3.地圖精度

激光SLAM在構(gòu)建地圖的時(shí)候,精度較高,思嵐科技的RPLIDAR系列構(gòu)建的地圖精度可達(dá)到2cm左右;VSLAM,比如常見的,大家也用的非常多的深度攝像機(jī)Kinect,(測距范圍在3-12m之間),地圖構(gòu)建精度約3cm;所以激光SLAM構(gòu)建的地圖精度一般來說比VSLAM高,且能直接用于定位導(dǎo)航。

視覺SLAM的地圖建立

4.易用性

激光SLAM和基于深度相機(jī)的視覺SLAM均是通過直接獲取環(huán)境中的點(diǎn)云數(shù)據(jù),根據(jù)生成的點(diǎn)云數(shù)據(jù),測算哪里有障礙物以及障礙物的距離。但是基于單目、雙目、魚眼攝像機(jī)的視覺SLAM方案,則不能直接獲得環(huán)境中的點(diǎn)云,而是形成灰色或彩色圖像,需要通過不斷移動(dòng)自身的位置,通過提取、匹配特征點(diǎn),利用三角測距的方法測算出障礙物的距離。

總體來說,激光SLAM相對(duì)更為成熟,也是目前最為可靠的定位導(dǎo)航方案,而視覺SLAM仍是今后研究的一個(gè)主流方向,但未來,兩者融合是必然趨勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們?cè)赱第 1 部分]中所討論的,SLAM 是指在無地圖區(qū)域中估計(jì)機(jī)器人車輛的位置,同時(shí)逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?219次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)視覺SLAM系統(tǒng)

    既能保證效率和精度,又無需GPU,行業(yè)第一個(gè)達(dá)到此目標(biāo)的視覺動(dòng)態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?334次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)

    深度解析深度學(xué)習(xí)下的語義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計(jì)算機(jī)視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展,例如目標(biāo)的檢測、識(shí)別和分類等領(lǐng)域。近年來,研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)
    發(fā)表于 04-23 17:18 ?1227次閱讀
    深度解析深度學(xué)習(xí)下的語義<b class='flag-5'>SLAM</b>

    基于多攝像頭的高魯棒性視覺SLAM系統(tǒng)設(shè)計(jì)

    本文的主要目標(biāo)是通過擴(kuò)展ORB-SLAM2的功能來增強(qiáng)準(zhǔn)確性,從多個(gè)攝像頭中的姿態(tài)估計(jì)和地圖重用開始。所有這些多攝像頭的圖像特征將被合并到跟蹤模塊中進(jìn)行特征匹配,以及在閉環(huán)檢測期間進(jìn)行位置識(shí)別。
    發(fā)表于 04-20 17:51 ?506次閱讀
    基于多攝像頭的高魯棒性<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計(jì)

    工程實(shí)踐中VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng),廣泛用于實(shí)時(shí)三維地圖構(gòu)建和機(jī)器人定位。該系統(tǒng)使用ORB特征進(jìn)行高效的視覺識(shí)別和地圖重建,支持關(guān)鍵幀
    的頭像 發(fā)表于 04-08 10:17 ?2515次閱讀
    工程實(shí)踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣分析

    什么是SLAMSLAM算法涉及的4要素

    SLAM技術(shù)可以應(yīng)用在無人駕駛汽車、無人機(jī)、機(jī)器人、虛擬現(xiàn)實(shí)等領(lǐng)域中,為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場景理解的功能。
    發(fā)表于 04-04 11:50 ?2131次閱讀

    什么是SLAM?基于3D高斯輻射場的SLAM優(yōu)勢分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 04-01 12:44 ?656次閱讀

    從基本原理到應(yīng)用的SLAM技術(shù)深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機(jī)和雙目相機(jī)。LSD-SLAM是一種基于光流跟蹤的直接法SLAM,但是實(shí)現(xiàn)了半稠密建圖,建圖規(guī)模大,可以
    發(fā)表于 02-26 09:41 ?8851次閱讀
    從基本原理到應(yīng)用的<b class='flag-5'>SLAM</b><b class='flag-5'>技術(shù)</b>深度解析

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 01-26 10:48 ?603次閱讀
    基于NeRF/Gaussian的全新<b class='flag-5'>SLAM</b>算法

    動(dòng)態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D SLAM

    神經(jīng)隱式表示已經(jīng)被探索用于增強(qiáng)視覺SLAM掩碼算法,特別是在提供高保真的密集地圖方面。
    的頭像 發(fā)表于 01-17 10:39 ?848次閱讀
    動(dòng)態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D <b class='flag-5'>SLAM</b>

    怎么去處理視覺SLAM長期定位中的外觀變化和軌跡漂移呢?

    服務(wù)機(jī)器人、巡檢機(jī)器人、自動(dòng)駕駛車輛等SLAM應(yīng)用,需要進(jìn)行長時(shí)間的定位和導(dǎo)航,但是可能會(huì)遇到很多光照變化(甚至天氣季節(jié)變化)、不同視角提取的不同特征、原先場景的目標(biāo)已經(jīng)移除等等很多的環(huán)境變化問題,如果處理不好的話很容易引發(fā)軌跡漂移甚至跟蹤丟失。
    的頭像 發(fā)表于 12-04 10:01 ?694次閱讀
    怎么去處理<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>長期定位中的外觀變化和軌跡漂移呢?

    基于視覺SLAM的研究現(xiàn)狀

    目前視覺SLAM系統(tǒng)可以在微型個(gè)人計(jì)算機(jī)(PC)和嵌入式設(shè)備中運(yùn)行,甚至可以在智能手機(jī)等移動(dòng)設(shè)備中運(yùn)行(Klein和Murray,2009)。與室內(nèi)或室外移動(dòng)機(jī)器人不同,自動(dòng)駕駛車輛具有更復(fù)雜的參數(shù),尤其是當(dāng)車輛在城市環(huán)境中自動(dòng)駕駛時(shí)。
    發(fā)表于 12-04 09:22 ?972次閱讀
    基于<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>的研究現(xiàn)狀

    淺談濾波器

    淺談濾波器
    的頭像 發(fā)表于 11-29 16:20 ?758次閱讀
    <b class='flag-5'>淺談</b>濾波器

    LDO參數(shù)指標(biāo)淺談

    LDO參數(shù)指標(biāo)淺談
    的頭像 發(fā)表于 11-27 16:01 ?1092次閱讀
    LDO參數(shù)指標(biāo)<b class='flag-5'>淺談</b>

    什么是激光雷達(dá)3D SLAM技術(shù)

    理解,SLAM的主要功能就是讓機(jī)器人一邊計(jì)算自身位置,一邊構(gòu)建環(huán)境地圖,這兩個(gè)過程相輔相成??梢哉f,SLAM技術(shù)是機(jī)器人后續(xù)自主行動(dòng)和實(shí)現(xiàn)交互的基礎(chǔ),SLAM也被認(rèn)
    的頭像 發(fā)表于 11-25 08:23 ?1518次閱讀
    什么是激光雷達(dá)3D <b class='flag-5'>SLAM</b><b class='flag-5'>技術(shù)</b>?