單目攝像頭定位最大的優(yōu)點(diǎn)是便宜,定位有多種思路,比較典型的有兩種:
1)間接定位
運(yùn)動(dòng)主體可以通過(guò)識(shí)別一些不動(dòng)的物體作為參照,間接進(jìn)行定位。但這個(gè)對(duì)于機(jī)器人來(lái)說(shuō)非常難。因?yàn)橥饨绲沫h(huán)境通過(guò)攝像頭傳入機(jī)器人的都是數(shù)字化的信息,具體就是像素點(diǎn),數(shù)字化的信息通過(guò)識(shí)別物體的方式進(jìn)行定位,是一件非常吃力的事情。
有一個(gè)變種的方案很方便實(shí)施,就是二維碼方案,機(jī)器人識(shí)別二維碼是非常容易的,通過(guò)知曉二維碼的寬度(只有知曉先驗(yàn)大小,才能判斷遠(yuǎn)近),與不同二維碼所代表的地標(biāo)位置,機(jī)器人可以?xún)H僅通過(guò)單目2D攝像頭方便的推算出自己的絕對(duì)位姿。以前的VR設(shè)備,如HTC VIVE,多采用這種方式實(shí)現(xiàn)定位。這個(gè)方案不方便之處在于要提前部署二維碼。
2)單目SLAM
單目SLAM要做到比較魯棒的定位,需要兩個(gè)階段, 分為前端的視覺(jué)里程計(jì)和后端的回環(huán)機(jī)制。該方案的問(wèn)題包含初始化尺度問(wèn)題和實(shí)際工程實(shí)施中計(jì)算量實(shí)時(shí)性問(wèn)題。
尺度問(wèn)題,是由2D成像理論內(nèi)在特點(diǎn)決定的,因?yàn)闆](méi)有深度信息,大小和遠(yuǎn)近是可以成比例縮放的, 反映到單目SLAM, 在初始化階段,必須運(yùn)動(dòng)主體有平移的動(dòng)作,來(lái)確定一個(gè)尺度基準(zhǔn),這個(gè)尺度基準(zhǔn)是無(wú)法與測(cè)量單位“m,cm,mm”對(duì)應(yīng)的,只是自己的一個(gè)單位, 后續(xù)的建圖和定位都是基于這個(gè)單位來(lái)進(jìn)行, 建立的地圖和定位理論上可以等比例縮放。
計(jì)算量問(wèn)題,在于SLAM算法本身的復(fù)雜性,勉強(qiáng)在嵌入式設(shè)備上跑,計(jì)算資源基本耗盡。在實(shí)踐中可以從算法并行計(jì)算方面進(jìn)行探索,或者選擇高性能的計(jì)算平臺(tái)。
單目SLAM 分為特征點(diǎn)法和直接法,考慮到對(duì)周遭環(huán)境的魯棒性,一般采用特征點(diǎn)法,就是采用人工設(shè)計(jì)的角點(diǎn),作為連續(xù)幀進(jìn)行地標(biāo)匹配。角點(diǎn)肯定是稀疏的,所以建圖只是作為定位的輔助地標(biāo)來(lái)做使用, 不能指導(dǎo)避障和導(dǎo)航。
主動(dòng)光深度攝像頭(3D)
這種攝像頭在2D攝像頭的基礎(chǔ)上,增加紅外發(fā)射和接收裝置,在2D RGB像素上增加深度(距離)信息。比較有名的產(chǎn)品有微軟的Kinect,蘋(píng)果最新的手機(jī)產(chǎn)品IphoneX會(huì)配備這種攝像頭,提供給用戶VR使用體驗(yàn)和增強(qiáng)人臉識(shí)別FaceId的準(zhǔn)確度。
深度攝像頭在定位方面主要是深度SLAM方案。 相對(duì)于單目SLAM, 因?yàn)槊總€(gè)像素有了深度信息, 這樣尺度問(wèn)題就不存在了,不需要運(yùn)動(dòng)主體做平移運(yùn)動(dòng)來(lái)做初始化動(dòng)作。有了深度信息,理論上建圖是可以做稠密圖,可以做三維建模。
它的缺點(diǎn)也很明顯,除了跟2D一樣算法計(jì)算量偏大,紅外主動(dòng)光非常容易受到其它強(qiáng)光的影響, 這樣在室外基本就退化成一個(gè)2D攝像頭了。 對(duì)于一些透光介質(zhì),如玻璃,深度信息是無(wú)法得到的。
雙目攝像頭
兩個(gè)攝像頭,光心距離固定。雙目攝像頭通過(guò)視差,可以間接得到兩個(gè)攝像頭共視像素的深度信息。雙目攝像頭比較像人的眼睛, 人可以通過(guò)雙眼,直接估計(jì)出眼前物體的相對(duì)遠(yuǎn)近。對(duì)于計(jì)算機(jī)來(lái)說(shuō),通過(guò)同一時(shí)刻兩個(gè)攝像頭分別拍的兩幀圖像,根據(jù)視差的幾何關(guān)系,可以算出像素的深度,達(dá)到跟主動(dòng)光深度攝像頭一樣的效果。
相比主動(dòng)光深度攝像頭, 它的優(yōu)點(diǎn)是受環(huán)境光線的影響比較小,可以在室外自動(dòng)駕駛汽車(chē)上應(yīng)用。缺點(diǎn)是像素的深度信息不能直接獲取,需要不小的運(yùn)算量通過(guò)視差幾何關(guān)系計(jì)算獲得。
雙目攝像頭本質(zhì)上就是一個(gè)深度攝像頭,只是獲取深度信息的手段不同,所以定位也可以應(yīng)用深度SLAM方案。
激光雷達(dá)
激光雷達(dá)是目前定位選擇的主流傳感器,帶自主導(dǎo)航的室內(nèi)掃地機(jī)的商用產(chǎn)品,一般都會(huì)配備激光雷達(dá)。在自動(dòng)駕駛領(lǐng)域,高精地圖的采集及定位應(yīng)用, 使用的是多線激光雷達(dá)方案。
激光雷達(dá)分為單線和多線, 單線雷達(dá)只能掃描一個(gè)平面的障礙,所以直接出來(lái)的是一個(gè)2D地圖。 多線雷達(dá)(有16線,32線,64線)產(chǎn)品,通過(guò)多個(gè)掃描面的組合,可以給出豐富的環(huán)境3D點(diǎn)云。
激光雷達(dá)定位, 主要是激光SLAM算法,跟視覺(jué)SLAM一樣,也分前端雷達(dá)里程計(jì)和后端回環(huán)檢測(cè)矯正。
激光SLAM對(duì)CPU的消耗,是遠(yuǎn)遠(yuǎn)低于視覺(jué)SLAM的,魯棒性更好,更加穩(wěn)定。以2D激光SLAM為例,它可以在任意時(shí)刻得到某個(gè)特定高度水平面的2D障礙輪廓,所以在做前端里程計(jì)的時(shí)候,連續(xù)兩幀,計(jì)算局部的地圖輪廓匹配,可以使用相對(duì)比較少的計(jì)算量獲取相對(duì)位移。
激光掃描出的點(diǎn)有準(zhǔn)確度很高的深度信息,這樣在做后端回環(huán)優(yōu)化的時(shí)候,不需要優(yōu)化某個(gè)位姿下的觀測(cè)值(掃描的點(diǎn)云), 而直接優(yōu)化位姿。
對(duì)于視覺(jué)SLAM, 不論是單目SLAM 通過(guò)三角測(cè)量算出的點(diǎn)云深度,還是深度SLAM中獲取到的點(diǎn)深度, 有很大噪聲在里面,所以?xún)?yōu)化要對(duì)觀測(cè)點(diǎn)和位姿一起優(yōu)化調(diào)整。
激光做定位的缺點(diǎn)是受環(huán)境如雨、霧的影響比較大,對(duì)于透明介質(zhì)也無(wú)法得到準(zhǔn)確的深度信息。
-
移動(dòng)機(jī)器人
+關(guān)注
關(guān)注
2文章
755瀏覽量
33528 -
激光雷達(dá)
+關(guān)注
關(guān)注
967文章
3921瀏覽量
189435
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論