0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SLAM技術(shù)將賦予為機器人和智能體前所未有的行動能力

電子工程師 ? 來源:yxw ? 2019-05-25 09:43 ? 次閱讀

一般來講,SLAM系統(tǒng)通常都包含多種傳感器和多種功能模塊。而按照核心的功能模塊來區(qū)分,目前常見的機器人SLAM系統(tǒng)一般具有兩種形式:基于激光雷達的SLAM(激光SLAM)和基于視覺的SLAM(Visual SLAM或VSLAM)。

同時定位與地圖構(gòu)建(Simultaneous Localization And Mapping,簡稱SLAM),通常是指在機器人或者其他載體上,通過對各種傳感器數(shù)據(jù)進行采集和計算,生成對其自身位置姿態(tài)的定位和場景地圖信息的系統(tǒng)。SLAM技術(shù)對于機器人或其他智能體的行動和交互能力至為關(guān)鍵,因為它代表了這種能力的基礎(chǔ):知道自己在哪里,知道周圍環(huán)境如何,進而知道下一步該如何自主行動。它在自動駕駛、服務(wù)型機器人、無人機、AR/VR等領(lǐng)域有著廣泛的應(yīng)用,可以說凡是擁有一定行動能力的智能體都擁有某種形式的SLAM系統(tǒng)。

激光SLAM簡介

激光SLAM脫胎于早期的基于測距的定位方法(如超聲和紅外單點測距)。激光雷達(Light Detection And Ranging)的出現(xiàn)和普及使得測量更快更準,信息更豐富。激光雷達采集到的物體信息呈現(xiàn)出一系列分散的、具有準確角度和距離信息的點,被稱為點云。通常,激光SLAM系統(tǒng)通過對不同時刻兩片點云的匹配與比對,計算激光雷達相對運動的距離和姿態(tài)的改變,也就完成了對機器人自身的定位。

激光雷達距離測量比較準確,誤差模型簡單,在強光直射以外的環(huán)境中運行穩(wěn)定,點云的處理也比較容易。同時,點云信息本身包含直接的幾何關(guān)系,使得機器人的路徑規(guī)劃和導航變得直觀。激光SLAM理論研究也相對成熟,落地產(chǎn)品更豐富。

圖1,激光SLAM的地圖構(gòu)建(谷歌Cartographer[1])

VSLAM簡介

眼睛是人類獲取外界信息的主要來源。視覺SLAM也具有類似特點,它可以從環(huán)境中獲取海量的、富于冗余的紋理信息,擁有超強的場景辨識能力。早期的視覺SLAM基于濾波理論,其非線性的誤差模型和巨大的計算量成為了它實用落地的障礙。近年來,隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機技術(shù)、計算性能的進步,實時運行的視覺SLAM已經(jīng)不再是夢想。

通常,一個VSLAM系統(tǒng)由前端和后端組成(圖2)。前端負責通過視覺增量式計算機器人的位姿,速度較快。后端,主要負責兩個功能:

一是在出現(xiàn)回環(huán)(即判定機器人回到了之前訪問過的地點附近)時,發(fā)現(xiàn)回環(huán)并修正兩次訪問中間各處的位置與姿態(tài);

二是當前端跟蹤丟失時,根據(jù)視覺的紋理信息對機器人進行重新定位。簡單說,前端負責快速定位,后端負責較慢的地圖維護。

VSLAM的優(yōu)點是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌,基于點云的激光SLAM算法無法區(qū)別他們,而視覺則可以輕易分辨。這帶來了重定位、場景分類上無可比擬的巨大優(yōu)勢。同時,視覺信息可以較為容易的被用來跟蹤和預(yù)測場景中的動態(tài)目標,如行人、車輛等,對于在復(fù)雜動態(tài)場景中的應(yīng)用這是至關(guān)重要的。第三,視覺的投影模型理論上可以讓無限遠處的物體都進入視覺畫面中,在合理的配置下(如長基線的雙目相機)可以進行很大尺度場景的定位與地圖構(gòu)建。

圖2,視覺SLAM的前端定位與后端地圖維護(ORB-SLAM2[2])

接下來我們將在細分項目上比較激光SLAM和VSLAM。

應(yīng)用場景

在應(yīng)用場景上,激光SLAM依據(jù)所使用的激光雷達的檔次基本被分為涇渭分明的室內(nèi)應(yīng)用和室外應(yīng)用,而VSLAM在室內(nèi)外都有豐富的應(yīng)用環(huán)境。VSLAM的主要挑戰(zhàn)是光照變化,例如在室外正午和夜間的跨時間定位與地圖構(gòu)建,其工作穩(wěn)定性不如高端室外多線激光雷達。近年來,光照模型修正和基于深度學習的高魯棒性特征點被廣泛應(yīng)用于視覺SLAM的研究中,體現(xiàn)出良好的效果,應(yīng)當說VSLAM隨著這些技術(shù)的進步將會在光照變化的環(huán)境中擁有更穩(wěn)定的表現(xiàn)。

影響穩(wěn)定工作的因素

激光SLAM不擅長動態(tài)環(huán)境中的定位,比如有大量人員遮擋其測量的環(huán)境,也不擅長在類似的幾何環(huán)境中工作,比如在一個又長又直、兩側(cè)是墻壁的環(huán)境。由于重定位能力較差,激光SLAM在追蹤丟失后很難重新回到工作狀態(tài)。而視覺SLAM在無紋理環(huán)境(比如面對整潔的白墻面),以及光照特別弱的環(huán)境中,表現(xiàn)較差。

定位和地圖構(gòu)建精度

在靜態(tài)且簡單的環(huán)境中,激光SLAM定位總體來講優(yōu)于視覺SLAM;但在較大尺度且動態(tài)的環(huán)境中,視覺SLAM因為其具有的紋理信息,表現(xiàn)出更好的效果。在地圖構(gòu)建上,激光SLAM的特點是單點和單次測量都更精確,但地圖信息量更??;視覺SLAM特別是通過三角測距計算距離的方法,在單點和單次測量精度上表現(xiàn)總體來講不如激光雷達,但可以通過重復(fù)觀測反復(fù)提高精度,同時擁有更豐富的地圖信息。

累計誤差問題

激光SLAM總體來講較為缺乏回環(huán)檢測的能力,累計誤差的消除較為困難。而視覺SLAM使用了大量冗余的紋理信息,回環(huán)檢測較為容易,即使在前端累計一定誤差的情況下仍能通過回環(huán)修正將誤差消除。

傳感器成本

激光雷達事實上有許多檔次,成本都高于視覺傳感器。最昂貴如Velodyne的室外遠距離多線雷達動輒數(shù)十萬元人民幣,而室外使用的高端中遠距離平面雷達如SICK和Hokuyo大約在數(shù)萬元人民幣的等級。室內(nèi)應(yīng)用較廣的中低端近距離平面激光雷達也需要千元級—,其價格相當于比較高端的工業(yè)級攝像頭和感光芯片。激光雷達量產(chǎn)后成本可能會大幅下降,但能否降到同檔次攝像頭的水平仍有一個大大的問號。

傳感器安裝和穩(wěn)定性

目前常見的激光雷達都是旋轉(zhuǎn)掃描式的,內(nèi)部長期處于旋轉(zhuǎn)中的機械結(jié)構(gòu)會給系統(tǒng)帶來不穩(wěn)定性,在顛簸震動時影響尤其明顯。而攝像頭不包含運動機械結(jié)構(gòu),對空間要求更低,可以在更多的場景下安裝使用(圖3)。不過,固態(tài)激光雷達的逐步成熟可能會為激光SLAM扳回這項劣勢。

圖3 激光雷達和視覺系統(tǒng)的安裝應(yīng)用。谷歌無人車上的多線激光雷達

DJI精靈4上的視覺系統(tǒng)

算法難度

激光SLAM由于其研究的成熟以及誤差模型的相對簡單,在算法上門檻更低,部分開源算法甚至已經(jīng)被納入了ROS系統(tǒng)成為了標配。而反觀視覺SLAM,首先圖像處理本身就是一門很深的學問,而基于非線性優(yōu)化的地圖構(gòu)建上也是非常復(fù)雜和耗時的計算問題。現(xiàn)在已經(jīng)有許多優(yōu)秀的開源算法(如ORB-SLAM[2]、LSD-SLAM[3]),但在實際環(huán)境中優(yōu)化和改進現(xiàn)有的視覺SLAM框架,比如加入光照模型、使用深度學習提取的特征點、以及使用單雙目及多目融合視角等技術(shù),將是視覺SLAM進一步提升性能和實用性的必由之路。這些技術(shù)的算法門檻也遠遠高于激光SLAM。

計算需求

毫無疑問,激光SLAM的計算性能需求大大低于視覺SLAM。主流的激光SLAM可以在普通ARM CPU上實時運行,而視覺SLAM基本都需要較為強勁的準桌面級CPU或者GPU支持。但業(yè)界也看到了這其中蘊藏的巨大機會,為視覺處理定制的ASICS市場已經(jīng)蠢蠢欲動。一個很好的例子是Intel旗下的Movidius,他們設(shè)計了一種特殊的架構(gòu)來進行圖像、視頻與深度神經(jīng)網(wǎng)絡(luò)的處理,在瓦級的超低功耗下達到桌面級GPU才擁有的吞吐量。DJI的精靈4系列產(chǎn)品就是使用這類專用芯片,實現(xiàn)了高速低功耗的視覺計算,為無人機避障和近地面場景導航提供根據(jù)。

多機協(xié)作

視覺主要是被動探測,不存在多機器人干擾問題。而激光雷達主動發(fā)射,在較多機器人時可能產(chǎn)生干擾。尤其是固態(tài)激光雷達的大量使用,可能使得場景中充滿了信號污染,從而影響激光SLAM的效果。

未來趨勢

激光SLAM和視覺SLAM各擅勝場,單獨使用都有其局限性,而融合使用則可能具有巨大的取長補短的潛力。例如,視覺在紋理豐富的動態(tài)環(huán)境中穩(wěn)定工作,并能為激光SLAM提供非常準確的點云匹配,而激光雷達提供的精確方向和距離信息在正確匹配的點云上會發(fā)揮更大的威力(圖4)。而在光照嚴重不足或紋理缺失的環(huán)境中,激光SLAM的定位工作使得視覺可以借助不多的信息進行場景記錄。

圖4,KITTI數(shù)據(jù)集視覺里程計。ORB-SLAM[2],雙目視覺

V-LOAM[4],視覺引導激光修正

現(xiàn)實中的激光與視覺SLAM系統(tǒng)幾乎都會配備慣性元件、輪機里程計、衛(wèi)星定位系統(tǒng)、室內(nèi)基站定位系統(tǒng)等輔助定位工具,而近年來SLAM系統(tǒng)與其他傳感器的融合成為了一大熱點。不同于以往基于卡爾曼濾波的松耦合融合方法,現(xiàn)在學界的熱點是基于非線性優(yōu)化的緊耦合融合。例如與IMU的融合和實時相互標定,使得激光或視覺模塊在機動 (猛烈加減速和旋轉(zhuǎn)) 時可以保持一定的定位精度,防止跟蹤丟失,極大的提高定位與地圖構(gòu)建的穩(wěn)定性。

激光點云信息本身也仍有潛力可挖。在高端的遠距離多線激光雷達上,返回的點云除了包含方向和距離信息,還可以加入目標點的反射率信息。當線數(shù)較多較密時,由反射率信息構(gòu)成的數(shù)據(jù)可以視為一種紋理信息,因此可以在一定程度上享受視覺算法和紋理信息帶來的重定位等方面的優(yōu)勢。這些信息一旦融入到高精度地圖中,高精度地圖就可以在點云紋理兩種形式間無縫切換,使得利用高精度地圖的定位可以被只擁有廉價攝像頭的自動駕駛汽車分享。這也是目前國外一些團隊的研究方向([5])。

同時,視覺所依賴的投影模型,蘊含著非常豐富的“混搭”玩法。長、短基線的單雙目結(jié)合,可以在保證大尺度定位水平的同時提高中近距離的障礙探測和地圖構(gòu)建精度;廣角魚眼和360度全向攝像頭與標準單雙目的結(jié)合,使得VSLAM的覆蓋范圍可以進一步提升,特別適合對場景按照距離的遠近進行不同精度不同速度的定位。被動視覺與深度相機的結(jié)合,催生了RGB-D SLAM,而深度相機量程的逐步擴大,將給這種特殊VSLAM帶來更大的應(yīng)用空間。

VSLAM的另一個也許更宏大的擴展在AI端。端到端的深度學習所帶來的圖像特征,已經(jīng)在識別和分類領(lǐng)域大大超越了人類手工選擇的SIFT/SURF/ORB等特征。我們可以很安全的說,未來在低紋理、低光照等環(huán)境下,深度學習所訓練出的提取、匹配和定位估算等方法,也一定會超越目前VSLAM領(lǐng)域最先進的手工方法。更不用說,圖像本身所大量攜帶的信息,可以廣泛用于場景理解、場景分類、物體識別、行為預(yù)測等重要方面。一個很可能的情況是,未來視覺處理系統(tǒng)將直接包含定位、地圖構(gòu)建、運動規(guī)劃、場景理解以及交互等多個功能模塊,更緊密的聯(lián)合帶來更加智能的機器人行動能力。

如果想深入了解SLAM技術(shù)的過去、現(xiàn)在和未來趨勢,我們推薦文獻[6]。

結(jié)語

SLAM技術(shù)將賦予為機器人和智能體前所未有的行動能力。作為當前SLAM框架的主要類型,激光SLAM與視覺SLAM必將在相互競爭和融合中發(fā)展,必將帶來機器人技術(shù)和人工智能技術(shù)的真正革命,也將使得機器人從實驗室和展示廳中走出來,真正服務(wù)和解放人類。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27838

    瀏覽量

    204565
  • 激光
    +關(guān)注

    關(guān)注

    19

    文章

    3004

    瀏覽量

    64013
  • 機器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4266

    瀏覽量

    119539
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    405

    瀏覽量

    31710

原文標題:激光SLAM與視覺SLAM的現(xiàn)狀與趨勢

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    山田光學:一化機芯在機器人領(lǐng)域的創(chuàng)新應(yīng)用

    化機芯在機器人領(lǐng)域的創(chuàng)新應(yīng)用日益廣泛,其高度集成化的設(shè)計和強大的功能為機器人帶來了前所未有的性能提升和功能拓展。以下是一化機芯在
    的頭像 發(fā)表于 09-06 17:22 ?125次閱讀

    中國大陸AMOLED DDIC將于2024年迎來前所未有的需求高峰

     在全球顯示技術(shù)的浪潮中,OLED顯示驅(qū)動芯片(DDIC)市場正步入一個需求井噴的新階段,尤以智能手機領(lǐng)域的AMOLED DDIC市場甚,預(yù)計其將于2024年迎來前所未有的需求高峰。
    的頭像 發(fā)表于 08-27 14:35 ?548次閱讀

    蘋果曝光桌面機器人項目,售價約1000美元起

    8月15日,國際媒體披露,蘋果公司正秘密研發(fā)一款革命性的計算平臺,其核心亮點一款預(yù)計定價約1000美元(折合人民幣約7138元)的“桌面機器人”。這款機器人巧妙融合了機械臂與顯示屏技術(shù)
    的頭像 發(fā)表于 08-16 15:02 ?393次閱讀

    日本新型人形機器人亮相:邁向高空作業(yè)的新紀元

    在科技日新月異的今天,機器人技術(shù)正以前所未有的速度改變著我們的生產(chǎn)與生活方式。8月3日,日本機器人創(chuàng)新領(lǐng)域的佼佼者——“人機一”公司與立命
    的頭像 發(fā)表于 08-03 16:50 ?1964次閱讀

    日本推出革命性的人形機器人

    8月2日,日本科技界傳來新突破,立命館大學攜手滋賀縣草津市的“人機一機器人創(chuàng)新企業(yè),共同揭幕了一款革命性的人形機器人。這款機器人以其卓越的自適應(yīng)平衡
    的頭像 發(fā)表于 08-02 17:08 ?518次閱讀

    科通技術(shù):AI新動能,加速中國創(chuàng)新企業(yè)成長

    隨著人工智能技術(shù)的飛速發(fā)展,AI機器人行業(yè)正迎來前所未有的發(fā)展機遇。艾瑞咨詢預(yù)測,到2025年,中國智能機器人市場規(guī)模
    的頭像 發(fā)表于 07-10 15:35 ?271次閱讀

    谷歌計劃推出明星網(wǎng)紅AI聊天機器人,與Meta展開技術(shù)競爭

    在科技界風起云涌的當下,谷歌再次憑借其前瞻性的戰(zhàn)略布局和創(chuàng)新能力,成為了公眾關(guān)注的焦點。據(jù)The Information的獨家爆料,谷歌正秘密研發(fā)一款全新的AI聊天機器人,該機器人
    的頭像 發(fā)表于 06-26 18:23 ?918次閱讀

    復(fù)合機器人:重塑柔性生產(chǎn)的未來

    技術(shù)創(chuàng)新不斷追求的結(jié)晶。它集成了機器人的柔性與自動化設(shè)備的效率,不僅具有高度的集成性、精準的控制能力,還具備穩(wěn)定可靠的性能,各行各業(yè)的生產(chǎn)線帶來了
    的頭像 發(fā)表于 05-29 16:05 ?238次閱讀
    復(fù)合<b class='flag-5'>機器人</b>:重塑柔性生產(chǎn)的未來

    電子推出高壓觸覺反饋產(chǎn)品三大新功能

    隨著線性馬達技術(shù)研究的持續(xù)深入,艾電子推出高壓觸覺反饋產(chǎn)品三大新功能,賦予用戶前所未有的沉浸式體驗。
    的頭像 發(fā)表于 04-20 10:07 ?411次閱讀
    艾<b class='flag-5'>為</b>電子推出高壓觸覺反饋產(chǎn)品三大新功能

    Figure首發(fā)OpenAI大模型加持的機器人

    近日,機器人初創(chuàng)公司Figure在業(yè)界引起了廣泛關(guān)注,該公司成功發(fā)布了首個由OpenAI大模型加持的機器人demo。這一創(chuàng)新成果不僅展示了Figure在機器人技術(shù)領(lǐng)域的深厚實力,也
    的頭像 發(fā)表于 03-16 14:21 ?939次閱讀

    工業(yè)機器人應(yīng)用中的AI邊緣控制器:技術(shù)創(chuàng)新與效率提升的雙重驅(qū)動

    工業(yè)機器人應(yīng)用中的AI邊緣控制器:技術(shù)創(chuàng)新與效率提升的雙重驅(qū)動 隨著科技的不斷進步,AI邊緣控制器在工業(yè)機器人領(lǐng)域的應(yīng)用越來越廣泛。這種創(chuàng)新技術(shù)不僅推動了工業(yè)
    的頭像 發(fā)表于 03-08 10:45 ?546次閱讀

    再現(xiàn)打壓!美政府計劃對中國進口汽車采取“前所未有的行動

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2024年03月01日 11:16:16

    化AMR控制系統(tǒng)可以實現(xiàn)不同工位物料的自動搬運、分揀、裝卸等工作

    隨著科技的飛速發(fā)展,人工智能AI與3D視覺技術(shù)的結(jié)合正在引領(lǐng)新一代移動機器人的革新。富唯智能移動機器人,以其獨特的3D視覺
    的頭像 發(fā)表于 01-03 17:00 ?320次閱讀
    一<b class='flag-5'>體</b>化AMR控制系統(tǒng)可以實現(xiàn)不同工位物料的自動搬運、分揀、裝卸等工作

    大象機器人發(fā)布萬元級水星Mercury人形機器人產(chǎn)品系列

    人形機器人作為機器人產(chǎn)業(yè)中重要的一環(huán),其有著獨特的技術(shù)和功能,廣泛應(yīng)用于教育、科研、服務(wù)、娛樂和工業(yè)等領(lǐng)域,帶來了前所未有的便利和效率。
    發(fā)表于 12-22 16:19 ?233次閱讀
    大象<b class='flag-5'>機器人</b>發(fā)布萬元級水星Mercury人形<b class='flag-5'>機器人</b>產(chǎn)品系列

    嵌入式視覺技術(shù)如何賦予機器觀察能力

    “看”的能力一直被認為是生物體獨有的特質(zhì),它讓我們能夠識別形狀、顏色、紋理和深度,進而與外部世界互動。 而現(xiàn)在,這個能力正被賦予機器,這就是
    的頭像 發(fā)表于 10-18 11:36 ?2603次閱讀