0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

無人車業(yè)務(wù)中的視覺三維重建

新機(jī)器視覺 ? 來源:汽車自動(dòng)駕駛技術(shù) ? 作者:汽車自動(dòng)駕駛技術(shù) ? 2022-04-13 14:24 ? 次閱讀

業(yè)務(wù)背景

1.1 自動(dòng)駕駛高精度地圖

高精地圖也稱為高分辨率地圖(High Definition Map, HDMap)或者高度自動(dòng)駕駛地圖(Highly Automated Driving Map, HAD Map)。近些年,隨著自動(dòng)駕駛技術(shù)以及業(yè)務(wù)的蓬勃發(fā)展,高精地圖成為了實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛必不可少的數(shù)據(jù)。

高精地圖是一類擁有精確的地理位置信息和豐富的道路元素語(yǔ)義信息的地圖數(shù)據(jù),能起到構(gòu)建類似于人腦對(duì)于空間的整體記憶與認(rèn)知功能,可以幫助自動(dòng)駕駛車輛預(yù)知路面復(fù)雜信息,如坡度、曲率、航向等,更好的規(guī)避潛在的風(fēng)險(xiǎn)。是實(shí)現(xiàn)自動(dòng)駕駛的關(guān)鍵所在。

高精地圖以精細(xì)描述道路及其車道線、路沿、護(hù)欄、交通燈、交通標(biāo)志牌、動(dòng)態(tài)信息為主要內(nèi)容,具有精度高、數(shù)據(jù)維度多、時(shí)效性高等特點(diǎn)。為自動(dòng)駕駛汽車的規(guī)劃、決策、控制、定位、感知等應(yīng)用提供支撐,是自動(dòng)駕駛解決方案的基礎(chǔ)及核心。

高精地圖與普通的導(dǎo)航地圖不同,主要面向自動(dòng)駕駛汽車,通過車輛自身特有的定位導(dǎo)航體系,協(xié)助自動(dòng)駕駛系統(tǒng)完成規(guī)劃、決策、控制等功能,以及解決自動(dòng)駕駛車輛計(jì)算性能限制問題,拓展傳感器檢測(cè)范圍。

通俗來講,高精地圖是比普通導(dǎo)航地圖精度更高,數(shù)據(jù)維度更廣的地圖。其精度更高體現(xiàn)在地圖精度精確到厘米級(jí),數(shù)據(jù)維度更廣則體現(xiàn)在地圖數(shù)據(jù)除了道路信息以外還包括與交通相關(guān)的周圍靜態(tài)、動(dòng)態(tài)信息。

4bfe5f22-ba81-11ec-aa7f-dac502259ad0.png

普通導(dǎo)航地圖(左)vs高精地圖(右)

1.2 高精地圖對(duì)自動(dòng)駕駛的價(jià)值

高精地圖作為自動(dòng)駕駛的稀缺資源和必備構(gòu)件,能夠滿足自動(dòng)駕駛車輛在行駛過程中地圖精確計(jì)算匹配、實(shí)時(shí)路徑規(guī)劃導(dǎo)航、輔助環(huán)境感知、駕駛決策輔助和智能汽車控制的需要,并在每個(gè)環(huán)節(jié)都發(fā)揮著至關(guān)重要的作用。主要有以下幾個(gè)方面: 輔助環(huán)境感知 傳感器作為自動(dòng)駕駛的感官,有其局限性,如易受惡劣環(huán)境影響,性能受限或者算法魯棒性不足等。高精地圖可以對(duì)傳感器無法探測(cè)或者探測(cè)精度不夠的部分進(jìn)行補(bǔ)充,實(shí)現(xiàn)實(shí)時(shí)狀況的檢測(cè)以及外部信息的反饋,進(jìn)而獲取當(dāng)前位置精準(zhǔn)的交通狀況。

通過對(duì)高精地圖的解析,可以將當(dāng)前自動(dòng)駕駛車輛周邊的道路、交通設(shè)施、基礎(chǔ)設(shè)施等元素和元素質(zhì)檢的拓?fù)溥B接關(guān)系提取出來。如果自動(dòng)駕駛汽車在行駛過程中檢測(cè)到高精地圖不存在的元素,則在一定程度上可將這些元素視為障礙物。通過該方式,可以幫助感知系統(tǒng)識(shí)別周圍環(huán)境,提高檢測(cè)精度和檢測(cè)速度,并節(jié)約計(jì)算資源。

輔助定位 由于定位系統(tǒng)可能因環(huán)境關(guān)系或者系統(tǒng)穩(wěn)定性問題存在定位誤差,無人駕駛車輛并不能與周圍環(huán)境始終保持正確的位置關(guān)系,在無人駕駛車輛行駛過程中,利用高精地圖元素匹配可精確定位車輛在車道上的具體位置,從而提高無人駕駛車輛的定位精度。

相比更多的依賴于GNSS(Global Navigation Satellite System,全球?qū)Ш叫l(wèi)星系統(tǒng))提供定位信息的普通導(dǎo)航地圖,高精地圖更多依靠其準(zhǔn)確且豐富的先驗(yàn)信息(如車道形狀、曲率、路面導(dǎo)向箭頭、交通標(biāo)志牌等),通過結(jié)合高維度數(shù)據(jù)與高效率的匹配算法,能夠?qū)崿F(xiàn)符合自動(dòng)駕駛車輛所需的高精度定位功能。

輔助路徑規(guī)劃決策 普通導(dǎo)航地圖僅能給出道路級(jí)的路徑規(guī)劃,而高精地圖的路徑規(guī)劃導(dǎo)航能力則提高到了車道級(jí),例如高精地圖可以確定車道的中心線,可以保證無人駕駛車輛盡可能地靠近車道中心行駛。在人行橫道、低速限制或減速帶等區(qū)域,高精地圖可使無人駕駛車輛能夠提前查看并預(yù)先減速。對(duì)于汽車行駛附近的障礙物,高精地圖可以幫助自動(dòng)駕駛汽車縮小路徑選擇范圍,以便選擇最佳避障方案。

輔助控制 高精地圖是對(duì)物理環(huán)境道路信息的精準(zhǔn)還原,可為無人駕駛車輛加減速、并道和轉(zhuǎn)彎等駕駛決策控制提供關(guān)鍵道路信息。而且,高精地圖能給無人駕駛車輛提供超視距的信息,并與其他傳感器形成互補(bǔ),輔助系統(tǒng)對(duì)無人駕駛車輛進(jìn)行控制。

高精地圖為無人駕駛車輛提供了精準(zhǔn)的預(yù)判信息,具有提前輔助其控制系統(tǒng)選擇合適的行駛策略功能,有利于減少車載計(jì)算平臺(tái)的壓力以及對(duì)計(jì)算性能瓶頸的突破,使控制系統(tǒng)更多關(guān)注突發(fā)狀況,為自動(dòng)駕駛提供輔助控制能力。因此,高精地圖在提升汽車安全性的同時(shí),有效降低了車載傳感器和控制系統(tǒng)的成本。

1.3 高精地圖生產(chǎn)的路線

精度與成本的平衡

與傳統(tǒng)的標(biāo)精地圖生產(chǎn)相比,衛(wèi)星影像已經(jīng)無法滿足高精地圖的精度需求,地圖制作需要在地面進(jìn)行實(shí)際道路采集。為了滿足高精地圖的精度需求,業(yè)界的各家公司分別給出了不同的數(shù)據(jù)采集方案。主要可以分為以激光雷達(dá)(LiDAR)+ 組合慣導(dǎo) + RTK的高精度自采方案,以及有RTK+視覺的眾包采集方案。

簡(jiǎn)單的講,這兩種方案主要是在精度與成本兩個(gè)因素中進(jìn)行取舍的結(jié)果。兩者都經(jīng)歷了長(zhǎng)期的演進(jìn),孰優(yōu)孰劣無法一概而論。或者說,方案的選擇更多的要看具體的業(yè)務(wù)需求與場(chǎng)景條件。接下來本文對(duì)兩種采集方案進(jìn)行簡(jiǎn)要的介紹。

“高富帥”的高精自采方案:LiDAR+慣導(dǎo)+RTK

很多自動(dòng)駕駛廠商目前上線使用的高精地圖的原始數(shù)據(jù)都采集自高規(guī)格的多傳感器(LiDAR+慣導(dǎo)+RTK)采集設(shè)備。這種數(shù)據(jù)可重建出具備厘米級(jí)精度的道路地圖,但其采用的各種“頂配傳感器”動(dòng)輒幾十萬元。業(yè)界常見的裝備齊全的高精地圖采集車通常都需要幾百萬元一輛。加上其背后的巨大的數(shù)據(jù)處理及運(yùn)維成本,真可謂是“高富帥”的建圖方案。

4c1b3d40-ba81-11ec-aa7f-dac502259ad0.png

“LiDAR+慣導(dǎo)+RTK” 采集方案的采集車12

在這種方案下,建圖主要過程是以慣導(dǎo)+RTK融合的位姿作為先驗(yàn),之后基于LiDAR點(diǎn)云進(jìn)行三維場(chǎng)景的高精重建。得到精確的位姿和點(diǎn)云后,再通過LiDAR在地面上的反射率圖恢復(fù)出路面標(biāo)識(shí),并進(jìn)一步進(jìn)行矢量化,最終完成高精地圖的生產(chǎn)。通常而言,這種以LiDAR+慣導(dǎo)為主的建圖方法所獲得的高精地圖可以達(dá)到厘米級(jí)別的地圖精度,以滿足自動(dòng)駕駛中實(shí)時(shí)精準(zhǔn)定位的需求。

經(jīng)濟(jì)實(shí)惠的視覺眾包方案:GNSS+視覺

對(duì)于高精地圖生產(chǎn)而言,最大的成本不在于完成一次全路網(wǎng)的地圖構(gòu)建,而在于如何解決高精地圖的隨時(shí)更新。如何用較低的成本維持一個(gè)城市級(jí)別乃至國(guó)家級(jí)別路網(wǎng)的鮮度,才是各大地圖廠商面臨的最大挑戰(zhàn)。

隨著傳感器芯片的不斷發(fā)展,集成了GNSS、IMU(Inertial measurementunit,慣性測(cè)量單元)模塊與攝像頭的模塊的一體式設(shè)備成本已經(jīng)到達(dá)百元級(jí)別。事實(shí)上,這一傳感器組合采集的數(shù)據(jù)在很多路況下已經(jīng)可以勝任高精地圖重建任務(wù)。目前道路上有大量乘用車已經(jīng)安裝了帶有GNSS功能的行車記錄儀。一方面,行車記錄儀可以保證日常的行車安全需要。另一方面,記錄儀采集的原始數(shù)據(jù)可以通過網(wǎng)絡(luò)回傳到服務(wù)器,經(jīng)過數(shù)據(jù)清洗工作后形成建圖數(shù)據(jù)集,并進(jìn)一步通過地圖重建算法形成高精地圖。

由于傳感器成本較低,這樣的采集數(shù)據(jù)較之上文的“高富帥”方案精度較低,同時(shí)受路況和天氣的影響較大。因此在這種方案下,需要有很好的算法能力以及數(shù)據(jù)清洗能力,才能完成相應(yīng)的高精地圖生產(chǎn)與更新。

4c393340-ba81-11ec-aa7f-dac502259ad0.jpg

GNSS+視覺解決方案13 對(duì)于這種性價(jià)比極高的眾包方案,技術(shù)上有很多難關(guān)要攻克。例如如何高效合理的對(duì)原始采集數(shù)據(jù)進(jìn)行回傳與篩選,如何指定特定的區(qū)域進(jìn)行更新,如何克服低價(jià)傳感器帶來的各種誤差,如何解決設(shè)備多樣性帶來的誤差等等。同時(shí),如果真的將這種方式投入到規(guī)模化的高精地圖生產(chǎn),還需要解決好法律上的測(cè)繪合規(guī)的問題。 本文要介紹的視覺重建算法,正是這種高性價(jià)比重建方案中的核心技術(shù)。接下來,將基于這種GNSS+視覺的采集方式,介紹一下幾類可行的視覺重建系統(tǒng)設(shè)計(jì)方案。

視覺重建的系統(tǒng)設(shè)計(jì)

基于不同業(yè)務(wù)場(chǎng)景,數(shù)據(jù)特點(diǎn),研發(fā)人員可以為視覺重建設(shè)計(jì)不同的算法流程。這里簡(jiǎn)單介紹三類:基于Structure-from-Motion的重建、基于深度網(wǎng)絡(luò)的視覺重建、基于語(yǔ)義的矢量化視覺重建。下面將一一進(jìn)行介紹。 2.1 基于Structure-from-Motion的重建 在視覺高精地圖重建方面,Structure-form-Motion (SfM) 方案是非常常見的選擇。從業(yè)務(wù)需求上講,建圖大多無實(shí)時(shí)性要求,而對(duì)精度的要求較為嚴(yán)格。相比之下,各種VO或SLAM方案要追求實(shí)時(shí)性,同時(shí)其最終的目的更傾向于定位,而非建圖。SfM方案更強(qiáng)調(diào)建圖的精度,方案中并無時(shí)序性要求。這為地圖的長(zhǎng)期維護(hù)提供了便利。典型的SfM重建流程大致可以分為特征提取、稀疏重建,稠密重建三個(gè)步驟。

4c60bbd6-ba81-11ec-aa7f-dac502259ad0.png

Colmap中的SfM重建流程1? 特征與匹配 在SfM中,首先要進(jìn)行的就是特征點(diǎn)的提取與匹配工作。這一部分中,最經(jīng)典的莫過于SIFT特征子1。如果不限制具體的應(yīng)用場(chǎng)景(室內(nèi) vs. 室外,自然景觀 vs. 人造物體等等),那么SIFT特征子可以在各類場(chǎng)景中均有比較穩(wěn)定的特征提取與匹配結(jié)果。 隨著近些年深度學(xué)習(xí)網(wǎng)絡(luò)的發(fā)展,很多研究者提出了基于深度學(xué)習(xí)的特征提取與匹配方案。其中最著名的當(dāng)屬M(fèi)agicLeap團(tuán)隊(duì)提出的SuperPoint(CVPR2018)2+ SuperGlue(CVPR2020)3方案。 SuperPoint作為一種特征點(diǎn)提取算法,采用了自監(jiān)督的方式進(jìn)行訓(xùn)練,并采用了Homographic Adaptation技術(shù)大大加強(qiáng)了提取特征點(diǎn)的場(chǎng)景適應(yīng)性。相比于傳統(tǒng)的SIFT,提取的特征點(diǎn)可信度更強(qiáng)。 SuperGlue作為一種特征匹配算法,引入了注意力機(jī)制來強(qiáng)化網(wǎng)絡(luò)對(duì)特征的表達(dá)能力,從而使得在視差較大的兩幅圖像之間仍然可以很好的找到特征點(diǎn)間的匹配關(guān)系。在CVPR2020/ECCV2020的indoor/outdoor localization challenges中,使用了SuperPoint以及SuperGlue的方案名列前茅,充分展現(xiàn)了這兩種方法在特征提取與匹配方面的優(yōu)勢(shì)。

4c706982-ba81-11ec-aa7f-dac502259ad0.png

基于SuperPoint+SuperGlue的特征提取與匹配效果1? 在今年的CVPR2021上,商湯團(tuán)隊(duì)發(fā)表了LofTR?。該工作基于Transformer構(gòu)建了一個(gè)端到端的特征匹配模型,對(duì)于弱紋理區(qū)域可以給出較為準(zhǔn)確的匹配結(jié)果。由于Transformer提供了較大的感受野,使之可以更好的利用全局信息去對(duì)局部特征進(jìn)行描述。相較SuperPoint+SuperGlue,該方法在室內(nèi)的弱紋理場(chǎng)景有著更為穩(wěn)定可信的匹配結(jié)果。

4c9d5abe-ba81-11ec-aa7f-dac502259ad0.png

LofTR的特征匹配結(jié)果1?稀疏重建 完成了特征點(diǎn)的提取與匹配后,便可以開始增量式的稀疏重建。算法會(huì)基于一定的篩選條件,選擇兩幀作為初始幀,利用雙視幾何(two-view-geometry)的方法計(jì)算兩幀的相對(duì)位姿,并基于其中的一幀構(gòu)建本次重建的坐標(biāo)系。當(dāng)位姿確認(rèn)后,就可以基于特征點(diǎn)的匹配關(guān)系,三角化出空間中的3D地圖點(diǎn)。初始化完成后,便可以繼續(xù)選擇尚未注冊(cè)的新圖像注冊(cè)到模型中。注冊(cè)時(shí)可以用雙視幾何計(jì)算其與已有幀的相對(duì)位姿,也可以用3D-2D的方法(例如PnP, pespective-n-point)計(jì)算位姿,甚至可以使用精度較高的先驗(yàn)位姿直接注冊(cè)。注冊(cè)后要再次進(jìn)行三角化,計(jì)算出更多的3D地圖點(diǎn)。同時(shí),在注冊(cè)一定數(shù)量的新幀后,需要進(jìn)行BA(bundle adjustment)優(yōu)化,進(jìn)一步優(yōu)化位姿與地圖點(diǎn)的精度。上述注冊(cè)新幀,三角化,BA優(yōu)化的過程將循環(huán)進(jìn)行,直到完成所有圖像的重建。最終,就獲得了所有圖像的位姿以及一個(gè)由稀疏地圖點(diǎn)構(gòu)成的稀疏重建結(jié)果。

4cc75ee0-ba81-11ec-aa7f-dac502259ad0.png

長(zhǎng)距離稀疏重建結(jié)果

稠密重建

完成稀疏重建后,需要進(jìn)行稠密化建圖。這個(gè)過程中,首先要解決深度估計(jì)問題。得到了深度圖之后,結(jié)合深度圖與相機(jī)位姿,就可以進(jìn)行物體表面紋理的稠密重建。

以Colmap?中的稠密重建過程為例。首先要進(jìn)行深度估計(jì)。這個(gè)模塊大致可分為匹配代價(jià)構(gòu)造,代價(jià)累積,深度估計(jì),深度圖優(yōu)化這四個(gè)部分。Colmap中使用了NCC來構(gòu)造匹配代價(jià),之后使用Patch Match作為信息傳遞的策略。通過這個(gè)過程,深度估計(jì)問題轉(zhuǎn)化為針對(duì)每個(gè)特征,尋找其最優(yōu)的深度和法向量。整個(gè)過程利用GEM算法進(jìn)行優(yōu)化。Colmap中的方案對(duì)于弱紋理的區(qū)域無法很好的給出較好的深度估計(jì)。

在得到深度估計(jì)結(jié)果(深度圖)后,各幀的深度圖會(huì)進(jìn)行融合。在融合后RGB圖像上的像素就可以投影到三維空間中,得到稠密點(diǎn)云,完成最終的稠密重建。

對(duì)于道路場(chǎng)景而言,由于路面的特征點(diǎn)非常稀少(典型的弱紋理),所以使用經(jīng)典的算法恢復(fù)路面紋理具有較大的挑戰(zhàn)。于是,很多研究者開始嘗試?yán)蒙疃?a href="http://www.ttokpm.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)去解決這一難題。

2.2 基于深度網(wǎng)絡(luò)的視覺重建 在SfM中,當(dāng)在稀疏重建中獲得了相機(jī)的位姿之后,還需要稠密的深度圖來準(zhǔn)確的恢復(fù)出路面的DOM(Digital Orthophoto Map,數(shù)字正射影像圖)以及各種交通標(biāo)識(shí)。而基于特征點(diǎn)的SfM僅能提供一些稀疏的路面點(diǎn),這對(duì)于恢復(fù)路面平面是遠(yuǎn)遠(yuǎn)不夠的。因此需要借助其他方法來進(jìn)行稠密的深度恢復(fù)。 近些年,隨著深度學(xué)習(xí)的迅猛發(fā)展,越來越多的工作實(shí)現(xiàn)了基于RGB圖像的深度預(yù)測(cè)。按照工作發(fā)表的前后順序,大致可以將這一研究方向分為四類,分別是:基于單幀圖像的深度估計(jì),基于多幀圖像的深度估計(jì),同時(shí)估計(jì)相機(jī)運(yùn)動(dòng)與深度,基于自監(jiān)督訓(xùn)練的運(yùn)動(dòng)與深度估計(jì)。 基于單幀的深度估計(jì) 對(duì)于神經(jīng)網(wǎng)絡(luò)深度估計(jì),最簡(jiǎn)單的方式要算基于單幀的深度估計(jì)。這一領(lǐng)域比較經(jīng)典的工作有MonoDepth?及MonoDepth2?這兩個(gè)工作基于雙目的約束進(jìn)行無監(jiān)督訓(xùn)練,獲得的模型可以基于單幀RGB圖像輸出深度圖。 此種方法雖然可以很好的預(yù)測(cè)出稠密的深度圖,但由于在預(yù)測(cè)過程中缺乏幾何約束,因此模型存在泛化性的問題。一旦相機(jī)參數(shù)或者場(chǎng)景類型發(fā)生了變化,模型很難保證可以給出正確的深度預(yù)測(cè)。同時(shí),幀間的深度連續(xù)性也是這種方法難以解決的問題。因此,單幀的深度預(yù)測(cè)很難應(yīng)用到高精地圖的重建過程中。

4ce224f0-ba81-11ec-aa7f-dac502259ad0.png

單目深度預(yù)測(cè):MonoDepth21?

基于多幀圖像的深度估計(jì)

考慮到實(shí)際場(chǎng)景中我們的輸入是一個(gè)圖像序列,因此利用多視幾何(Multiview Video Stereo, MVS)進(jìn)行多幀的深度估計(jì)可以很好的解決單幀深度估計(jì)中多幀之間的深度連續(xù)性問題,同時(shí)由于可以利用幀間的幾何約束,模型能預(yù)測(cè)更準(zhǔn)確的深度值。

近些年很多工作圍繞這個(gè)問題展開。一個(gè)比較經(jīng)典的工作是MVSNet?,作者利用多幀構(gòu)建cost volume,對(duì)深度進(jìn)行估計(jì)。獲得初步的深度估計(jì)結(jié)果后,再通過一個(gè)優(yōu)化網(wǎng)絡(luò),對(duì)深度圖做進(jìn)一步的優(yōu)化,最終可以得到比較理想的深度信息。對(duì)于視覺高精重建任務(wù)而言,由于位姿存在著一定的誤差。因此一旦某一幀的位姿計(jì)算錯(cuò)誤,將會(huì)直接影響相鄰幀的深度預(yù)測(cè)。因此這種方案在道路重建任務(wù)中存在著一定的局限性。

同時(shí)估計(jì)相機(jī)運(yùn)動(dòng)與深度

解決多幀圖像深度估計(jì)問題時(shí),可以借鑒經(jīng)典SfM算法中“預(yù)測(cè)新幀的位姿-三角化獲得地圖點(diǎn)”這樣迭代的思路,讓網(wǎng)絡(luò)交替預(yù)測(cè)位姿與深度,并進(jìn)行多輪迭代。這樣能保證深度與位姿之間可以有很好的幾何匹配,同時(shí)也可以獲得較高的預(yù)測(cè)精度。

在這一方面,DeepV2D?是一個(gè)比較有代表性的工作。DeepV2D中引入了深度估計(jì)和運(yùn)動(dòng)估計(jì)兩個(gè)子網(wǎng)絡(luò)。網(wǎng)絡(luò)會(huì)選取一個(gè)長(zhǎng)度為5-8幀的滑窗,滑窗內(nèi)的圖像會(huì)輸入到兩個(gè)子網(wǎng)絡(luò)中,推理得到的深度和位姿會(huì)相互更新。經(jīng)過幾輪更新之后,最終就可以得到連續(xù)性好,精度高的深度預(yù)測(cè)結(jié)果。這種網(wǎng)絡(luò)設(shè)計(jì)充分的利用了圖像的運(yùn)動(dòng)特性與幾何約束,可以很好的利用相鄰的多幀信息的對(duì)深度進(jìn)行預(yù)測(cè)。在兩個(gè)子網(wǎng)迭代結(jié)果的過程中,預(yù)測(cè)精度會(huì)逐漸收斂,得到的深度也會(huì)有比較好的連續(xù)性。

4d03bfb6-ba81-11ec-aa7f-dac502259ad0.png

同時(shí)預(yù)測(cè)深度與相機(jī)運(yùn)動(dòng)的網(wǎng)絡(luò):DeepV2D1?

下圖展示了使用LiDAR數(shù)據(jù)訓(xùn)練而得的深度估計(jì)網(wǎng)絡(luò)模型,在實(shí)際道路上預(yù)測(cè)深度的結(jié)果??梢娫谶@種典型的弱紋理場(chǎng)景下,網(wǎng)絡(luò)一方面可以較好的預(yù)測(cè)出平整的路面,同時(shí)也可以對(duì)物體邊緣(路沿,樹木)有較好的描述。

4d17300a-ba81-11ec-aa7f-dac502259ad0.png

輸入RGB圖像(上)深度預(yù)測(cè)結(jié)果(下)

基于自監(jiān)督訓(xùn)練的運(yùn)動(dòng)與深度估計(jì)

在上一類工作中,為了訓(xùn)練運(yùn)動(dòng)估計(jì)網(wǎng)絡(luò)與深度估計(jì)網(wǎng)絡(luò),需要大量高精度的深度圖作為訓(xùn)練數(shù)據(jù)。為了解決一些業(yè)務(wù)上缺乏訓(xùn)練數(shù)據(jù)的問題,有一些研究者提出了無監(jiān)督的訓(xùn)練方法去進(jìn)行單目深度估計(jì)訓(xùn)練。例如最近在CVPR2021上發(fā)表的ManyDepth1?。類似于Monodepth,此方法利用了cost volume進(jìn)行深度估計(jì)。對(duì)于相鄰幀,其預(yù)測(cè)了幀間的相對(duì)位置,以便于多幀之前構(gòu)建cost volume。同時(shí)也使用提取局部特征的方法,將特征圖輸入到最終的深度預(yù)測(cè)中,提高深度預(yù)測(cè)的穩(wěn)定性。對(duì)于道路場(chǎng)景深度預(yù)測(cè)中最難解決的動(dòng)態(tài)物體問題,該工作也給出了基于置信度預(yù)測(cè)的解決方案。

4d35ff44-ba81-11ec-aa7f-dac502259ad0.png

自監(jiān)督的單目深度估計(jì)網(wǎng)絡(luò):ManyDepth1?

2.3 基于語(yǔ)義的矢量化視覺重建

端側(cè)實(shí)時(shí)重建

在業(yè)界一些廠商的實(shí)踐中,有些公司提出了“通過語(yǔ)義分割檢測(cè)+語(yǔ)義重建來創(chuàng)建矢量地圖”(地平線NavNet方案11)。該方案僅需一顆前視攝像頭,運(yùn)用深度學(xué)習(xí)和SLAM技術(shù)實(shí)現(xiàn)了道路場(chǎng)景的語(yǔ)義三維重建,將建圖與定位的過程全部在車端實(shí)時(shí)進(jìn)行。車輛通過前視攝像頭捕捉即時(shí)交通信息,然后抽象出道路場(chǎng)景的特征(即實(shí)現(xiàn)場(chǎng)景語(yǔ)義三維重建),并直接在車端完成地圖“繪制”與定位。 在數(shù)據(jù)采集過程中,路況信息的采集通過幾項(xiàng)相關(guān)的傳感器來實(shí)現(xiàn)——攝像頭,GNSS和IMU。在這之后,輸入的圖像數(shù)據(jù)會(huì)進(jìn)行基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)義分析,以獲得主要的道路要素信息。 在建圖過程中,方案通過語(yǔ)義SLAM的方式來實(shí)現(xiàn)高精度地圖的創(chuàng)建。具體來說,方案使用語(yǔ)義分割檢測(cè)+語(yǔ)義重建來創(chuàng)建矢量地圖,將后端優(yōu)化、語(yǔ)義識(shí)別和參數(shù)化等方面和鏈路,融合成為一條優(yōu)化模塊——聯(lián)合優(yōu)化模塊,既簡(jiǎn)化了工作的流程,節(jié)約時(shí)間和運(yùn)算能耗,又可以實(shí)現(xiàn)同樣的功能。 如果在同一路段有多次采集的數(shù)據(jù),在云端可以將大量車輛采集的地圖片段數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,以矢量地圖要素的屬性參數(shù)為變量,根據(jù)屬性的相似度約束建立統(tǒng)一的目標(biāo)函數(shù),優(yōu)化求解以獲得融合地圖結(jié)果。這一融合優(yōu)化過程既可以定時(shí)全量執(zhí)行,也可以根據(jù)地圖更新的結(jié)論,經(jīng)過事件觸發(fā)進(jìn)行高效融合之后,提供更新、更精準(zhǔn)的地圖信息,即可快速地發(fā)布到車端供車輛定位導(dǎo)航使用。

離線重建

由于實(shí)時(shí)性的要求,端側(cè)實(shí)時(shí)重建方案需要偏定制化的硬件方案來提供足夠的算力支撐。另一方面,如果不需要實(shí)時(shí)的建圖,也可以使用前文提到的SfM方式先進(jìn)行稀疏重建并使用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)深度圖,之后結(jié)合語(yǔ)義分割結(jié)果進(jìn)行后續(xù)的要素跟蹤與矢量化。

具體而言,在獲得相機(jī)位姿和深度信息后,可以將路面像素投影到世界坐標(biāo)系中。之后,使用了語(yǔ)義跟蹤的技術(shù)來對(duì)反投影出的路面進(jìn)行融合。也就是利用幀間特征點(diǎn)的匹配關(guān)系,將每一幀投影的路面切片進(jìn)行對(duì)齊與融合,就可以得到相對(duì)平整清晰的路面DOM。同時(shí)在圖像上進(jìn)行路面標(biāo)識(shí)的檢測(cè),基于檢測(cè)結(jié)果提取矢量關(guān)鍵點(diǎn),并把這些關(guān)鍵點(diǎn)投到路面,就獲得了矢量化的路面標(biāo)識(shí)。在長(zhǎng)距離的重建過程中,在多次經(jīng)過或者掉頭的場(chǎng)景,會(huì)出現(xiàn)已經(jīng)矢量化的車道線或路面標(biāo)識(shí)重影。可以對(duì)已經(jīng)恢復(fù)出的矢量標(biāo)識(shí)進(jìn)行回環(huán)檢測(cè),并對(duì)其進(jìn)行與融合,進(jìn)一步消弭位姿與深度誤差帶來的影響。

4d4e7dd0-ba81-11ec-aa7f-dac502259ad0.png

基于語(yǔ)義分割及檢測(cè)進(jìn)行路面標(biāo)識(shí)矢量化(上)車道線矢量化的結(jié)果(下)

業(yè)務(wù)實(shí)踐中的探索

上文介紹了業(yè)界常見的幾種視覺建圖方案路線。在實(shí)際應(yīng)用的過程中,可以基于業(yè)務(wù)場(chǎng)景、數(shù)據(jù)特點(diǎn)、成本限制、硬件條件等實(shí)際因素,對(duì)其中的一些步驟進(jìn)行改造或組合。在這種改造中,只有對(duì)每種建圖路線的優(yōu)劣、限制條件有著比較深入的理解,才能真正設(shè)計(jì)出貼合業(yè)務(wù)需求的好算法方案。在無人車的地圖生產(chǎn)過程中,我們結(jié)合實(shí)際運(yùn)營(yíng)的業(yè)務(wù)需求與場(chǎng)景條件,也進(jìn)行了一些積極的探索。

在SfM重建過程中,目前稀疏重建算法只能處理短距離場(chǎng)景(2公里左右),而這距離實(shí)際業(yè)務(wù)需求有著指數(shù)級(jí)的差距。我們?cè)O(shè)計(jì)了分段重建、多段拼接以及聯(lián)合優(yōu)化的策略,把稀疏重建算法真正的應(yīng)用于實(shí)際業(yè)務(wù),不僅保證了重建精度,絕對(duì)誤差控制在0.5米以內(nèi),而且極大的縮短了重建耗時(shí)。

在特征點(diǎn)提取以及深度估計(jì)的網(wǎng)絡(luò)訓(xùn)練過程中,目前的公開數(shù)據(jù)集和實(shí)際業(yè)務(wù)場(chǎng)景之間存在較大的domain gap。因此我們采用了transfer learning的算法進(jìn)行了初步的探索,取得了不錯(cuò)的成果,最終重建的精度和穩(wěn)定性都獲得了顯著的提升。

總結(jié)與展望

在高精建圖重建任務(wù)中,相比于激光建圖路線,視覺建圖路線具備精度略低,成本極低,算力消耗較低等特點(diǎn)。因此,視覺建圖更適合進(jìn)行大范圍實(shí)時(shí)的更新。 在業(yè)務(wù)實(shí)踐中,激光建圖和視覺建圖的優(yōu)勢(shì)被很好的融合在了一起。在視覺重建方案中,利用了激光建圖生成的點(diǎn)云數(shù)據(jù)進(jìn)行訓(xùn)練數(shù)據(jù)集的構(gòu)建,得到了貼合實(shí)際場(chǎng)景的深度預(yù)測(cè)模型。通過視覺重建獲得的DOM和道路元素矢量結(jié)果可以對(duì)激光建圖結(jié)果形成很好的補(bǔ)充,提高了建圖生產(chǎn)的魯棒性。 在后續(xù)的迭代過程中,我們會(huì)持續(xù)的基于業(yè)務(wù)的需要和運(yùn)營(yíng)場(chǎng)景的特點(diǎn)進(jìn)行技術(shù)優(yōu)化。除了提升既有的方案性能,還將對(duì)一些新的方向進(jìn)行探索,包括:

全路況全天候的更新發(fā)現(xiàn)技術(shù)

全國(guó)范圍內(nèi)全等級(jí)道路的更新維護(hù)能力

端云結(jié)合的建圖計(jì)算架構(gòu)

希望通過我們的努力,為無人車配送業(yè)務(wù)提供新鮮而高質(zhì)量的高精地圖,保證業(yè)務(wù)的健康發(fā)展,把生活的便利帶給每一位消費(fèi)者。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    781

    文章

    13455

    瀏覽量

    165285
  • 無人車
    +關(guān)注

    關(guān)注

    1

    文章

    298

    瀏覽量

    36407

原文標(biāo)題:無人車業(yè)務(wù)中的視覺三維重建

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    留形科技借助NVIDIA平臺(tái)提供高效精確的三維重建解決方案

    本案例,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺(tái),實(shí)現(xiàn)邊緣設(shè)備上的實(shí)時(shí)、全彩、無損三維重建,從而在建筑細(xì)節(jié)捕捉、大型基礎(chǔ)設(shè)施的數(shù)字孿生等應(yīng)用,大幅提升三維
    的頭像 發(fā)表于 09-09 09:42 ?256次閱讀

    基于大模型的仿真系統(tǒng)研究一——三維重建大模型

    問題,賽目推出了基于大模型的仿真系統(tǒng),利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù),不僅推出自動(dòng)標(biāo)注大模型、多模態(tài)檢測(cè)大模型和場(chǎng)景生成大模型等模塊,并且引入三維重建大模型加強(qiáng)渲染畫面真實(shí)性。 ? ?通過上述模塊,賽目的路采
    的頭像 發(fā)表于 07-30 14:51 ?875次閱讀
    基于大模型的仿真系統(tǒng)研究一——<b class='flag-5'>三維重建</b>大模型

    泰來三維|三維激光掃描技術(shù)在古建筑保護(hù)的應(yīng)用

    通過三維激光掃描技術(shù),可以快速獲取古建筑的精確三維模型。在文物保護(hù)與修復(fù)過程,利用三維模型可以更加全面、準(zhǔn)確地記錄古建筑的損傷情況,并輔助修復(fù)工作的設(shè)計(jì)和實(shí)施。例如,通過對(duì)模型進(jìn)行測(cè)
    的頭像 發(fā)表于 06-21 09:15 ?341次閱讀
    泰來<b class='flag-5'>三維</b>|<b class='flag-5'>三維</b>激光掃描技術(shù)在古建筑保護(hù)<b class='flag-5'>中</b>的應(yīng)用

    泰來三維| 三維掃描在汽車工廠生產(chǎn)改造的應(yīng)用

    在生產(chǎn)線改造過程,三維掃描技術(shù)同樣具有不可替代的作用。通過對(duì)生產(chǎn)線設(shè)備、工藝流程和裝配過程進(jìn)行三維掃描,可以獲取詳細(xì)的三維數(shù)據(jù),為生產(chǎn)線改造提供精確的參考依據(jù)。利用這些數(shù)據(jù),可以分析
    的頭像 發(fā)表于 06-17 13:29 ?181次閱讀

    三維可視:展現(xiàn)未來的視覺盛宴

    帶你了解這一領(lǐng)域的種種奇跡。 一、三維可視化技術(shù)的定義 三維可視化技術(shù)是基于計(jì)算機(jī)圖形學(xué)和計(jì)算機(jī)視覺的一種技術(shù),用于創(chuàng)建和呈現(xiàn)逼真的三維場(chǎng)景。通過使用復(fù)雜的算法和圖像處理技術(shù),它能夠模
    的頭像 發(fā)表于 06-05 15:48 ?215次閱讀

    泰來三維|數(shù)字化工廠_煤礦三維掃描數(shù)字化解決方案

    采用大空間三維激光掃描儀對(duì)廠區(qū)內(nèi)部進(jìn)行架站式精準(zhǔn)三維掃描。廠區(qū)外部采用無人機(jī)傾斜攝影的方式獲取彩色模型數(shù)據(jù),采集控制點(diǎn)坐標(biāo)與三維點(diǎn)云進(jìn)行坐標(biāo)轉(zhuǎn)換融合點(diǎn)云數(shù)據(jù),快速得到廠區(qū)內(nèi)外完整的
    的頭像 發(fā)表于 05-29 11:55 ?360次閱讀
    泰來<b class='flag-5'>三維</b>|數(shù)字化工廠_煤礦<b class='flag-5'>三維</b>掃描數(shù)字化解決方案

    三維掃描與3D打印在法醫(yī)頭骨重建中的突破性應(yīng)用

    隨著科技的飛速發(fā)展,三維掃描和3D打印技術(shù)已經(jīng)逐漸滲透到醫(yī)療領(lǐng)域的各個(gè)環(huán)節(jié),為臨床診斷、治療和醫(yī)學(xué)研究帶來了前所未有的便利。特別是在法醫(yī)學(xué)領(lǐng)域,三維掃描和3D打印技術(shù)的應(yīng)用更是為頭骨重建、身份鑒定等
    的頭像 發(fā)表于 04-19 10:26 ?293次閱讀
    <b class='flag-5'>三維</b>掃描與3D打印在法醫(yī)頭骨<b class='flag-5'>重建</b>中的突破性應(yīng)用

    泰來三維|文物三維掃描,文物三維模型怎樣制作

    文物三維掃描,文物三維模型怎樣制作:我們都知道文物是不可再生的,要繼續(xù)保存?zhèn)鞒?,需要文?b class='flag-5'>三維數(shù)字化保護(hù),所以三維數(shù)字化文物保護(hù)是非常重要的一個(gè)技術(shù)手段。 那么文物
    的頭像 發(fā)表于 03-12 11:10 ?442次閱讀
    泰來<b class='flag-5'>三維</b>|文物<b class='flag-5'>三維</b>掃描,文物<b class='flag-5'>三維</b>模型怎樣制作

    工業(yè)上常見的高精度主動(dòng)式重建算法

    三維重建目前是最為炙手可熱的領(lǐng)域。攝影測(cè)量或結(jié)構(gòu)光投影技術(shù)可以解決漫反射重建問題,但卻無法有效應(yīng)對(duì)鏡面反射物體(如玻璃、積水、反光物體和汽車車身)等的重建挑戰(zhàn)。
    發(fā)表于 01-05 10:46 ?339次閱讀
    工業(yè)上常見的高精度主動(dòng)式<b class='flag-5'>重建</b>算法

    三維視覺測(cè)量技術(shù)知識(shí)科普

    三維視覺測(cè)量技術(shù)按照測(cè)量過程是否投射光源,獲取被測(cè)物體三維形貌信息的方法可以分為兩大類: 被動(dòng)視覺測(cè)量和主動(dòng)
    的頭像 發(fā)表于 01-03 11:47 ?709次閱讀
    <b class='flag-5'>三維</b><b class='flag-5'>視覺</b>測(cè)量技術(shù)知識(shí)科普

    基于光學(xué)計(jì)算超表面的全光學(xué)目標(biāo)識(shí)別和三維重建技術(shù)

    隨著物體識(shí)別和三維(3D) 重建技術(shù)在各種逆向工程、人工智能、醫(yī)療診斷和工業(yè)生產(chǎn)領(lǐng)域變得必不可少,人們?cè)絹碓疥P(guān)注與尋求可以簡(jiǎn)化處理的高效、更快的速度和更集成的方法。
    的頭像 發(fā)表于 12-22 10:13 ?466次閱讀
    基于光學(xué)計(jì)算超表面的全光學(xué)目標(biāo)識(shí)別和<b class='flag-5'>三維重建</b>技術(shù)

    基于深度學(xué)習(xí)的三維重建技術(shù)

    多視圖立體幾何(Multi-View Stereo,MVS)是計(jì)算機(jī)視覺重要的研究領(lǐng)域,也是邁入三維計(jì)算機(jī)視覺研究的重點(diǎn)問題。它通過利用多張互相重疊的圖像恢復(fù)出原始
    的頭像 發(fā)表于 12-04 10:08 ?800次閱讀
    基于深度學(xué)習(xí)的<b class='flag-5'>三維重建</b>技術(shù)

    RayDF:實(shí)時(shí)渲染!基于射線的三維重建新方法

    在機(jī)器視覺和機(jī)器人領(lǐng)域的許多前沿應(yīng)用,學(xué)習(xí)準(zhǔn)確且高效的三維形狀表達(dá)是十分重要的。然而,現(xiàn)有的基于三維坐標(biāo)的隱式表達(dá)在表示三維形狀或是渲染二
    的頭像 發(fā)表于 11-17 16:23 ?600次閱讀
    RayDF:實(shí)時(shí)渲染!基于射線的<b class='flag-5'>三維重建</b>新方法

    三維立體視覺三維恢復(fù)方法

    電子發(fā)燒友網(wǎng)站提供《三維立體視覺三維恢復(fù)方法.doc》資料免費(fèi)下載
    發(fā)表于 11-03 09:31 ?0次下載
    <b class='flag-5'>三維</b>立體<b class='flag-5'>視覺</b>之<b class='flag-5'>三維</b>恢復(fù)方法

    如何實(shí)現(xiàn)超高精度智能化全彩手持三維掃描

    全彩三維掃描儀是基于實(shí)時(shí)三維重建應(yīng)用場(chǎng)景設(shè)計(jì)的高集成度易操作的手持式三維掃描系統(tǒng),可實(shí)現(xiàn)0.03秒高速掃描并一鍵自動(dòng)完成點(diǎn)云全局注冊(cè),去噪融合,無損網(wǎng)格化,補(bǔ)洞,曲率抽樣生成STL標(biāo)準(zhǔn)三維
    的頭像 發(fā)表于 10-16 15:58 ?646次閱讀
    如何實(shí)現(xiàn)超高精度智能化全彩手持<b class='flag-5'>三維</b>掃描