0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用于自動駕駛的時空融合激光雷達地點識別算法SeqOT

3D視覺工坊 ? 來源:計算機視覺工坊 ? 作者:馬君驛 ? 2022-12-09 10:01 ? 次閱讀

論文作者:Junyi Ma, Xieyuanli Chen, Jingyi Xu, Guangming Xiong?

論文來源:IEEE Transactions on Industrial Electronics

1、摘要

在本文中,作者在其原有工作OverlapTransformer (OT)的基礎上,提出了一種用于自動駕駛的時空融合激光雷達地點識別算法SeqOT。SeqOT以多幀激光雷達數(shù)據(jù)作為輸入,使用端到端的方式直接為序列化數(shù)據(jù)提取全局描述子,用以快速的地點識別檢索。SeqOT采用多尺度Transformer結構對單幀高階特征與多幀高階特征進行增強和融合,并使用池化結構對多幀子描述子進行降維,顯著提升地點識別描述子特異性和實時性。此外,SeqOT具有yaw角旋轉(zhuǎn)不變和激光序列順序不變的結構,進一步提高自動駕駛車輛多角度地點識別的準確率。試驗結果表明,SeqOT在長、短時間跨度數(shù)據(jù)集上均具有很好的識別性能,且其運行速度快于激光雷達幀率,適用于實時運行的自動駕駛車輛。

2、主要工作與貢獻

本文的主要貢獻是一個端到端的地點識別神經(jīng)網(wǎng)絡,它利用連續(xù)的range image實現(xiàn)可靠的長期地點識別。受益于所提出的yaw角旋轉(zhuǎn)不變結構,SeqOT對視點變化和多幀激光雷達數(shù)據(jù)的輸入順序具有較強的魯棒性,因此即使在自動駕駛車輛以相反方向行駛時也能實現(xiàn)可靠的地點識別。SeqOT利用多尺度Transformer模塊來融合序列化激光雷達數(shù)據(jù)的時空信息,通過增強單幀內(nèi)部特征的關聯(lián)與多幀間特征的關聯(lián),增強地點描述子特異性,進而提升地點識別精度。

3、算法流程

38896004-775f-11ed-8abf-dac502259ad0.png

圖1 SeqOT算法結構

SeqOT由單幀編碼模塊、多幀編碼模塊,以及池化模塊組合而成。如圖1所示,首先將多幀三維激光點云通過球面投影轉(zhuǎn)換為多幀二維range image,然后將各幀range image輸入到單幀編碼模塊中,分別進行空間維度的壓縮和通道維度的擴張,再利用單幀Transformer模塊進行特征圖的特異性增強,然后將特異性增強后的結果與增強前的結果進行通道維度上的拼接。以上操作均對序列化激光信息中的單幀數(shù)據(jù)分別進行操作。接下來,將單幀編碼模塊輸出的特征輸入到多幀編碼模塊中,在將相鄰幀特征進行拼接后,輸入到多幀Transformer模塊進行多幀信息的高階特征融合與增強,然后將融合后的結果輸入到NetVLAD結構中生成一系列維度為1x256的子描述子向量。池化模塊將此輸入激光序列中的全部子描述子進行池化壓縮,為輸入激光序列生成最終的1x256全局描述子向量。

球面投影與yaw角旋轉(zhuǎn)等變性

SeqOT使用序列化range image作為輸入,并充分利用其yaw角旋轉(zhuǎn)等變性。一個三維激光點(x, y, z),通過如下公式就可以投影至一個二維的圖像像素(u, v),這就是球面投影生成range image的過程。range image上的每個像素點都代表激光點的距離信息。

389cf970-775f-11ed-8abf-dac502259ad0.png

range image本身具備yaw角旋轉(zhuǎn)等變性,即一幀激光點云相對于z軸的旋轉(zhuǎn)等價于本幀range image的平移。圖2展示了yaw角旋轉(zhuǎn)等變的簡單示例。

38b1ce36-775f-11ed-8abf-dac502259ad0.png

圖2 yaw角旋轉(zhuǎn)等變性示例

得益于三維點云繞z軸的旋轉(zhuǎn)等價于range image的平移,SeqOT后續(xù)的結構能夠輸出一系列yaw角旋轉(zhuǎn)等變的中間特征圖,進而最終將yaw角旋轉(zhuǎn)等變性轉(zhuǎn)化為yaw角旋轉(zhuǎn)不變性,輸出不受視點變化影響的全局描述子,從而保證多角度地點識別的可行性。

單幀編碼模塊

單幀編碼模塊對輸入序列激光幀的每一幀單獨進行高階特征提取?;诖饲暗墓ぷ鱗1],單幀編碼模塊使用了與OverlapTransformer相似的OverlapNetLeg對range image進行高度方向的壓縮與通道維度的擴張。而后的單幀Transformer模塊對OverlapNetLeg的輸出進行特異性增強,即增強單幀激光內(nèi)部不同特征之間的關聯(lián)。增強后的特征與增強前的特征進行拼接,得到y(tǒng)aw角旋轉(zhuǎn)等變的中間特征,輸入到后續(xù)的多幀編碼模塊。

多幀編碼模塊與池化模塊

多幀編碼模塊將連續(xù)幀經(jīng)過單幀編碼模塊輸出的序列化高階特征進行初步融合,池化模塊則對初步融合的特征進行描述子級的聚合,最終為序列化輸入計算地點識別描述子。在多幀編碼模塊中,首先將相鄰三幀點云對應的單幀編碼模塊的輸出進行拼接,構成更長的特征編碼,輸入至多幀Transformer模塊,對幀間特征關聯(lián)進行增強,實現(xiàn)多幀信息的融合。序列化信息融合后的特征輸入至NetVLAD結構中,提取一系列子描述子。池化模塊最終將序列子描述子進行聚合,生成一維地點識別全局描述子。由于結構中使用了具有順序不變性質(zhì)的NetVLAD結構與GeM池化結構,因此最終輸出的全局描述子具備yaw角旋轉(zhuǎn)不變性和激光序列順序不變性,示例如圖3所示,相關證明詳見論文。

38fadb3a-775f-11ed-8abf-dac502259ad0.png

圖3 全局描述子yaw角旋轉(zhuǎn)不變性示例

基于overlap的訓練

與此前工作[1]類似,SeqOT利用基于overlap劃分的數(shù)據(jù)集進行訓練。利用overlap作為label進行訓練的理念在OverlapNet論文[2]中有所闡述。訓練過程采用對比學習的思路,對于一幀query點云,同時向SeqOT輸入本幀點云對應的序列激光幀、以及它的kp個正樣本序列和kn個負樣本序列。基于overlap的triplet loss函數(shù)如下式所示。

3912427a-775f-11ed-8abf-dac502259ad0.png

使用overlap而不是點云之間的距離作為衡量正負樣本的基準,是因為overlap對于描述激光點云相似度來說是一個更為自然的方式;此外,點云間的overlap對應了后續(xù)點云配準的質(zhì)量,因此基于overlap對是否為同一地點進行判斷更有益于后續(xù)算法的進行。此外,本工作面向自動駕駛車輛地點識別最常用場景——可重復性行駛環(huán)境,為低顯存的嵌入式設備提供了更為節(jié)省資源的兩步訓練策略,即第一步:將triplet loss作用于多幀編碼模塊輸出的子描述子,訓練池化模塊之前的模型,并保存訓練使用的子描述子;第二步:利用保存的子描述子作為輸入,將triplet loss作用于SeqOT最終輸出的全局描述子,訓練池化模塊。

4、實驗結果

毫末數(shù)據(jù)集上的地點識別結果

3924b3ce-775f-11ed-8abf-dac502259ad0.png

KITTI和MulRan數(shù)據(jù)集上的泛化性測試結果

3944d8a2-775f-11ed-8abf-dac502259ad0.png

396889fa-775f-11ed-8abf-dac502259ad0.png

輸入序列長度的對比試驗結果

398decae-775f-11ed-8abf-dac502259ad0.png

多尺度Transformer的消融試驗結果

39b77cea-775f-11ed-8abf-dac502259ad0.png

yaw角旋轉(zhuǎn)不變性驗證

39dd84ee-775f-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4734

    瀏覽量

    100420
  • 激光雷達
    +關注

    關注

    967

    文章

    3921

    瀏覽量

    189444
  • 自動駕駛
    +關注

    關注

    782

    文章

    13622

    瀏覽量

    165953

原文標題:SeqOT: 基于時空融合Transformer的SOTA地點識別算法,代碼開源(IEEE Trans2022)

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    激光雷達技術的基于深度學習的進步

    信息。這使得激光雷達自動駕駛、無人機、機器人等領域具有廣泛的應用前景。 二、深度學習技術的發(fā)展 深度學習是機器學習的一個分支,它通過模擬人腦的神經(jīng)網(wǎng)絡結構來處理和分析數(shù)據(jù)。近年來,深度學習技術在圖像識別、語音
    的頭像 發(fā)表于 10-27 10:57 ?258次閱讀

    激光雷達自動駕駛中的應用

    自動駕駛車輛提供必要的環(huán)境感知能力。 1. 激光雷達的工作原理 激光雷達系統(tǒng)通常包括一個激光發(fā)射器、一個接收器、一個旋轉(zhuǎn)的機械部件(用于掃描
    的頭像 發(fā)表于 10-27 10:34 ?434次閱讀

    激光雷達與純視覺方案,哪個才是自動駕駛最優(yōu)選?

    主要分為兩大類:激光雷達與視覺感知。激光雷達因其能夠提供精確的距離和形狀信息,在自動駕駛技術早期的開發(fā)中被廣泛應用。然而,隨著計算機視覺技術的飛速進步,基于攝像頭的純視覺感知方案逐漸嶄露頭角,并在某些場景
    的頭像 發(fā)表于 09-29 10:47 ?356次閱讀

    激光雷達濾光片:自動駕駛的“眼睛之選”

    隨著科技的飛速進步,激光雷達作為核心技術,正以前所未有的態(tài)勢革新著我們的生活。從自動駕駛汽車的安全導航到智能機器人的敏銳環(huán)境感知,激光雷達的應用廣泛且深入,而濾光片則是其中不可或缺的一部分。
    的頭像 發(fā)表于 08-09 17:54 ?1713次閱讀
    <b class='flag-5'>激光雷達</b>濾光片:<b class='flag-5'>自動駕駛</b>的“眼睛之選”

    FPGA在自動駕駛領域有哪些應用?

    低,適合用于實現(xiàn)高效的圖像算法,如車道線檢測、交通標志識別等。 雷達和LiDAR處理:自動駕駛汽車通常會使用
    發(fā)表于 07-29 17:09

    自動駕駛汽車如何識別障礙物

    自動駕駛汽車識別障礙物是一個復雜而關鍵的過程,它依賴于多種傳感器和技術的協(xié)同工作。這些傳感器主要包括激光雷達(LiDAR)、雷達、攝像頭以及超聲波
    的頭像 發(fā)表于 07-23 16:40 ?862次閱讀

    百度蘿卜快跑第六代無人車攜手禾賽AT128激光雷達,共筑自動駕駛新篇章

    自動駕駛技術的浪潮中,激光雷達作為感知層的核心部件,正引領著行業(yè)向更高水平的智能化邁進。近日,激光雷達領域的佼佼者禾賽科技宣布了一項重要合作——成為百度蘿卜快跑第六代無人車主激光雷達
    的頭像 發(fā)表于 07-19 16:21 ?1431次閱讀

    基于FPGA的激光雷達控制板

    激光雷達作為一種高精度、高性能的傳感技術,廣泛應用于自動駕駛、機器人導航、工業(yè)自動化、無人機等應用領域。激光雷達控制板可以很好的滿足這些領域
    的頭像 發(fā)表于 05-28 08:11 ?579次閱讀
    基于FPGA的<b class='flag-5'>激光雷達</b>控制板

    阜時科技近期簽訂商用車自動駕駛全固態(tài)激光雷達批量訂單

    阜時科技戰(zhàn)略合作的某頭部激光雷達(LiDAR)公司,簽訂商用車自動駕駛全固態(tài)激光雷達批量訂單,近期將陸續(xù)交付。
    的頭像 發(fā)表于 04-11 14:08 ?1030次閱讀

    未來已來,多傳感器融合感知是自動駕駛破局的關鍵

    模態(tài)精準感知信息,使自動駕駛系統(tǒng)可以實時精準地感知道路上的各種狀況。 昱感微融合感知產(chǎn)品方案創(chuàng)新性地 將可見光攝像頭、紅外攝像頭以及4D毫米波雷達的探測數(shù)據(jù)在前端(數(shù)據(jù)獲取時)交互,將各傳感器的探測
    發(fā)表于 04-11 10:26

    激光雷達的應用場景

    激光雷達在多個領域中都有著廣泛的應用。以下是幾個主要的應用場景: 自動駕駛汽車:激光雷達自動駕駛汽車中起到了至關重要的作用。它可以幫助車輛檢測和
    的頭像 發(fā)表于 04-10 14:59 ?1108次閱讀

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng)

    挑戰(zhàn),包括激光雷達、單目測距和雙目視覺技術等。在當前的高級輔助駕駛技術(ADAS)中,雙目視覺技術在距離檢測方面表現(xiàn)出色,它可以精確地測量物體的距離,提供更客觀的數(shù)據(jù)。 為了應對這一需求,設計了一種
    發(fā)表于 12-19 18:02

    寶馬發(fā)力L3自動駕駛,摩根大通看好,激光雷達公司再迎暴漲

    來源:激光雷達老炮兒 (略有刪改) ?2023年12月14日,寶馬集團官方宣布,其搭載L3級別自動駕駛功能的車輛在上海市正式獲得高快速路自動駕駛測試牌照。未來,寶馬將在上海市政府的監(jiān)督和指導下,在
    的頭像 發(fā)表于 12-15 08:38 ?644次閱讀
    寶馬發(fā)力L3<b class='flag-5'>自動駕駛</b>,摩根大通看好,<b class='flag-5'>激光雷達</b>公司再迎暴漲

    探索新視界:車載激光雷達技術助力自動駕駛

    激光雷達(Lidar)又稱光學雷達,其通過向目標發(fā)射激光脈沖并接收反射回來的信號,來測量目標與傳感器之間的距離,具有輕便靈巧、分辨率高、抗干擾能力強等優(yōu)勢,在自動駕駛領域發(fā)揮著重要作用
    的頭像 發(fā)表于 11-24 10:27 ?531次閱讀
    探索新視界:車載<b class='flag-5'>激光雷達</b>技術助力<b class='flag-5'>自動駕駛</b>

    激光雷達和毫米波雷達的區(qū)別 哪個才是自動駕駛感知的最優(yōu)選擇?

    激光雷達和毫米波雷達的區(qū)別 哪個才是自動駕駛感知的最優(yōu)選擇? 激光雷達和毫米波雷達自動駕駛車輛
    的頭像 發(fā)表于 11-22 17:41 ?7442次閱讀