0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

頂刊TPAMI最全綜述!深入自動(dòng)駕駛BEV感知的魔力!

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-14 09:53 ? 次閱讀

1. 寫在前面

今天筆者為大家推薦一篇BEV感知的最新綜述,分析了BEV感知的核心難點(diǎn),回顧了關(guān)于BEV感知的最新工作,并對(duì)不同的解決方案進(jìn)行了深入分析,還描述了來自工業(yè)界的幾種BEV方法的系統(tǒng)設(shè)計(jì)。

下面一起來閱讀一下這項(xiàng)工作~

2. 摘要

在鳥瞰圖( bird ' s-eye-view,BEV )中學(xué)習(xí)強(qiáng)大的表征用于感知任務(wù)是一種趨勢(shì),并引起了工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注。大多數(shù)自動(dòng)駕駛算法的傳統(tǒng)方法在前方或視角視圖中執(zhí)行檢測(cè)、分割、跟蹤等。隨著傳感器配置越來越復(fù)雜,集成來自不同傳感器的多源信息并在統(tǒng)一視圖中表示特征變得至關(guān)重要。BEV感知繼承了幾個(gè)優(yōu)點(diǎn),因?yàn)樵贐EV中表示周圍的場(chǎng)景是直觀的和融合友好的;而在BEV中表示對(duì)象是后續(xù)模塊在規(guī)劃和/或控制中最需要的。BEV感知的核心問題在于:( a )如何通過視角到BEV的視角轉(zhuǎn)換來重建丟失的三維信息;( b )如何獲取BEV網(wǎng)格中的真實(shí)標(biāo)注;( c )如何制定管線以納入來自不同來源和視圖的特征;( d )隨著傳感器配置在不同場(chǎng)景中的變化,如何適應(yīng)和推廣算法。在這項(xiàng)調(diào)查中,我們回顧了關(guān)于BEV感知的最新工作,并對(duì)不同的解決方案進(jìn)行了深入分析。此外,還描述了來自工業(yè)界的幾種BEV方法的系統(tǒng)設(shè)計(jì)。此外,我們還介紹了一套完整的實(shí)用指南,以提高BEV感知任務(wù)的性能,包括相機(jī)、激光雷達(dá)和融合輸入。最后,指出了該領(lǐng)域未來的研究方向。我們希望本報(bào)告能給社區(qū)帶來一些啟示,并鼓勵(lì)更多關(guān)于BEV感知的研究工作。

3. 文章結(jié)構(gòu)

BEV感知的任務(wù)總結(jié),包括輸入數(shù)據(jù)總結(jié)、底層任務(wù)總結(jié),還有核心任務(wù)總結(jié)。

3437b824-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知數(shù)據(jù)集總結(jié)。

3444d4a0-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知的主要工作。在輸入模態(tài)下," L "為LiDAR," SC "為單相機(jī)," MC "為多相機(jī)," T "為時(shí)間信息。在Task下,' ODet '用于3D目標(biāo)檢測(cè),' LDet '用于3D車道線檢測(cè),' MapSeg '用于地圖分割,' Plan '用于運(yùn)動(dòng)規(guī)劃,' MOT '用于多目標(biāo)跟蹤。

3462445e-b22e-11ee-8b88-92fbcf53809c.jpg

BEV感知算法在主流基準(zhǔn)上的性能比較。

3480e47c-b22e-11ee-8b88-92fbcf53809c.jpg

視覺BEV感知的通用框架。包括2D特征提取器、視圖轉(zhuǎn)換和3D解碼器3個(gè)部分。在視圖轉(zhuǎn)換中,有兩種方式對(duì)3D信息進(jìn)行編碼- -一種是從2D特征中預(yù)測(cè)深度信息;另一種是從3D空間采樣2D特征。

3491a55a-b22e-11ee-8b88-92fbcf53809c.jpg

LiDAR BEV感知的通用框架。將點(diǎn)云數(shù)據(jù)轉(zhuǎn)換為BEV表示主要有兩個(gè)分支。上層分支提取三維空間中的點(diǎn)云特征,提供更準(zhǔn)確的檢測(cè)結(jié)果。下層分支在2D空間中提取BEV特征,提供更高效的網(wǎng)絡(luò)

34a2634a-b22e-11ee-8b88-92fbcf53809c.jpg

視覺BEV感知檢測(cè)任務(wù)。

34b6f382-b22e-11ee-8b88-92fbcf53809c.jpg

LiDAR BEV感知分割任務(wù)。

34c8a474-b22e-11ee-8b88-92fbcf53809c.jpg

4. 總結(jié)

這篇綜述對(duì)近年來的BEV感知進(jìn)行了全面的回顧,作者認(rèn)為未來的發(fā)展趨勢(shì)是:( a )如何設(shè)計(jì)一個(gè)更精確的深度估計(jì)器;( b )如何在一種新的融合機(jī)制中更好地對(duì)齊來自多個(gè)傳感器的特征表示;( c )如何設(shè)計(jì)一個(gè)無參數(shù)的網(wǎng)絡(luò),使得算法的性能不受姿態(tài)變化或傳感器位置的影響,從而在各種場(chǎng)景中獲得更好的泛化能力;以及( d )如何從基礎(chǔ)模型中整合成功的知識(shí),以促進(jìn)BEV的感知。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2546

    文章

    50481

    瀏覽量

    751178
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4592

    瀏覽量

    92517
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13630

    瀏覽量

    165987

原文標(biāo)題:頂刊TPAMI最全綜述!深入自動(dòng)駕駛BEV感知的魔力!

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    自動(dòng)駕駛中一直說的BEV+Transformer到底是個(gè)啥?

    感知、理解和預(yù)測(cè)方面表現(xiàn)得更為強(qiáng)大,徹底終結(jié)了2D直視圖+CNN時(shí)代。BEV+Transformer通過鳥瞰視角與Transformer模型的結(jié)合,顯著提升了自動(dòng)駕駛
    的頭像 發(fā)表于 11-07 11:19 ?182次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>中一直說的<b class='flag-5'>BEV</b>+Transformer到底是個(gè)啥?

    聊聊自動(dòng)駕駛離不開的感知硬件

    自動(dòng)駕駛飛速發(fā)展,繞不開感知、決策和控制決策的經(jīng)典框架,而感知作為自動(dòng)駕駛汽車“感官”的重要組成部分,決定了自動(dòng)駕駛系統(tǒng)對(duì)環(huán)境的理解和反應(yīng)能
    的頭像 發(fā)表于 08-23 10:18 ?381次閱讀

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

    FPGA(Field-Programmable Gate Array,現(xiàn)場(chǎng)可編程門陣列)在自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FPGA在自動(dòng)駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動(dòng)駕駛領(lǐng)域的主要應(yīng)用: 一、感知算法加速 圖像處理:自動(dòng)駕駛中需要通過攝像頭獲取并識(shí)別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA在處理圖像上的運(yùn)算速度快,可并行性強(qiáng),且功耗
    發(fā)表于 07-29 17:09

    自動(dòng)駕駛識(shí)別技術(shù)有哪些

    自動(dòng)駕駛的識(shí)別技術(shù)是自動(dòng)駕駛系統(tǒng)中的重要組成部分,它使車輛能夠感知并理解周圍環(huán)境,從而做出智能決策。自動(dòng)駕駛識(shí)別技術(shù)主要包括多種傳感器及其融合技術(shù),以及基于這些傳感器數(shù)據(jù)的處理和識(shí)別算
    的頭像 發(fā)表于 07-23 16:16 ?502次閱讀

    深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,自動(dòng)駕駛技術(shù)作為其中的重要分支,正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng)中,深度學(xué)習(xí)技術(shù)發(fā)揮著至關(guān)重要的作用。它通過模擬人腦的學(xué)習(xí)過程,實(shí)現(xiàn)對(duì)車輛周圍環(huán)境的感知、理解和決策。本文將
    的頭像 發(fā)表于 07-01 11:40 ?622次閱讀

    未來已來,多傳感器融合感知自動(dòng)駕駛破局的關(guān)鍵

    的架構(gòu),預(yù)計(jì)未來許多智能駕駛團(tuán)隊(duì)都會(huì)引入“占用網(wǎng)絡(luò)”來提升系統(tǒng)能力。多維像素的應(yīng)用前景非常廣闊。昱感微的融合感知技術(shù)+BEV +Transformer+占用網(wǎng)格有望成為L3/L4級(jí)自動(dòng)駕駛
    發(fā)表于 04-11 10:26

    黑芝麻智能開發(fā)多重亮點(diǎn)的BEV算法技術(shù) 助力車企高階自動(dòng)駕駛落地

    隨著視覺算法的演進(jìn),BEV(Bird's-Eye-View Perception)感知算法成為主機(jī)廠和自動(dòng)駕駛公司發(fā)力城市場(chǎng)景的核心技術(shù)之一,BEV
    的頭像 發(fā)表于 03-29 18:18 ?1839次閱讀
    黑芝麻智能開發(fā)多重亮點(diǎn)的<b class='flag-5'>BEV</b>算法技術(shù) 助力車企高階<b class='flag-5'>自動(dòng)駕駛</b>落地

    BEV感知算法:下一代自動(dòng)駕駛的核心技術(shù)

    首先,BEV視圖存在遮擋小的優(yōu)點(diǎn),由于視覺的透視效應(yīng),現(xiàn)實(shí)世界的物體在2D圖像中很容易受到其他物體的遮擋,因此,傳統(tǒng)的基于2D的感知方式只能感知可見的目標(biāo),對(duì)于被遮擋的部分算法將無能為力。
    發(fā)表于 01-25 15:38 ?3945次閱讀
    <b class='flag-5'>BEV</b><b class='flag-5'>感知</b>算法:下一代<b class='flag-5'>自動(dòng)駕駛</b>的核心技術(shù)

    BEV和Occupancy自動(dòng)駕駛的作用

    BEV是Bird's Eye View 的縮寫,意為鳥瞰視圖。在自動(dòng)駕駛領(lǐng)域,BEV 是指從車輛上方俯瞰的場(chǎng)景視圖。BEV 圖像可以提供車輛周圍環(huán)境的完整視圖,包括車輛前方、
    發(fā)表于 01-17 12:33 ?677次閱讀
    <b class='flag-5'>BEV</b>和Occupancy<b class='flag-5'>自動(dòng)駕駛</b>的作用

    自動(dòng)駕駛領(lǐng)域中,什么是BEV?什么是Occupancy?

    BEV是Bird's Eye View 的縮寫,意為鳥瞰視圖。在自動(dòng)駕駛領(lǐng)域,BEV 是指從車輛上方俯瞰的場(chǎng)景視圖。
    的頭像 發(fā)表于 01-13 09:41 ?3265次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b>領(lǐng)域中,什么是<b class='flag-5'>BEV</b>?什么是Occupancy?

    自動(dòng)駕駛感知算法提升處理策略

    現(xiàn)代自動(dòng)駕駛系統(tǒng)的特點(diǎn)是按順序排列的模塊化任務(wù),傳統(tǒng)的方法是基于標(biāo)準(zhǔn)的感知-規(guī)劃-控制這種序列式架構(gòu)的主流處理方式。即首先將感知信息處理成人類可以理解的語義信息和道路交通信息,然后基于常態(tài)化知識(shí)
    的頭像 發(fā)表于 12-28 09:56 ?920次閱讀
    <b class='flag-5'>自動(dòng)駕駛</b><b class='flag-5'>感知</b>算法提升處理策略

    Nullmax揭秘BEV-AI技術(shù)架構(gòu)加速量產(chǎn)方案演進(jìn)

    12月19日,Nullmax首席科學(xué)家成二康博士應(yīng)邀出席2023全球自動(dòng)駕駛峰會(huì)(GADS 2023),在自動(dòng)駕駛BEV感知技術(shù)論壇上發(fā)表《BEV
    的頭像 發(fā)表于 12-22 14:46 ?1097次閱讀

    LabVIEW開發(fā)自動(dòng)駕駛的雙目測(cè)距系統(tǒng)

    LabVIEW開發(fā)自動(dòng)駕駛的雙目測(cè)距系統(tǒng) 隨著車輛駕駛技術(shù)的不斷發(fā)展,自動(dòng)駕駛技術(shù)正日益成為現(xiàn)實(shí)。從L2級(jí)別的輔助駕駛技術(shù)到L3級(jí)別的受條件約束的
    發(fā)表于 12-19 18:02

    BEV感知的二維特征點(diǎn)

    BEV感知的二維特征點(diǎn) 首先來簡單介紹一下什么是BEV感知BEV感知(Bird’s Eye
    的頭像 發(fā)表于 11-14 11:37 ?616次閱讀