0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動(dòng)駕駛中統(tǒng)一感知和預(yù)測(cè)的隱式占位流場(chǎng)!

3D視覺工坊 ? 來(lái)源:3D視覺工坊 ? 2023-07-12 10:35 ? 次閱讀

1 前言

自動(dòng)駕駛車輛必須能夠感知周圍環(huán)境并預(yù)測(cè)其他交通參與者的未來(lái)行為?,F(xiàn)有的研究要么進(jìn)行目標(biāo)檢測(cè),然后對(duì)檢測(cè)到的目標(biāo)進(jìn)行軌跡預(yù)測(cè),要么對(duì)整個(gè)場(chǎng)景進(jìn)行密集的占位和流格預(yù)測(cè)。前者存在安全問(wèn)題,因?yàn)闉榱颂岣咝?,需要保持較低的檢測(cè)數(shù)量,從而犧牲了目標(biāo)的回收率。后者由于輸出格的高維度和完全卷積網(wǎng)絡(luò)固有的有限感受野而計(jì)算成本高。此外,這兩種方法都利用了許多計(jì)算資源來(lái)預(yù)測(cè)可能永遠(yuǎn)不會(huì)被運(yùn)動(dòng)規(guī)劃器查詢的區(qū)域或?qū)ο蟆?/p>

本文介紹了一種統(tǒng)一的感知和預(yù)測(cè)方法:通過(guò)單個(gè)神經(jīng)網(wǎng)絡(luò)隱式地表示占位和流格隨時(shí)間變化。該方法避免了不必要的計(jì)算,因?yàn)檫\(yùn)動(dòng)規(guī)劃器可以直接在連續(xù)的時(shí)空位置查詢它。此外,論文作者設(shè)計(jì)了一種架構(gòu),通過(guò)添加高效而有效的全局注意機(jī)制,克服了先前明確的占位預(yù)測(cè)方法的有限感受野。通過(guò)在城市和高速公路環(huán)境中進(jìn)行大量實(shí)驗(yàn),論文作者證明了他們的隱式模型優(yōu)于當(dāng)前的最先進(jìn)技術(shù)。

2 算法介紹

2.1 基礎(chǔ)概念補(bǔ)充——隱式幾何重建:

幾何重建是指在給定某個(gè)不完整表示(如圖像、LiDAR、體素)的情況下,預(yù)測(cè)對(duì)象的三維形狀的任務(wù)。隱式神經(jīng)幾何重建方法已被證明優(yōu)于顯式對(duì)應(yīng)方法,后者將三維形狀表示為網(wǎng)格、點(diǎn)集、體素或網(wǎng)格。相反,隱式方法訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)一個(gè)連續(xù)場(chǎng),為3D空間中的每個(gè)點(diǎn)分配一個(gè)值,以便從等值面中提取出形狀。具體而言,該網(wǎng)絡(luò)可以預(yù)測(cè)3D空間中的非線性二值占位,或者是到表面的有符號(hào)距離函數(shù)。論文作者則將它們應(yīng)用在自動(dòng)駕駛的感知和預(yù)測(cè)任務(wù)中的。

2.2 任務(wù)參數(shù)

輸入?yún)?shù)化:模型接受體素化的LiDAR表示()和高清地圖的光柵()作為輸入。對(duì)于LiDAR,設(shè)作為最近 次掃描的序列更準(zhǔn)確地說(shuō),是在時(shí)間步長(zhǎng)t '結(jié)束的LiDAR掃描,其中包含Pt '個(gè)點(diǎn),每個(gè)點(diǎn)由三個(gè)特征描述:。和是點(diǎn)相對(duì)于當(dāng)前時(shí)間步長(zhǎng)下的SDV參考框架的位置,該參考框架以SDV的當(dāng)前位置為中心并且x軸沿著其行進(jìn)方向。表示點(diǎn)相對(duì)于地面的高度。最后,,采用多次掃描鳥瞰圖體素化方法,沿著BEV平面法線方向分為D個(gè)深度通道,高度像素為H,寬度像素為W。對(duì)于光柵地圖,將高清地圖中表示車道中心線的多段線C進(jìn)行光柵化,生成具有相同的空間維度的單通道光柵圖。輸出參數(shù)化:設(shè)為BEV中的一個(gè)時(shí)空點(diǎn),在未來(lái)的時(shí)間t。這項(xiàng)工作是預(yù)測(cè)占位概率和流向量,指定占據(jù)該位置的任何車輛在BEV中的運(yùn)動(dòng)。采用反向流來(lái)建模流向量f,因?yàn)樗梢杂脝蝹€(gè)反向流向量來(lái)捕捉多模態(tài)的前向運(yùn)動(dòng)。更具體地,反向流描述了時(shí)間t和位置(x, y)處的運(yùn)動(dòng),它是該位置從到的平移向量,如果該位置有一個(gè)對(duì)象占據(jù),則為:

其中,表示時(shí)間時(shí)占據(jù)點(diǎn)在t時(shí)的BEV位置。

2.3 網(wǎng)絡(luò)架構(gòu)

作者使用一個(gè)多頭神經(jīng)網(wǎng)絡(luò)來(lái)參數(shù)化預(yù)測(cè)的占位概率和流向量。該網(wǎng)絡(luò)以體素化的LiDAR數(shù)據(jù)、光柵地圖和一個(gè)包含個(gè)時(shí)空查詢點(diǎn)的小批量作為輸入,并行估計(jì)小批量的占位概率和流向量:

其中,網(wǎng)絡(luò)分為卷積編碼器和隱式解碼器兩部分,用于計(jì)算場(chǎng)景特征并輸出占位概率和流向量的估計(jì)結(jié)果,如下圖所示。

67912d9e-203f-11ee-962d-dac502259ad0.png

編碼器由兩個(gè)處理BEV LiDAR和地圖光柵的卷積模塊組成,一個(gè)接收LiDAR和地圖光柵特征拼接的ResNet 輸出多分辨率特征平面,以及一個(gè)輕量級(jí)特征金字塔網(wǎng)絡(luò)(FPN)來(lái)處理這些特征平面。這樣就得到了一個(gè)分辨率為輸入的一半的BEV特征圖,其中包含了場(chǎng)景的幾何、語(yǔ)義和運(yùn)動(dòng)等上下文特征。值得注意的是,特征圖中的每個(gè)空間位置(特征向量)都包含了關(guān)于其鄰域(編碼器的感受野大小)的空間信息,以及過(guò)去秒的時(shí)間信息。換句話說(shuō),Z中的每個(gè)特征向量可能包含關(guān)于運(yùn)動(dòng)、局部道路幾何和鄰近車輛的重要線索。

作者設(shè)計(jì)了一個(gè)隱式占位概率和流向量解碼器,靈感來(lái)自于這樣的直覺:查詢點(diǎn)的占位概率可能是由于一個(gè)在時(shí)間t之前以快速速度移動(dòng)的遠(yuǎn)處物體引起的。因此,我們希望利用時(shí)空查詢位置周圍的局部特征來(lái)指示接下來(lái)應(yīng)該觀察的區(qū)域。例如,關(guān)于一個(gè)對(duì)象的特征可能在其原始位置周圍(在時(shí)間{}更具表達(dá)力,因?yàn)槟抢镉蠰iDAR的證據(jù)。與在時(shí)間t占據(jù)查詢點(diǎn)的對(duì)象可能發(fā)生交互的鄰近交通參與者也是需要關(guān)注的(例如,前車、在相似時(shí)間到達(dá)合并點(diǎn)的另一輛車)。

為了實(shí)現(xiàn)這些直覺,作者首先使用雙線性插值在查詢BEV位置處對(duì)特征圖進(jìn)行插值,得到包含查詢周圍局部信息的特征向量。然后,我們通過(guò)偏移初始查詢點(diǎn)來(lái)預(yù)測(cè)K個(gè)參考點(diǎn),其中偏移量?q是通過(guò)使用基于全連接的ResNet架構(gòu)計(jì)算得到的。對(duì)于所有的偏移量都獲得相應(yīng)的特征。這可以看作是一種形變卷積的形式;它預(yù)測(cè)并添加2D偏移量到卷積的規(guī)則網(wǎng)格采樣位置,并在這些偏移位置進(jìn)行特征向量的雙線性插值。為了聚合來(lái)自形變采樣位置的信息,我們使用了學(xué)習(xí)的線性投影的之間的交叉注意力。結(jié)果是聚合的特征向量z。有關(guān)該特征聚合過(guò)程的可視化。最后,將z和z_q與q進(jìn)行拼接,然后通過(guò)另一個(gè)基于全連接的ResNet架構(gòu),帶有兩個(gè)線性層頭來(lái)預(yù)測(cè)占位概率和流向。

3 網(wǎng)絡(luò)分析

67912d9e-203f-11ee-962d-dac502259ad0.png

在目標(biāo)位置對(duì)進(jìn)行插值操作;

使用該插值的特征向量來(lái)預(yù)測(cè)到特征圖中其他位置的K個(gè)注意力偏移;

在偏移位置處對(duì)Z進(jìn)行插值以獲得更多的特征向量;

在所有插值的特征上執(zhí)行交叉關(guān)注以生成最終特征向量Z;

并使用Z來(lái)預(yù)測(cè)每個(gè)查詢點(diǎn)的占位率和流格。

4 總結(jié)

本文介紹了一種針對(duì)自動(dòng)駕駛的聯(lián)合感知和預(yù)測(cè)的統(tǒng)一方法,通過(guò)神經(jīng)網(wǎng)絡(luò)隱式地表示隨時(shí)間變化的占位和流格。這種可查詢的隱式表示能夠更有效、更高效地向下游的運(yùn)動(dòng)規(guī)劃器提供信息。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:CVPR2023 l 新方法!自動(dòng)駕駛中統(tǒng)一感知和預(yù)測(cè)的隱式占位流場(chǎng)!

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    未來(lái)已來(lái),多傳感器融合感知自動(dòng)駕駛破局的關(guān)鍵

    駕駛的關(guān)鍵的是具備人類的感知能力,多傳感器融合感知正是自動(dòng)駕駛破局的關(guān)鍵。昱感微的雷視體多傳感器融合方案就好像
    發(fā)表于 04-11 10:26

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動(dòng)駕駛領(lǐng)域的主要應(yīng)用: 、感知算法加速 圖像處理:自動(dòng)駕駛中需要通過(guò)攝像頭獲取并識(shí)別道路信息和行駛環(huán)境,這涉及到大量的圖像處理任務(wù)。FPGA在處理圖像上的運(yùn)算速度快,可
    發(fā)表于 07-29 17:09

    【話題】特斯拉首起自動(dòng)駕駛致命車禍,自動(dòng)駕駛的冬天來(lái)了?

    自動(dòng)駕駛技術(shù)已經(jīng)有足夠積累,雖然還不完美無(wú)缺,但是可以投入商用,科技都是在使用中完善的,不能遭被蛇咬,十年怕井繩,難道發(fā)生次空難之后,以后飛機(jī)就停飛啦?技術(shù)朋友,更加關(guān)注問(wèn)題本身
    發(fā)表于 07-05 11:14

    自動(dòng)駕駛的到來(lái)

    的攻擊方式有幾種,是攻擊自動(dòng)駕駛的外部傳感器,科恩實(shí)驗(yàn)室對(duì)于特斯拉的模擬攻擊實(shí)驗(yàn)是個(gè)很好的例子。在這方面,使用多傳感器融合,綜合決策,而不是只依賴某個(gè)傳感器,是較好的解決辦法。另外,在傳感器中加入抗
    發(fā)表于 06-08 15:25

    AI/自動(dòng)駕駛領(lǐng)域的巔峰會(huì)議—國(guó)際AI自動(dòng)駕駛高峰論壇

    正與新的移動(dòng)商業(yè)模式起蓬勃發(fā)展。本次以人工智能作為自動(dòng)駕駛核心的國(guó)際AI自動(dòng)駕駛高峰論壇將匯聚全球汽車行業(yè)和半導(dǎo)體行業(yè)的核心參與者,深度剖析人工智能在汽車領(lǐng)域的突出發(fā)展,預(yù)測(cè)人工智能
    發(fā)表于 09-13 13:59

    即插即用的自動(dòng)駕駛LiDAR感知算法盒子 RS-Box

    ,即可快速、無(wú)縫地將激光雷達(dá)感知模塊嵌入到自己的無(wú)人駕駛方案中,真正實(shí)現(xiàn)“鍵獲得自動(dòng)駕駛激光雷達(dá)環(huán)境感知能力”。RS-BoxLiDAR
    發(fā)表于 12-15 14:20

    UWB主動(dòng)定位系統(tǒng)在自動(dòng)駕駛中的應(yīng)用實(shí)踐

    3萬(wàn)美元以上,相當(dāng)于輛中級(jí)車的價(jià)格。自動(dòng)駕駛四大核心技術(shù)分別為環(huán)境感知、高精度定位、路徑規(guī)劃、控制執(zhí)行。其中環(huán)境感知技術(shù)是最基礎(chǔ)、最重要的
    發(fā)表于 12-14 17:30

    車聯(lián)網(wǎng)對(duì)自動(dòng)駕駛的影響

    車聯(lián)網(wǎng)與智能駕駛車聯(lián)網(wǎng)和自動(dòng)駕駛密切相關(guān),很大程度上可以理解為是對(duì)自動(dòng)駕駛高階版本的增強(qiáng)和補(bǔ)充,通過(guò)車與車、車與人、車與交通基礎(chǔ)設(shè)施、車與網(wǎng)絡(luò)的互聯(lián)互通,讓對(duì)環(huán)境已經(jīng)具備感知能力的
    發(fā)表于 03-19 06:20

    如何讓自動(dòng)駕駛更加安全?

    上學(xué)……在歐洲,些志愿者家庭參加了自動(dòng)駕駛汽車在公共道路上的測(cè)試。對(duì)行駛狀況的監(jiān)測(cè),將給汽車工程師提供高價(jià)值的真實(shí)道路測(cè)試數(shù)據(jù),幫助完善自動(dòng)駕駛技術(shù)。在國(guó)內(nèi),上海、北京近期開始發(fā)放國(guó)內(nèi)首批智能網(wǎng)聯(lián)汽車
    發(fā)表于 05-13 00:26

    智能感知方案怎么幫助實(shí)現(xiàn)安全的自動(dòng)駕駛

    未來(lái),自動(dòng)駕駛將不再是科幻電影里的橋段,這是未來(lái)汽車的個(gè)趨勢(shì),感知自動(dòng)駕駛的重要組成部分,同時(shí)安全性至關(guān)重要。作為全球第7大汽車半導(dǎo)體供應(yīng)商,安森美半導(dǎo)體提供全面的智能
    發(fā)表于 07-31 07:11

    自動(dòng)駕駛汽車的處理能力怎么樣?

    對(duì)環(huán)境和擁堵產(chǎn)生積極影響。市場(chǎng)調(diào)研公司ABI Research預(yù)測(cè):到2030年,道路上四分之的汽車將會(huì)是自動(dòng)駕駛汽車。行業(yè)專家已經(jīng)為自動(dòng)駕駛的發(fā)展定義了五個(gè)級(jí)別。 每個(gè)級(jí)別分別描述
    發(fā)表于 08-07 07:13

    自動(dòng)駕駛汽車中傳感器的分析

    特斯拉在五月份發(fā)生的自動(dòng)駕駛事故,和最近在Defcon上演示的如何干擾傳感器,都充分說(shuō)明了傳感器在自動(dòng)駕駛中的重要性:環(huán)境感知自動(dòng)駕駛實(shí)現(xiàn)的基礎(chǔ),如果不能正確地
    發(fā)表于 05-14 07:34

    如何保證自動(dòng)駕駛的安全?

    美好未來(lái)到來(lái)的更快。AI還在路測(cè),黑客們的自動(dòng)駕駛已經(jīng)成熟了這點(diǎn)并不是危言聳聽,在自動(dòng)駕駛汽車還處在路測(cè)階段時(shí),汽車黑客就已經(jīng)能在地球另端把你家汽車開走了。早在2015年的
    發(fā)表于 10-22 07:45

    網(wǎng)聯(lián)化自動(dòng)駕駛的含義及發(fā)展方向

    (R17)標(biāo)準(zhǔn)?! ∨c此同時(shí),中國(guó)***直以推進(jìn)基于C-V2X技術(shù)的智能網(wǎng)聯(lián)汽車發(fā)展為主線,可彌補(bǔ)單車自動(dòng)駕駛自主感知方面的局限,讓自動(dòng)駕駛的實(shí)現(xiàn)不僅僅依托智能的車,同時(shí)與強(qiáng)大的網(wǎng)、
    發(fā)表于 01-12 15:42

    自動(dòng)駕駛技術(shù)的實(shí)現(xiàn)

    的帶寬有了更高的要求。從而使用以太網(wǎng)技術(shù)及中央域控制(Domain)和區(qū)域控制(Zonal)架構(gòu)是下代車載網(wǎng)絡(luò)的發(fā)展方向。然而對(duì)于自動(dòng)駕駛技術(shù)的實(shí)現(xiàn),涉及到感知、規(guī)劃、執(zhí)行三個(gè)層面。由于車輛行...
    發(fā)表于 09-03 08:31