0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

地平線研發(fā)一種全新利用時(shí)空信息進(jìn)行編碼解碼的層級(jí)網(wǎng)絡(luò)

地平線HorizonRobotics ? 來源:地平線HorizonRobotics ? 作者:地平線HorizonRobot ? 2022-07-05 11:19 ? 次閱讀

摘要:近年來自動(dòng)駕駛場景中的預(yù)測任務(wù)逐漸興起一種新形式,即預(yù)測未來基于鳥瞰圖的空間占有柵格(occupancy)和光流(flow)。此類預(yù)測任務(wù)與傳統(tǒng)預(yù)測軌跡的任務(wù)相比在很多場景下會(huì)提供更多的信息,作為自動(dòng)駕駛上下游的一環(huán),有著更廣泛的應(yīng)用場景。在今年的Waymo Open Dataset Challenge 2022上,Waymo推出了此任務(wù)的全新挑戰(zhàn)賽。地平線在這個(gè)項(xiàng)目上研發(fā)出了一種全新的利用時(shí)空信息進(jìn)行編碼解碼的層級(jí)網(wǎng)絡(luò),通過多重編碼網(wǎng)絡(luò),多尺度時(shí)空融合,預(yù)測隱變量以及聯(lián)合柵格占有和光流的損失函數(shù)等創(chuàng)新性技術(shù),將這一任務(wù)的精度推上新的高度。

背景

預(yù)測任務(wù)是自動(dòng)駕駛場景中至關(guān)重要的一項(xiàng)任務(wù),其目的是通過對(duì)運(yùn)動(dòng)物體的歷史軌跡和運(yùn)動(dòng)狀態(tài)的觀測,結(jié)合道路信息,推測其未來的行為,為下游的規(guī)劃控制提供更豐富的預(yù)測信息。其表征形式通常為多條未來可能的軌跡。近年來,越來越多的研究表明,基于鳥瞰圖的空間占有柵格和光流的表征形式相比多條軌跡預(yù)測有更強(qiáng)的表征能力。相比于軌跡的形式,占有柵格有更豐富的空間分布信息,能更好的表征動(dòng)態(tài)物體的位置,形狀,身份的不確定性;其聯(lián)合概率分布的形式在一定程度上可以處理物體之間的交互的能力;同時(shí),所有的動(dòng)態(tài)物體可以同時(shí)并行處理,極大地提升了處理的效率;另外,此種方法還具有推測被遮擋物體的能力,能有效預(yù)防諸如“鬼探頭”等的情況;最后,其鳥瞰圖下的表征形式能更好地與上下游相結(jié)合?;谶@個(gè)趨勢,Waymo于今年推出了全新的自動(dòng)駕駛挑戰(zhàn)賽項(xiàng)目,即Occupancy and Flow Prediction Challenge。此挑戰(zhàn)賽給定過去一秒中動(dòng)態(tài)物體(車輛,自行車和行人)的運(yùn)動(dòng)軌跡,要求對(duì)未來八秒的可觀測物體的柵格占有、遮擋物體的柵格占有以及對(duì)應(yīng)光流做預(yù)測。本方法結(jié)合了CNN、transformer、三維稀疏卷積等優(yōu)勢,利用隱變量豐富了未來的信息,創(chuàng)新性地引入了層級(jí)時(shí)序解碼機(jī)制,在此次Waymo挑戰(zhàn)賽中取得了極佳的成績。

方法

e883bd60-fba9-11ec-ba43-dac502259ad0.png

輸入

模型的輸入包含了動(dòng)態(tài)信息和靜態(tài)信息。其中動(dòng)態(tài)信息包含了歷史幀和當(dāng)前幀的動(dòng)態(tài)物體(車輛,自行車和行人)的空間占有柵格信息以及對(duì)應(yīng)物體的屬性信息(比如物體檢測框的長寬高和速度等信息),靜態(tài)信息包含了整個(gè)場景的路面相關(guān)信息(比如道路中線,道路邊緣,路面其他特征等)。所有信息都被處理成二維鳥瞰圖并進(jìn)一步進(jìn)行時(shí)間尺度上的聚合。我們同時(shí)使用了2D編碼器和3D編碼器,其中針對(duì)2D編碼器,動(dòng)態(tài)信息輸入會(huì)直接在特征維上進(jìn)行時(shí)間拼接;而針對(duì)3D編碼器,時(shí)間會(huì)作為額外的維度(靜態(tài)信息在每一幀上進(jìn)行復(fù)制),并且輸入會(huì)作稀疏化處理。

編碼器

編碼器一共分為三種,分別是基本編碼器,注意力編碼器以及時(shí)空編碼器

基本編碼器:作為整個(gè)框架的基本編碼器,我們選擇使用了RegNet[1]模型。RegNet是一個(gè)設(shè)計(jì)完備且效率很高的模型。編碼器經(jīng)過層層降采樣編碼,生成了5個(gè)維度上的特征,對(duì)應(yīng)的尺度分別是輸入的1/2,1/4,1/8,1/16和1/32。

注意力編碼器:近年來,在檢測和分割任務(wù)中,SwinTransformer及其升級(jí)版SwinTransformerV2[2]取得了很好的結(jié)果?;谄洫?dú)特的局部窗口注意力機(jī)制,不僅能很好地編碼動(dòng)態(tài)物體和路面間的交互,還大量地減少了網(wǎng)絡(luò)計(jì)算量,因此我們使用了SwinTransformerV2來作為整個(gè)網(wǎng)絡(luò)的注意力編碼器。為了可以和基本編碼器輸出特征的尺度相對(duì)應(yīng),我們將每個(gè)patch的尺寸由4改成了2,由此注意力編碼器可以輸出和基本編碼器尺度相同的5個(gè)特征。

e8a677ce-fba9-11ec-ba43-dac502259ad0.png

時(shí)空編碼器:為了更好地進(jìn)行幀間信息交互提取,我們?cè)O(shè)計(jì)了一個(gè)3D時(shí)空編碼器來額外捕捉時(shí)間尺度上的信息。因?yàn)槲覀兊妮斎胄畔⒃邙B瞰圖上有著很高的稀疏度,我們選擇使用3D稀疏卷積和子流形稀疏卷積[3]來搭建網(wǎng)絡(luò)。這樣既可以大量地加速3D卷積的計(jì)算也可以有效防止稀疏特征在早期過快地膨脹(dilation)。我們對(duì)應(yīng)其他編碼器,設(shè)計(jì)了5階段網(wǎng)絡(luò),其中時(shí)間維在2和4階段進(jìn)行下采樣。針對(duì)網(wǎng)絡(luò)的每個(gè)輸出特征,我們將時(shí)間維和特征維進(jìn)行合并來使特征降維。

e8cd57ea-fba9-11ec-ba43-dac502259ad0.png

聚合器

聚合器由兩部分組成,在空間尺度上,我們利用BiFPN做多尺度的聚合;在時(shí)間尺度上,我們利用隱變量模型來豐富未來的信息。類比于條件變分器,我們?cè)诿恳粋€(gè)尺度,每一個(gè)空間位置都對(duì)未來的概率進(jìn)行建模。在訓(xùn)練階段,我們基于現(xiàn)在時(shí)刻的概率分布做采樣。推理階段,我們直接采用概率分布均值。為了保證預(yù)測分布和已觀測分布的一致性,我們采用Kullback-Leibler divergence損失函數(shù)作為監(jiān)督信號(hào)

e8eebc50-fba9-11ec-ba43-dac502259ad0.jpg

解碼器

解碼器采用多層級(jí)多尺度的特征金字塔形式,基本的組成單元為3D卷積Bottleneck結(jié)構(gòu)。3D bottleneck中采用了膨脹卷積和分組卷積,可以極大地?cái)U(kuò)大感受野并節(jié)省計(jì)算量。同時(shí),為了將編碼后的2D特征做時(shí)序展開,我們引入了3D轉(zhuǎn)置卷積Bottleneck。這些堆疊的bottleneck通過上采樣進(jìn)行多尺度的鏈接,有效地融合了多尺度的信息。同時(shí),為了節(jié)省計(jì)算量,我們?cè)谳敵龀叨壬嫌肅onvLSTM做時(shí)序上的修正。

e92a2dee-fba9-11ec-ba43-dac502259ad0.png

ec74a024-fba9-11ec-ba43-dac502259ad0.png

損失函數(shù)

對(duì)于可觀測占有柵格和被遮擋占有柵格的預(yù)測,我們采用Focal Loss作為其監(jiān)督信號(hào),兩者采用相同的權(quán)重進(jìn)行加權(quán)。

eced00be-fba9-11ec-ba43-dac502259ad0.png

對(duì)于光流的預(yù)測,我們采用Smooth L1損失函數(shù)。為了將光流和占有率的預(yù)測解耦,我們利用占有率的真值做加權(quán)。

ecfe2f2e-fba9-11ec-ba43-dac502259ad0.png

為了保證柵格占有率和光流預(yù)測的一致性,我們采用跟蹤損失函數(shù)進(jìn)行進(jìn)一步監(jiān)督。利用光流的預(yù)測,我們可以對(duì)前一幀的柵格占有率進(jìn)行空間變形來得到當(dāng)前幀的基于光流的空間占有預(yù)測。

ed39b922-fba9-11ec-ba43-dac502259ad0.png

最后將基于光流的空間占有預(yù)測和當(dāng)前幀柵格占有預(yù)測相乘,來得到當(dāng)前幀的空間占有-光流聯(lián)合預(yù)測,并用此聯(lián)合預(yù)測和當(dāng)前幀的柵格占有真值來計(jì)算損失函數(shù)traced loss。我們同時(shí)采用Focal loss和交叉熵?fù)p失函數(shù)進(jìn)行監(jiān)督[4]。

ed5b9b00-fba9-11ec-ba43-dac502259ad0.png

為保證聚合器中隱變量中現(xiàn)在和未來的一致性,我們采用Kullback-Leibler divergence損失函數(shù)作為監(jiān)督信號(hào)[5]來監(jiān)督預(yù)測的概率分布函數(shù)參數(shù)。

ed7f3c72-fba9-11ec-ba43-dac502259ad0.png

ed9fec56-fba9-11ec-ba43-dac502259ad0.png

最后,所有的損失函數(shù)進(jìn)行加權(quán)和作為最后的損失函數(shù)。

edb2da32-fba9-11ec-ba43-dac502259ad0.png

實(shí)驗(yàn)結(jié)果

消融實(shí)驗(yàn)

本表展示了在Waymo數(shù)據(jù)集上的消融實(shí)驗(yàn)結(jié)果,灰色的一列為評(píng)測的主指標(biāo)。可以看出,loss的改進(jìn),如focal loss和traced loss分別帶來了2.01%和0.46%的提升。同時(shí),更豐富的柵格化輸入帶來了1.23%的提升。同時(shí),結(jié)構(gòu)化的改進(jìn),包括隱變量,時(shí)空解碼器,以及解碼器的改進(jìn)帶來了約1.21%的提升。最后TTA帶來了約0.40%的提升。值得一提的是,所有的實(shí)驗(yàn)都是在十分之一的數(shù)據(jù)集上做的驗(yàn)證。這些結(jié)果充分的說明了我們方法的有效性。

edcf1f94-fba9-11ec-ba43-dac502259ad0.png

測試集表現(xiàn)

下表展示了我們方法在waymo測試集上的排名,灰色的一列代表評(píng)測的主指標(biāo),可以看出,我們的結(jié)果在主指標(biāo)上大幅領(lǐng)先對(duì)手,充分說明我們方法的優(yōu)越性。

f11ff90c-fba9-11ec-ba43-dac502259ad0.png

結(jié)果可視化

下面展示我們的方法在特定場景下的對(duì)接下來8秒占有柵格(左)和光流(右)的可視化結(jié)果。下面列出了直行,紅綠燈路口左轉(zhuǎn)右轉(zhuǎn)掉頭,無保護(hù)左轉(zhuǎn),4-way-stop,無保護(hù)左轉(zhuǎn),自主避障,停車入庫,被遮擋物體的猜測等場景??梢钥闯?,我們的方法能有效地處理復(fù)雜場景,能實(shí)現(xiàn)多動(dòng)態(tài)物體的交互,交通信息和規(guī)則的理解,自主避障,對(duì)被遮擋物體的推測等功能。

普通路面:主要展示對(duì)不同車速/加速減速情況的車流預(yù)測,可以看出HOPE能對(duì)未來軌跡的不確定性進(jìn)行很好的建模

f13ebd88-fba9-11ec-ba43-dac502259ad0.gif

交叉路口:主要展示對(duì)不同轉(zhuǎn)彎,停車等待的車流預(yù)測

f1850d7e-fba9-11ec-ba43-dac502259ad0.gif

掉頭場景:復(fù)雜路口

f1a7a906-fba9-11ec-ba43-dac502259ad0.gif

不確定場景:直行、右轉(zhuǎn)兩條車道都有可能駛?cè)?/p>

f212722c-fba9-11ec-ba43-dac502259ad0.gif

右轉(zhuǎn):右轉(zhuǎn)車輛對(duì)直行車輛進(jìn)行了避讓

f2433916-fba9-11ec-ba43-dac502259ad0.gif

左轉(zhuǎn):根據(jù)路口紅綠燈、交通規(guī)則等綜合信息對(duì)路權(quán)進(jìn)行判斷

f26a3b92-fba9-11ec-ba43-dac502259ad0.gif

無保護(hù)左轉(zhuǎn):左轉(zhuǎn)車輛對(duì)直行車輛進(jìn)行了避讓

f2b43cce-fba9-11ec-ba43-dac502259ad0.gif

2 way stop:可以看見車輛交互,處理先來后到順序

f5c80f76-fba9-11ec-ba43-dac502259ad0.gif

遮擋繞行:可以看見車輛對(duì)前方靜止車輛進(jìn)行了繞行

f652d66a-fba9-11ec-ba43-dac502259ad0.gif

停車入庫:小樣本、低速場景預(yù)測,可以看見低速場景下軌跡的不確定性更高,模型可以有多種可能的軌跡預(yù)測

f98a4868-fba9-11ec-ba43-dac502259ad0.gif

遮擋物體的猜測:綠色的為被遮擋物體

f9b56b38-fba9-11ec-ba43-dac502259ad0.gif

原文標(biāo)題:開發(fā)者說 | HOPE:基于自動(dòng)駕駛場景Occupancy和Flow的運(yùn)動(dòng)預(yù)測

文章出處:【微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編碼解碼
    +關(guān)注

    關(guān)注

    0

    文章

    7

    瀏覽量

    7148
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    781

    文章

    13449

    瀏覽量

    165268
  • 地平線
    +關(guān)注

    關(guān)注

    0

    文章

    321

    瀏覽量

    14815

原文標(biāo)題:開發(fā)者說 | HOPE:基于自動(dòng)駕駛場景Occupancy和Flow的運(yùn)動(dòng)預(yù)測

文章出處:【微信號(hào):horizonrobotics,微信公眾號(hào):地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    地平線引入國際公司高管!陳黎明博士履新地平線任總裁

    9月1日,地平線官方微信宣布,陳黎明博士履新地平線任總裁。陳黎明博士于1995年加入博世集團(tuán),曾任技術(shù)專家,研發(fā)高級(jí)經(jīng)理、總監(jiān)和副總裁,他領(lǐng)導(dǎo)創(chuàng)建的博世底盤控制系統(tǒng)研發(fā)中心是博世公司在
    的頭像 發(fā)表于 09-01 10:57 ?5436次閱讀
    <b class='flag-5'>地平線</b>引入國際公司高管!陳黎明博士履新<b class='flag-5'>地平線</b>任總裁

    地平線RDK系列再升級(jí),NodeHub驚喜發(fā)布

    7月25日,“地平線2023機(jī)器人開發(fā)者創(chuàng)享日”在深圳成功舉辦?;顒?dòng)現(xiàn)場,地平線官宣了系列重要發(fā)布:全新地平線RDK系列機(jī)器人開發(fā)者套件正式上線,機(jī)器人操作系統(tǒng)TogetheROS.
    發(fā)表于 07-26 09:01 ?545次閱讀
    <b class='flag-5'>地平線</b>RDK系列再升級(jí),NodeHub驚喜發(fā)布

    地平線旭日X3派試用體驗(yàn)】開箱篇硬件介紹

    地平線旭日X3是夢(mèng)寐以求的開發(fā)板,上圖,地平線家細(xì)心的公司,包裝都做得這么精致。還帶個(gè)散熱片。接口:個(gè)CSI的相機(jī)接口,板載USB有3個(gè),包含1個(gè)USB3.0和2個(gè)USB2.0,
    發(fā)表于 07-26 19:13

    一種對(duì)時(shí)空信息的kNN查詢處理方法

    理位置和時(shí)間信息的K近鄰查詢(ST-kNN查詢)處理方法,首先,利用時(shí)空相似度對(duì)數(shù)據(jù)對(duì)象的地理位置變量和時(shí)間變量進(jìn)行映射變換,將數(shù)據(jù)對(duì)象映射到新的三維空間中,用三維空間中兩點(diǎn)之間的距離相似度來近似代替兩個(gè)對(duì)象之間實(shí)際的
    發(fā)表于 01-09 18:10 ?0次下載

    地平線推出全新一代 AIoT 邊緣 AI 芯片平臺(tái)

    9 月 9 日,地平線釋放芯效能產(chǎn)品發(fā)布會(huì)于深圳舉辦,宣布推出全新一代 AIoT 邊緣 AI 芯片平臺(tái)地平線旭日 3。依托極致效能、開放易用的旭日 3 芯片,地平線在廣泛的 AIoT
    的頭像 發(fā)表于 09-24 11:55 ?2551次閱讀

    地平線推出自主研發(fā)的人工智能芯片

    地平線發(fā)布的“旭日 1.0”和“征程 1.0”是完全由地平線自主研發(fā)的人工智能芯片,具有全球領(lǐng)先的性能。我們知道,人工智能芯片及其使用的卷積神經(jīng)網(wǎng)絡(luò)算法已經(jīng)成功地應(yīng)用于圖像處理、自動(dòng)駕
    的頭像 發(fā)表于 10-27 10:13 ?3160次閱讀

    地平線投身底層的科技創(chuàng)新戰(zhàn)役

    “來地平線,與最酷的人做最酷的事!” “有多酷?” 近日,地平線在北京順義研發(fā)中心舉辦了場招聘 Open Day 直播體驗(yàn)日活動(dòng)。地平線創(chuàng)
    發(fā)表于 12-18 15:30 ?1061次閱讀

    一種層級(jí)特征融合就的深度卷積網(wǎng)絡(luò)

    采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)單目圖像的深度進(jìn)行估計(jì)時(shí),存在深度信息不精確、邊緣模糊以及細(xì)節(jié)缺失等問題。為此,提出一種層級(jí)特征融合結(jié)構(gòu)的深度卷積
    發(fā)表于 03-16 09:21 ?7次下載
    <b class='flag-5'>一種</b>多<b class='flag-5'>層級(jí)</b>特征融合就的深度卷積<b class='flag-5'>網(wǎng)絡(luò)</b>

    一種編碼解碼模式的肺分割算法

    CT成像技術(shù)是輔助醫(yī)生診斷肺部疾病的重要手段。針對(duì)肺部各組織結(jié)構(gòu)復(fù)雜,難以準(zhǔn)確地對(duì)肺部CT像中肺實(shí)質(zhì)進(jìn)行分割和提取的問題,提岀了一種編/解碼模弌的肺分割算法。為了獲得圖像的多尺度信息,
    發(fā)表于 04-13 10:46 ?11次下載
    <b class='flag-5'>一種</b><b class='flag-5'>編碼</b><b class='flag-5'>解碼</b>模式的肺分割算法

    包含時(shí)空信息特征的視頻指紋算法

    為滿足視頻拷貝檢測系統(tǒng)的魯棒性、獨(dú)特性和緊湊性,提出一種包含時(shí)空信息特征的視頻指紋算法。利用時(shí)空切片和關(guān)鍵幀構(gòu)成時(shí)空信息,將包含視頻關(guān)鍵幀空域信息
    發(fā)表于 06-10 11:20 ?15次下載

    比亞迪與地平線正式宣布達(dá)成定點(diǎn)合作

    比亞迪與地平線正式宣布達(dá)成定點(diǎn)合作,比亞迪將在其部分車型上搭載地平線高性能、大算力自動(dòng)駕駛芯片征程5,打造更具競爭力的行泊體方案,實(shí)現(xiàn)高等級(jí)自動(dòng)駕駛功能。按照計(jì)劃,搭載地平線征程5的
    的頭像 發(fā)表于 05-07 17:16 ?2711次閱讀

    地平線獲得汽紅旗全新車型項(xiàng)目應(yīng)用

    將于2023年在汽紅旗全新車型上實(shí)現(xiàn)量產(chǎn),未來還將應(yīng)用于更多紅旗車型。同時(shí),雙方正在基于地平線征程2芯片推動(dòng)輔助駕駛功能的研發(fā)應(yīng)用,合作車型將于今年量產(chǎn)落地。
    的頭像 發(fā)表于 05-14 17:08 ?2105次閱讀

    地平線GitLab使用指導(dǎo)

    地平線開發(fā)者社區(qū)致力于連接地平線和開發(fā)者,為大家提供前沿技術(shù)內(nèi)容和豐富的技術(shù)活動(dòng),打造更好的開發(fā)者文化和氛圍,共建開源生態(tài)
    的頭像 發(fā)表于 11-04 14:18 ?640次閱讀
    <b class='flag-5'>地平線</b>GitLab使用指導(dǎo)

    旭日,從地平線升起——地平線旭日X3派開箱試用

    地平線旭日X3派,開啟你的嵌入式開發(fā)之旅
    的頭像 發(fā)表于 11-08 15:22 ?1453次閱讀
    旭日,從<b class='flag-5'>地平線</b>升起——<b class='flag-5'>地平線</b>旭日X3派開箱試用

    地平線Journey 3的電源設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《地平線Journey 3的電源設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 09-04 10:48 ?0次下載
    <b class='flag-5'>地平線</b>Journey 3的電源設(shè)計(jì)