0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小鵬汽車新一代感知架構(gòu)XNet信息解讀

jf_C6sANWk1 ? 來源:阿寶1990 ? 2023-07-04 09:41 ? 次閱讀

在剛剛過去的CVPR會(huì)議上,作為國(guó)內(nèi)唯一一家被邀請(qǐng)登臺(tái)演講的造車新勢(shì)力,小鵬汽車向參會(huì)者介紹了小鵬汽車在國(guó)內(nèi)量產(chǎn)輔助駕駛系統(tǒng)的經(jīng)驗(yàn)。

作為小鵬汽車最新一代的感知架構(gòu),XNet在量產(chǎn)中發(fā)揮的作用不容小覷。

筆者有幸采訪到小鵬汽車自動(dòng)駕駛中心感知首席工程師 Patrick,更進(jìn)一步得了解XNet的性能、架構(gòu),以及小鵬的自駕團(tuán)隊(duì)為搭建XNet所做的努力。

1.XNet實(shí)現(xiàn)的性能提升

XNet實(shí)現(xiàn)了感知結(jié)構(gòu)的升級(jí),擁有更好的性能,主要包括3個(gè)方面。

1.1超強(qiáng)環(huán)境感知能力,實(shí)時(shí)生成“高精地圖”

d5e913a4-1a06-11ee-962d-dac502259ad0.png

XNet可以根據(jù)周圍環(huán)境實(shí)時(shí)構(gòu)建“高精地圖”。從上圖我們可以看到,車輛正在經(jīng)過一個(gè)環(huán)島,圖中顯示的車道線不是來自于高精地圖,而是來自于XNet的感知輸出。XNet不光可以輸出車道線,還有停止線、人行道、可行駛區(qū)域等。這是將來小鵬汽車應(yīng)對(duì)無圖場(chǎng)景,做高級(jí)別城市輔助駕駛的最核心的能力之一。

1.2更強(qiáng)的360度感知,博弈更強(qiáng)、變道成功率更高

在上一代感知架構(gòu)中,盲區(qū)問題很難解決。在最靠近本車的地方,尤其是車輛的下邊界,感知系統(tǒng)的檢測(cè)效果往往不好。XNet采用多相機(jī)多幀、前融合的感知方案,可以根據(jù)圖像內(nèi)的車身信息推測(cè)車輛在BEV視角下的3D位置信息,解決了相機(jī)上下視野受限的問題;還可以更加有效地同時(shí)融合多相機(jī)的信息,尤其是分節(jié)到兩個(gè)相機(jī)視野中的物體,從而避免盲人摸象式的物體感知。

另外,輸入包含時(shí)序信息的視頻流后,XNet對(duì)近車物體的識(shí)別能力有大幅提升,可以更加穩(wěn)定地檢測(cè)到近車物體。那么,自動(dòng)駕駛系統(tǒng)的博弈能力就更強(qiáng),汽車變道的成功率更高。

1.3更精準(zhǔn)識(shí)別動(dòng)態(tài)物體速度和意圖,博弈能力大幅提升;運(yùn)動(dòng)感知冗余,在城市場(chǎng)景安全性更高

XNet不僅能夠檢測(cè)物體的位置,還能夠檢測(cè)物體的速度甚至是完成對(duì)物體未來運(yùn)動(dòng)軌跡的預(yù)測(cè)。毫米波雷達(dá)通常很難檢測(cè)在本車前橫跨車道的車輛的速度,而XNet可以很容易地檢測(cè)到這個(gè)速度,對(duì)毫米波雷達(dá)有明顯的增強(qiáng)作用。在毫米波雷達(dá)比較擅長(zhǎng)的場(chǎng)景,XNet也可以提供冗余,從而提高城市場(chǎng)景整體的安全度。

2.XNet的架構(gòu)

XNet為什么可以實(shí)現(xiàn)更好的性能呢?Patrick介紹了XNet的具體架構(gòu)和工作流程。

XNet采用多相機(jī)多幀的方式,把來自每一個(gè)相機(jī)的視頻流,直接注入到一個(gè)大模型的深度學(xué)習(xí)網(wǎng)絡(luò)里,進(jìn)行多幀時(shí)序前融合,輸出BEV視角下的動(dòng)態(tài)目標(biāo)物的4D信息(如車輛,二輪車等的大小、距離、位置及速度、行為預(yù)測(cè)等),以及靜態(tài)目標(biāo)物的3D信息(如車道線和馬路邊緣的位置)。

如下圖所示。

d65525d0-1a06-11ee-962d-dac502259ad0.png

每張輸入的攝像頭圖像經(jīng)過網(wǎng)絡(luò)骨干(backbone)和網(wǎng)絡(luò)頸部(neck,具體來講是BiFPN網(wǎng)絡(luò))后生成圖像空間的多尺度特征圖。

這些特征圖經(jīng)過XNet最關(guān)鍵的部分—BEV視圖轉(zhuǎn)換器(BEV view transformer)后,形成BEV下的單幀特征圖。

不同時(shí)刻的單幀特征圖在BEV視角下,根據(jù)自車的位姿進(jìn)行時(shí)空融合,形成BEV下的時(shí)空特征圖。

這些時(shí)空特征圖是進(jìn)行BEV解碼推理的基礎(chǔ),在時(shí)空特征圖后接兩個(gè)解碼器,完成動(dòng)態(tài)XNet和靜態(tài)XNet的結(jié)果解碼和輸出。動(dòng)態(tài)結(jié)果包括pose、size、velocity等,靜態(tài)結(jié)果包括boundary、mark line等。

至此,感知部分基本就完成了。

3.團(tuán)隊(duì)為搭建XNet所做的努力

要實(shí)現(xiàn)上述架構(gòu)并不容易,在采集、標(biāo)注、訓(xùn)練、部署四個(gè)方面,小鵬的自駕團(tuán)隊(duì)都做了大量的工作來優(yōu)化整個(gè)流程。

3.1采集

實(shí)車數(shù)據(jù)和仿真數(shù)據(jù)是數(shù)據(jù)的兩大來源。

小鵬有接近十萬輛用戶車,這些車都可以用來完成數(shù)據(jù)采集的任務(wù)。如下圖所示,車端模型會(huì)報(bào)告自動(dòng)駕駛系統(tǒng)目前處理得不夠好的問題,針對(duì)這些問題,小鵬的自駕團(tuán)隊(duì)會(huì)在車端設(shè)置相應(yīng)的觸發(fā)器來定向采集相應(yīng)的數(shù)據(jù)。然后,這些數(shù)據(jù)會(huì)被上傳到云端,經(jīng)過篩選和標(biāo)注后用于模型訓(xùn)練和后續(xù)的OTA升級(jí)。

d6710c28-1a06-11ee-962d-dac502259ad0.png

此外,仿真數(shù)據(jù)也是數(shù)據(jù)的重要來源。吳新宙在1024科技日上舉了一個(gè)例子—行車過程中,前面一輛大卡車因?yàn)檩喬ッ撀渑c地面摩擦起火,這種情形在實(shí)際生活中是極為罕見的。對(duì)于這樣出現(xiàn)頻率極低的情形,實(shí)車采集很困難,即使小鵬已經(jīng)有了近十萬輛量產(chǎn)車,收集到足夠多的數(shù)據(jù)可能也需要數(shù)年時(shí)間。

對(duì)于這樣的情形,仿真數(shù)據(jù)可以起到很好的輔助作用。如下圖所示,小鵬的自駕團(tuán)隊(duì)可以根據(jù)實(shí)車數(shù)據(jù),采用unreal5引擎產(chǎn)生成千上萬個(gè)類似的case ,模擬各種各樣車輪脫落的情形。

d6af8052-1a06-11ee-962d-dac502259ad0.png

當(dāng)然,仿真數(shù)據(jù)不能濫用,需要盡可能地貼近現(xiàn)實(shí)。小鵬的自駕團(tuán)隊(duì)主要從光影真實(shí)和場(chǎng)景真實(shí)兩方面來盡量保證仿真數(shù)據(jù)的真實(shí)性。

小鵬的自駕團(tuán)隊(duì)采用了技術(shù)上領(lǐng)先的unreal5作為渲染引擎,這樣通過仿真生成的圖片看起來比較真實(shí),沒有卡通感,保證了“光影真實(shí)”。

此外,生成仿真數(shù)據(jù)時(shí),是先找到模型的弱勢(shì)場(chǎng)景,然后對(duì)這些場(chǎng)景做數(shù)字孿生(digital twin),再在此基礎(chǔ)上進(jìn)行定向修改。具體來說,可以先用4D自動(dòng)標(biāo)注從真實(shí)場(chǎng)景里提取4D結(jié)構(gòu)化信息—包括動(dòng)態(tài)物體的4D軌跡、和靜態(tài)場(chǎng)景的3D布局等,然后用渲染引擎對(duì)結(jié)構(gòu)化信息進(jìn)行渲染填充,形成仿真圖片。這樣,生成的場(chǎng)景就是在模擬真實(shí)世界可能發(fā)生的場(chǎng)景,保證了“場(chǎng)景真實(shí)”。

3.2標(biāo)注

要訓(xùn)練XNet,需要50萬到100萬個(gè)短視頻,其中的動(dòng)態(tài)目標(biāo)的數(shù)量可能是數(shù)億級(jí)甚至十億級(jí)的。按照當(dāng)前人工標(biāo)注的效率,需要1000人的團(tuán)隊(duì)花兩年時(shí)間才能完成訓(xùn)練XNet所需數(shù)據(jù)的標(biāo)注。

小鵬汽車打造了全自動(dòng)標(biāo)注系統(tǒng),此系統(tǒng)的標(biāo)注效率是人工的近45000倍,全自動(dòng)標(biāo)注系統(tǒng)僅需16.7天就可以完成標(biāo)注工作。此外,全自動(dòng)標(biāo)注系統(tǒng)質(zhì)量更高,信息更全(包含3D位置、尺寸、速度、軌跡等信息),產(chǎn)量更大(峰值日產(chǎn) 30000 clips,相當(dāng)于 15個(gè)NuScene數(shù)據(jù)集 )。

全自動(dòng)標(biāo)注系統(tǒng)是如何做到高效的呢?

首先,從人工標(biāo)注到自動(dòng)標(biāo)注,人的角色發(fā)生了很大的變化。人工標(biāo)注場(chǎng)景下,人是標(biāo)注員;在自動(dòng)標(biāo)注場(chǎng)景下,人是質(zhì)檢員,只是去判別和糾正自動(dòng)標(biāo)注系統(tǒng)做的不好的地方,人效會(huì)有數(shù)量級(jí)的提升。

其次,在自動(dòng)標(biāo)注場(chǎng)景下,占數(shù)據(jù)集大多數(shù)的訓(xùn)練數(shù)據(jù)是自動(dòng)化質(zhì)檢的,只有評(píng)測(cè)數(shù)據(jù)集是人工質(zhì)檢,需要人工操作的數(shù)據(jù)量有數(shù)量級(jí)的減少。

最后,自動(dòng)標(biāo)注讓產(chǎn)出瓶頸從人力資源轉(zhuǎn)到了計(jì)算資源。在云端,計(jì)算資源可以很方便地拓展,可以靈活地按需部署大量資源進(jìn)行生產(chǎn)。

3.3訓(xùn)練

小鵬與阿里云合作打造了中國(guó)最大的自動(dòng)駕駛計(jì)算中心—“扶搖”,“扶搖”的算力可達(dá)600PFLOPS,相當(dāng)于成千上萬個(gè)Orin組成的訓(xùn)練平臺(tái)。借助扶搖的強(qiáng)大算力,小鵬的自駕團(tuán)隊(duì)采用云端大規(guī)模多機(jī)訓(xùn)練的方式,把XNet的訓(xùn)練時(shí)間從276天縮短到了11個(gè)小時(shí),實(shí)現(xiàn)了602倍的訓(xùn)練效率的提升。

如下圖所示,假如采用單機(jī)全精度方式,訓(xùn)練整個(gè)XNet需要276天。小鵬的自駕團(tuán)隊(duì)通過優(yōu)化訓(xùn)練scheme從而減少epoch、優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和算子、為Transformer定制混合精度訓(xùn)練的方式,將單機(jī)訓(xùn)練時(shí)間從276天縮短到了32天。然后,團(tuán)隊(duì)充分利用云端算力,將單機(jī)訓(xùn)練改為80機(jī)并行訓(xùn)練,訓(xùn)練時(shí)間從32天縮短到了11小時(shí)。

d6c87954-1a06-11ee-962d-dac502259ad0.png

此外,團(tuán)隊(duì)引入了Golden Backbone模型,將基礎(chǔ)網(wǎng)絡(luò)能力的提升和模型的發(fā)布解耦,實(shí)現(xiàn)了訓(xùn)練效率的提升。具體來說,如下圖所示,Golden Backbone可以和數(shù)據(jù)挖掘、自動(dòng)標(biāo)注、自動(dòng)駕駛超算平臺(tái)等形成一個(gè)閉環(huán)。在這個(gè)環(huán)里,只要有持續(xù)的數(shù)據(jù)輸入,Golden Backbone的能力就可以持續(xù)地得到優(yōu)化。需要發(fā)布模型的時(shí)候,只需在Golden Backbone的基礎(chǔ)上做一些優(yōu)化,而無需從頭開始訓(xùn)練。

d6e7b562-1a06-11ee-962d-dac502259ad0.png

3.4部署

在部署層面,小鵬的自駕團(tuán)隊(duì)有很多積累。經(jīng)過團(tuán)隊(duì)優(yōu)化后,Transformer的運(yùn)算時(shí)間減少到了原來的5%。此外,原本需要122%的Orin-X算力才能運(yùn)行的模型,現(xiàn)在只需9%的Orin-X算力就能運(yùn)行。

在部署上,小鵬的自駕團(tuán)隊(duì)有哪些亮點(diǎn)呢?根據(jù)Patrick的介紹,主要是分三步走。

“首先是Transformers層的重寫。經(jīng)過對(duì)模型板端運(yùn)行時(shí)間的分析,我們發(fā)現(xiàn)原版的Transformers層占用時(shí)長(zhǎng)是大頭。于是,我們嘗試了很多種Transformers的變種構(gòu)建方法,找到了一個(gè)模型效果好,在板端運(yùn)行快的版本?!?/p>

“然后是網(wǎng)絡(luò)骨干的剪枝。我們重寫了Transformers以后發(fā)現(xiàn),網(wǎng)絡(luò)骨干(backbone)是我們的性能瓶頸。于是我們對(duì)網(wǎng)絡(luò)骨干進(jìn)行了剪枝,降低了骨干部分的運(yùn)行時(shí)間?!?/p>

“最后是多硬件的協(xié)同調(diào)度。在我們的基于Orin-X的計(jì)算平臺(tái)上,有三種計(jì)算單元—GPU、DLA還有CPU。這三種硬件對(duì)網(wǎng)絡(luò)的不同算子的支持度各有不同。我們把網(wǎng)絡(luò)的不同構(gòu)件放到最適合它運(yùn)行的地方,然后統(tǒng)一調(diào)度三種計(jì)算硬件,讓三者協(xié)同完成網(wǎng)絡(luò)推理?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 駕駛系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    6586
  • 小鵬汽車
    +關(guān)注

    關(guān)注

    4

    文章

    488

    瀏覽量

    14669
  • 高精地圖
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    2619

原文標(biāo)題:小鵬汽車新一代感知架構(gòu)XNet信息解讀

文章出處:【微信號(hào):阿寶1990,微信公眾號(hào):阿寶1990】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    汽車申請(qǐng)IRONMAN商標(biāo)

    汽車最新商標(biāo)動(dòng)態(tài)引發(fā)關(guān)注。據(jù)天眼查知識(shí)產(chǎn)權(quán)信息透露,廣東小汽車科技有限公司近日已正式申請(qǐng)注冊(cè)“XPENG IRONMAN”、“Iron
    的頭像 發(fā)表于 09-05 17:14 ?443次閱讀

    P7+將于第四季度發(fā)布

    汽車董事長(zhǎng)何小在最新財(cái)報(bào)電話會(huì)上宣布了項(xiàng)重要消息:小汽車將于今年第四季度隆重推出
    的頭像 發(fā)表于 08-27 15:52 ?224次閱讀

    汽車與大眾汽車深化合作,共繪電子電氣架構(gòu)新篇章

    7月22日,小汽車在香港交易所發(fā)布重大合作公告,正式宣告與全球汽車巨頭大眾汽車集團(tuán)攜手邁入全新合作階段,雙方簽署了關(guān)于電子電氣架構(gòu)技術(shù)的戰(zhàn)
    的頭像 發(fā)表于 07-22 15:53 ?726次閱讀

    汽車與大眾汽車達(dá)成電子電氣架構(gòu)技術(shù)戰(zhàn)略合作

    汽車與大眾汽車集團(tuán)共同宣布,繼小汽車日期為2024年4月17日有關(guān)小
    的頭像 發(fā)表于 07-22 09:49 ?810次閱讀

    聯(lián)合開發(fā)E/E架構(gòu),小大眾第三次合作

    平臺(tái)上集成小新一代基于中央計(jì)算和域控制器的電子電氣架構(gòu)。大眾計(jì)劃2026年將新的架構(gòu)應(yīng)用到中國(guó)生產(chǎn)的大眾品牌電動(dòng)汽車上。 ? 作為有百年
    的頭像 發(fā)表于 04-28 07:38 ?4351次閱讀
    聯(lián)合開發(fā)E/E<b class='flag-5'>架構(gòu)</b>,小<b class='flag-5'>鵬</b>大眾第三次合作

    汽車與大眾汽車宣布簽署E/E架構(gòu)技術(shù)合作框架協(xié)議

    是其垂直集成的全棧軟硬件技術(shù)的核心。它支持ADAS和Connectivity OS等軟件與底層硬件和車輛平臺(tái)解耦,實(shí)現(xiàn)跨平臺(tái)軟件的快速迭代。小汽車新一代E/E架構(gòu)采用基于中央計(jì)算和
    的頭像 發(fā)表于 04-23 14:49 ?404次閱讀
    小<b class='flag-5'>鵬</b><b class='flag-5'>汽車</b>與大眾<b class='flag-5'>汽車</b>宣布簽署E/E<b class='flag-5'>架構(gòu)</b>技術(shù)合作框架協(xié)議

    大眾與小簽署電子電氣架構(gòu)技術(shù)戰(zhàn)略合作框架協(xié)議

    汽車與大眾汽車集團(tuán)共同宣布簽署了電子電氣架構(gòu)技術(shù)戰(zhàn)略合作框架協(xié)議,為大眾汽車在中國(guó)市場(chǎng)的電動(dòng)車平臺(tái)開發(fā)領(lǐng)先的電子電氣
    發(fā)表于 04-22 10:45 ?302次閱讀
    大眾與小<b class='flag-5'>鵬</b>簽署電子電氣<b class='flag-5'>架構(gòu)</b>技術(shù)戰(zhàn)略合作框架協(xié)議

    汽車與大眾汽車集團(tuán)簽訂電子電氣架構(gòu)技術(shù)戰(zhàn)略合作框架協(xié)議

    中國(guó)領(lǐng)先的智能電動(dòng)汽車公司小汽車與全球領(lǐng)先的汽車制造商大眾汽車集團(tuán)共同宣布,小
    的頭像 發(fā)表于 04-17 18:08 ?1270次閱讀

    汽車的AeroHT展現(xiàn)了其eVTOL技術(shù),將其X2飛行汽車帶到了廣州上空

    隨著許多eVTOL開發(fā)人員正在為他們的首次飛行做準(zhǔn)備,AeroHT繼續(xù)展示為什么它是該領(lǐng)域的領(lǐng)導(dǎo)者之。今天早些時(shí)候,小汽車的空中部門在中國(guó)廣州市上空進(jìn)行了首次成功的全電動(dòng)X2“飛行汽車
    發(fā)表于 03-18 08:44

    NVIDIA將在今年第二季度發(fā)布Blackwell架構(gòu)新一代GPU加速器“B100”

    根據(jù)各方信息和路線圖,NVIDIA預(yù)計(jì)會(huì)在今年第二季度發(fā)布Blackwell架構(gòu)新一代GPU加速器“B100”。
    的頭像 發(fā)表于 03-04 09:33 ?1095次閱讀
    NVIDIA將在今年第二季度發(fā)布Blackwell<b class='flag-5'>架構(gòu)</b>的<b class='flag-5'>新一代</b>GPU加速器“B100”

    國(guó)芯科技:新一代汽車電子MCU產(chǎn)品“CCFC3007PT” 內(nèi)部測(cè)試成功

    研發(fā)的汽車電子MCU新產(chǎn)品CCFC3007PT是基于公司自主PowerPC架構(gòu)C*CoreCPU內(nèi)核研發(fā)的新一代適用于汽車電子動(dòng)力總成、底盤控制器、動(dòng)力電池控制器以
    的頭像 發(fā)表于 01-20 08:26 ?969次閱讀
    國(guó)芯科技:<b class='flag-5'>新一代</b><b class='flag-5'>汽車</b>電子MCU產(chǎn)品“CCFC3007PT” 內(nèi)部測(cè)試成功

    國(guó)芯科技:新一代汽車電子MCU產(chǎn)品“CCFC3007PT” 內(nèi)部測(cè)試成功

    自主PowerPC架構(gòu)C*Core CPU內(nèi)核研發(fā)的新一代適用于汽車電子動(dòng)力總成、底盤控制器、動(dòng)力電池控制器以及高集成度域控制器等應(yīng)用的多核MCU芯片,是基于客戶更高算力、更高信息安全
    發(fā)表于 12-20 16:56

    S32G3實(shí)力出境!看了才知道,新一代汽車架構(gòu)為什么要選它?

    新一代汽車架構(gòu)而生的!具體來講,S32G3搭載了多達(dá)4個(gè)雙核鎖步的Arm Cortex-M7和多達(dá)8個(gè)可鎖步的Arm Cortex-A53內(nèi)核,還配備了網(wǎng)絡(luò)加速器、功能安全支持和先進(jìn)的硬件安全引擎,可以支持支持新型汽車架構(gòu)的各種
    的頭像 發(fā)表于 10-20 10:15 ?669次閱讀
    S32G3實(shí)力出境!看了才知道,<b class='flag-5'>新一代</b><b class='flag-5'>汽車架構(gòu)</b>為什么要選它?

    國(guó)芯科技:新一代汽車電子MCU產(chǎn)品“CCFC3007PT” 內(nèi)部測(cè)試成功

    是基于公司自主 PowerPC 架構(gòu) C*Core CPU 內(nèi)核研發(fā)的新一代適用于汽車電子動(dòng)力總成、底盤控制器、動(dòng)力電池控制器以及高集成度域控制器等應(yīng)用的多核 MCU 芯片,是基于客戶更高算力、更高
    的頭像 發(fā)表于 10-17 03:10 ?422次閱讀

    龍芯中科攜手百存儲(chǔ)打造基于龍架構(gòu)新一代國(guó)產(chǎn)統(tǒng)存儲(chǔ)解決方案

    為解決國(guó)產(chǎn)化存儲(chǔ)的"卡脖子"問題,滿足數(shù)據(jù)存儲(chǔ)自主可控的核心需求,龍芯中科技術(shù)股份有限公司聯(lián)合百(上海)數(shù)據(jù)技術(shù)有限公司(以下簡(jiǎn)稱“百存儲(chǔ)”)打造基于龍架構(gòu)新一代國(guó)產(chǎn)統(tǒng)
    的頭像 發(fā)表于 10-09 14:49 ?659次閱讀