新研究成果帶來(lái)實(shí)現(xiàn)安全自動(dòng)駕駛系統(tǒng)所需的先進(jìn) 3D Occupancy 預(yù)測(cè)。
NVIDIA 以自動(dòng)駕駛開(kāi)發(fā)大賽 3D Occupancy 預(yù)測(cè)挑戰(zhàn)賽冠軍的身份亮相 CVPR 2023。
此次角逐冠軍的 400 多份參賽作品共來(lái)自 10 個(gè)地區(qū)近 150 個(gè)團(tuán)隊(duì)。
3D Occupancy 預(yù)測(cè)是指預(yù)測(cè)場(chǎng)景中每個(gè)體素(即 3D 鳥(niǎo)瞰網(wǎng)格上的各個(gè)數(shù)據(jù)點(diǎn))的狀態(tài)的過(guò)程,體素可以被識(shí)別為自由、占用或未知三種狀態(tài)。
觀看 NVIDIA 自動(dòng)駕駛實(shí)驗(yàn)室關(guān)于 3D Occupancy 預(yù)測(cè)的視頻。
3D Occupancy 網(wǎng)格預(yù)測(cè)對(duì)開(kāi)發(fā)安全、魯棒的自動(dòng)駕駛系統(tǒng)至關(guān)重要。該功能利用 NVIDIA DRIVE 平臺(tái)提供支持的先進(jìn)卷積神經(jīng)網(wǎng)絡(luò)(CNN)和 Transformer 模型為自動(dòng)駕駛汽車(chē)(AV)規(guī)劃和控制堆棧提供信息。
NVIDIA 學(xué)習(xí)和感知高級(jí)研究科學(xué)家 Zhiding Yu 表示:“NVIDIA 的獲獎(jiǎng)方案包含兩項(xiàng)重要的先進(jìn)自動(dòng)駕駛(AV)技術(shù)。該方案展示了具有出色鳥(niǎo)瞰感知能力的先進(jìn)模型設(shè)計(jì),以及具有多達(dá) 10 億個(gè)參數(shù)的視覺(jué)基礎(chǔ)模型和大規(guī)模預(yù)訓(xùn)練在 3D Occupancy 預(yù)測(cè)方面的有效性。”
在過(guò)去幾年中,自動(dòng)駕駛感知已從處理 2D 任務(wù),比如檢測(cè)圖像中的物體或自由空間等,發(fā)展到根據(jù)多個(gè)輸入圖像對(duì) 3D 世界進(jìn)行推理。
NVIDIA 自動(dòng)駕駛汽車(chē)應(yīng)用研究總監(jiān)兼杰出科學(xué)家 Jose Alvarez 表示,“這項(xiàng)技術(shù)能夠靈活、精確而細(xì)致地呈現(xiàn)復(fù)雜交通場(chǎng)景中的物體,對(duì)于達(dá)到自動(dòng)駕駛的安全感知要求至關(guān)重要?!?/p>
CVPR 研討會(huì)委員會(huì)表示,除了贏得該挑戰(zhàn)賽的第一名之外,NVIDIA 還榮獲本次活動(dòng)的創(chuàng)新獎(jiǎng),以表彰其“在開(kāi)發(fā)視角轉(zhuǎn)換模塊方面的新洞察”。與之前的方法相比,其“性能大幅提升”。
通過(guò) 3D Occupancy 預(yù)測(cè)提升車(chē)輛安全性
雖然傳統(tǒng) 3D 目標(biāo)檢測(cè)(通常使用 3D 邊界框來(lái)檢測(cè)和呈現(xiàn)場(chǎng)景中的物體)是自動(dòng)駕駛汽車(chē)感知領(lǐng)域的一項(xiàng)核心任務(wù),但它具有局限性。例如缺乏表現(xiàn)力,邊界框可能無(wú)法呈現(xiàn)足夠的真實(shí)世界信息。它還需要為所有可能的物體進(jìn)行分類標(biāo)準(zhǔn)和 ground truth 的定義,甚至包括在現(xiàn)實(shí)世界中很少見(jiàn)的物體,比如可能從卡車(chē)上掉落的道路危險(xiǎn)物。
相比之下,3D Occupancy 預(yù)測(cè)能夠?yàn)樽詣?dòng)駕駛汽車(chē)的規(guī)劃堆棧提供豐富信息,這對(duì)于端到端自動(dòng)駕駛是必不可少的。
軟件定義汽車(chē)可以不斷通過(guò)升級(jí),以添加經(jīng)過(guò)證明和驗(yàn)證的新研發(fā)成果。研究成果(例如在 CVPR 上得到認(rèn)可的研究)所帶來(lái)的先進(jìn)軟件更新,正在推動(dòng)實(shí)現(xiàn)新功能和更安全的駕駛能力。
NVIDIA DRIVE 平臺(tái)可為汽車(chē)制造商帶來(lái)加速車(chē)輛生產(chǎn)的解決方案,為確保安全可靠的自動(dòng)駕駛汽車(chē)開(kāi)發(fā)提供了從汽車(chē)到數(shù)據(jù)中心的全棧式硬件和軟件。
CVPR 挑戰(zhàn)賽介紹
CVPR 的 3D Occupancy 預(yù)測(cè)挑戰(zhàn)賽要求參賽者開(kāi)發(fā)在推理過(guò)程中只使用攝像頭輸入數(shù)據(jù)的算法。參賽者可以使用開(kāi)源數(shù)據(jù)集和模型,從而推動(dòng)對(duì)數(shù)據(jù)驅(qū)動(dòng)算法和大型模型的探索。主辦方提供了一個(gè)基準(zhǔn)沙盒,以便參賽者將最新的先進(jìn) 3D Occupancy 預(yù)測(cè)算法應(yīng)用于真實(shí)世界場(chǎng)景。
NVIDIA 參加 CVPR
NVIDIA 在 CVPR 上發(fā)表了近 30 篇論文和演講。在會(huì)上討論自動(dòng)駕駛的專家包括:
Jose Alvarez 在端到端自動(dòng)駕駛研討會(huì):新興任務(wù)和挑戰(zhàn)研討會(huì)上討論自動(dòng)駕駛汽車(chē)中的新 3D 感知挑戰(zhàn);并在嵌入式視覺(jué)研討會(huì)上討論優(yōu)化用于實(shí)時(shí)推理的大型深度模型。
NVIDIA 深度學(xué)習(xí)總監(jiān) Nikolai Smolyanskiy 在端到端自動(dòng)駕駛研討會(huì):感知、預(yù)測(cè)、規(guī)劃和模擬上討論自動(dòng)駕駛汽車(chē)的實(shí)時(shí)交通預(yù)測(cè)。
NVIDIA 杰出工程師 Robin Jenkin 在與 CVPR 同時(shí)舉行的 OmniCV 研討會(huì)上討論魚(yú)眼相機(jī)的圖像質(zhì)量。
NVIDIA 自動(dòng)駕駛汽車(chē)研究部門(mén)的研究科學(xué)家 Xinshuo Weng 在自動(dòng)駕駛視覺(jué)主題研討會(huì)上討論用于自動(dòng)駕駛的視覺(jué)解決方案。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4855瀏覽量
102711 -
數(shù)據(jù)驅(qū)動(dòng)器
+關(guān)注
關(guān)注
0文章
5瀏覽量
6161 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
782文章
13621瀏覽量
165951 -
卷積神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
4文章
359瀏覽量
11831
原文標(biāo)題:NVIDIA Research 在 CVPR 上贏得自動(dòng)駕駛挑戰(zhàn)賽并獲得創(chuàng)新獎(jiǎng)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論