3月19日,阿里巴巴達(dá)摩院宣布近日有論文入選計(jì)算機(jī)視覺頂會(huì)CVPR 2020。論文提出一個(gè)通用、高性能的自動(dòng)駕駛檢測器,可兼顧3D物體的檢測精度和速度,提升自動(dòng)駕駛系統(tǒng)安全性能,兩者兼得的實(shí)現(xiàn)在業(yè)界尚屬首次。
據(jù)了解,自動(dòng)駕駛檢測器是自動(dòng)駕駛具備感知能力的核心組件,檢測器需要快速處理、分析傳感器、激光雷達(dá)等采集的多維信息,使車輛識(shí)別周圍環(huán)境物體,并對(duì)物體在三維空間中的位置進(jìn)行精準(zhǔn)定位,這個(gè)過程需要3D目標(biāo)檢測的輔助。
與使用RGB圖像進(jìn)行目標(biāo)檢測,以輸出物體類別和在圖像上2D bounding box的2D檢測方式不同,3D目標(biāo)檢測需要使用RGB圖像、RGB-D深度圖像和激光點(diǎn)云的方式來實(shí)現(xiàn),最終輸出物體類別及在三維空間中的長寬高、旋轉(zhuǎn)角等信息。
對(duì)于自動(dòng)駕駛而言,其需要從現(xiàn)實(shí)世界中估計(jì)更具信息量的3D邊界框,以完成諸如路徑規(guī)劃和避免碰撞之類的高級(jí)任務(wù)。為確保自動(dòng)駕駛的安全,3D檢測的精度和速度缺一不可。但就目前兩種基于點(diǎn)云的3D物體檢測的主要架構(gòu)而言,單階段檢測器和兩階段檢測器尚無法能兼顧兩項(xiàng)指標(biāo)。
對(duì)此,達(dá)摩院在論文中提出在訓(xùn)練中利用一個(gè)輔助網(wǎng)絡(luò)來解決以上問題。具體而言,其能夠?qū)坞A段檢測器中的體素特征轉(zhuǎn)化為點(diǎn)級(jí)特征,并施加一定的監(jiān)督信號(hào),從而使卷積特征也具有結(jié)構(gòu)感知能力,進(jìn)而提高檢測精度。與此同時(shí),在做模型推斷時(shí),輔助網(wǎng)絡(luò)并不參與計(jì)算(detached),單階段檢測器的檢測效率得以保證。
此外,達(dá)摩院還提出工程上的改進(jìn),Part-sensitive Warping (PSWarp), 用于處理單階段檢測器中存在的“框-置信度-不匹配”問題。
目前,該檢測器在自動(dòng)駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV排行榜上排名第一。測試結(jié)果顯示,在自動(dòng)駕駛領(lǐng)域權(quán)威數(shù)據(jù)集KITTI BEV排行榜上,該檢測器排名第一,精度超過其他單階段檢測器,檢測速度也達(dá)到25FPS ,是目前排名第二方案的兩倍多。
相較于百度和騰訊,阿里巴巴在自動(dòng)駕駛領(lǐng)域一直頗為低調(diào)。自2018年4月宣布布局自動(dòng)駕駛后,鮮有聲音對(duì)外發(fā)出。在技術(shù)路線上,阿里巴巴選擇L4級(jí)自動(dòng)駕駛道路,并試圖以協(xié)同智能的方式降低自動(dòng)駕駛現(xiàn)有方案的物理困境和成本障礙,該研究由AI實(shí)驗(yàn)室首席科學(xué)家王剛親自帶隊(duì)。去年9月的云棲大會(huì)上,阿里巴巴集團(tuán)首席技術(shù)官(CTO)兼阿里云智能總裁張建鋒稱,達(dá)摩院的自動(dòng)駕駛已達(dá)到L4級(jí)水平,但未有更多信息流出。
該論文團(tuán)隊(duì)表示,“檢測器的創(chuàng)新是自動(dòng)駕駛領(lǐng)域落地的關(guān)鍵突破口,此次我們提出的檢測器融合了單階段檢測器和兩階段檢測器的優(yōu)勢(shì),因此同時(shí)實(shí)現(xiàn)了3D檢測精讀和速度的提升,未來檢測器的創(chuàng)新研究還可以解決自動(dòng)駕駛產(chǎn)業(yè)的更多難題?!?/p>
責(zé)任編輯:gt
-
阿里巴巴
+關(guān)注
關(guān)注
7文章
1607瀏覽量
47059 -
激光雷達(dá)
+關(guān)注
關(guān)注
967文章
3921瀏覽量
189436 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
782文章
13621瀏覽量
165941
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論