0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能汽車(chē)如何感知和理解世界?算力+傳感器、算法、數(shù)據(jù)

感知芯視界 ? 來(lái)源:智駕最前沿 陳云培 ? 作者:智駕最前沿 陳云培 ? 2023-12-15 14:00 ? 次閱讀

車(chē)輛究竟是如何做到理解這些復(fù)雜的信息?

無(wú)人駕駛車(chē)輛在運(yùn)行中需要面對(duì)白天、黑夜、黃昏、大風(fēng)、暴雨、霧霾等自然環(huán)境信息,以及道路上行人、車(chē)輛、紅綠燈等物體信息。

本文用兩個(gè)基本問(wèn)題為您解答無(wú)人駕駛車(chē)輛如何感知和理解這個(gè)世界。

01、無(wú)人車(chē)如何感知和理解這個(gè)世界?

人類(lèi)駕駛員的感官主要依賴(lài)于雙眼,偶爾用到耳朵,而無(wú)人駕駛車(chē)輛的AI駕駛員的感官包括了激光雷達(dá)、毫米波雷達(dá)、攝像頭、差分GPS、慣性單元、輪速計(jì)等傳感器。還有一個(gè)核心零部件是U-Drive自動(dòng)駕駛控制器,我們也稱(chēng)呼它為“車(chē)腦”,在“車(chē)腦”中會(huì)運(yùn)行一整套的軟件或者算法。

在一輛無(wú)人車(chē)上使用的各類(lèi)傳感器往往各有優(yōu)缺點(diǎn):

激光雷達(dá):能夠直接獲取 3D 的點(diǎn)云數(shù)據(jù),精度高,成本也高

攝像頭:獲取二維圖像數(shù)據(jù),信息豐富、成本低,但是對(duì)光照要求相對(duì)敏感

毫米波雷達(dá):精度較低,極端天氣下表現(xiàn)較好

在無(wú)人車(chē)上需要將不同的傳感器融合以獲取最佳的效果。當(dāng)車(chē)腦收到這些傳感器數(shù)據(jù)之后,就會(huì)進(jìn)入兩個(gè)模塊:一個(gè)是自車(chē)定位,另一個(gè)是環(huán)境感知。經(jīng)過(guò)這兩個(gè)模塊的算法處理之后把結(jié)果輸出到下游的決策/規(guī)劃模塊使用。

問(wèn)題一:定位-我在哪里?

現(xiàn)在人類(lèi)出門(mén)開(kāi)車(chē)基本上離不開(kāi)導(dǎo)航,人類(lèi)駕駛員對(duì)定位精度要求不高,只需要在10米級(jí)。而AI駕駛員要達(dá)到厘米級(jí)的高精度定位,需要讓車(chē)輛自身每時(shí)每刻知道“我在哪里”,需要精確地分辨出當(dāng)前車(chē)在哪個(gè)車(chē)道,距離車(chē)道的邊緣有多遠(yuǎn)、方向如何,如此后面的規(guī)劃/控制模塊才能做出正確的選擇。

實(shí)現(xiàn)高精度定位有以下幾種方式:

差分 GPS:差分 GPS 和手機(jī)上的普通 GPS 不一樣,它是一種特殊的高精度的定位設(shè)備,它可以消除三類(lèi)誤差:公有誤差、傳播延遲誤差、接收機(jī)固有誤差。通過(guò)消除這些誤差可以把定位精度提升到 2cm 左右??墒窃诂F(xiàn)實(shí)中,道路旁邊有建筑物、高架、樹(shù)木,這些都會(huì)影響差分 GPS 信號(hào)的質(zhì)量,所以還需要其他方式配合以獲得更高精度的定位。

基于視覺(jué)特征點(diǎn)的定位是基于圖像中局部灰度的變化來(lái)發(fā)現(xiàn)圖像中一些穩(wěn)定的特征點(diǎn),利用這些特征點(diǎn)對(duì)圖像進(jìn)行編碼,通過(guò)對(duì)環(huán)境持續(xù)觀察以達(dá)到實(shí)現(xiàn)對(duì)自車(chē)的精準(zhǔn)定位。再通過(guò)重定位找到最佳定位匹配點(diǎn)。此外,在無(wú)人駕駛車(chē)輛行駛中會(huì)通過(guò)定位跟蹤模式持續(xù)獲得精準(zhǔn)位姿。

激光雷達(dá)定位:激光雷達(dá)點(diǎn)云定位是激光雷達(dá)通過(guò)掃描得到一系列單幀的點(diǎn)云,通過(guò)匹配位姿優(yōu)化生成地圖。和基于視覺(jué)特征點(diǎn)的定位方式一致,激光雷達(dá)也需要進(jìn)行重定位找到最佳定位匹配點(diǎn)。

語(yǔ)義定位:語(yǔ)義定位是對(duì)道路環(huán)境中存在的人類(lèi)可識(shí)別的高級(jí)特征標(biāo)識(shí)進(jìn)行識(shí)別并做自車(chē)定位,比如車(chē)道線、立柱、箭頭等各種標(biāo)識(shí)。同樣,語(yǔ)義建圖包含三步:第一步,通過(guò)激光雷達(dá)與攝像頭融合的數(shù)據(jù)進(jìn)行三維重建,得到彩色的點(diǎn)云;第二步,對(duì)三維重建結(jié)果進(jìn)行語(yǔ)義分割,標(biāo)記點(diǎn)云屬于什么分類(lèi);第三步,自動(dòng)提取出語(yǔ)義標(biāo)識(shí),從而完成語(yǔ)義地圖的構(gòu)建。最終自車(chē)根據(jù)語(yǔ)義地圖來(lái)實(shí)現(xiàn)定位。

融合定位:融合定位是將所有的定位源輸出的結(jié)果和車(chē)體內(nèi)部狀態(tài)融合在一起,如 IMU(慣性單元)、車(chē)身輪速計(jì)等,最終得出統(tǒng)一的自車(chē)定位信息發(fā)送給下游模塊使用。

問(wèn)題二:感知-我的周?chē)鞘裁?/p>

無(wú)人駕駛車(chē)輛接收到攝像頭、激光雷達(dá)以及其他感知設(shè)備輸入的數(shù)據(jù),通過(guò)這些數(shù)據(jù)可以獲取周?chē)哪繕?biāo)物的位置、尺寸、分類(lèi)信息(車(chē)輛、行人等)和跟蹤信息(速度、加速度、角速度等),還有未知分類(lèi)的障礙物、目標(biāo)車(chē)的尾燈、護(hù)欄、紅綠燈、植被等都需要被感知到。所有這些信息都會(huì)輸出到到?jīng)Q策/規(guī)劃模塊使用。

目標(biāo)檢測(cè)中都會(huì)使用深度學(xué)習(xí)的方法,深度學(xué)習(xí)首先通過(guò)網(wǎng)絡(luò)學(xué)習(xí)激光雷達(dá)三維點(diǎn)云中的背景信息、目標(biāo)物和分類(lèi)信息。此外,無(wú)人車(chē)上有多種傳感器,最主要的是激光雷達(dá)和攝像頭,將二者融合會(huì)在目標(biāo)檢測(cè)的距離精度、分類(lèi)精度、尺寸精度等方面都有顯著提升。

無(wú)人車(chē)要能夠安全、平順的行駛,對(duì)每個(gè)目標(biāo)物的準(zhǔn)確跟蹤、速度、加速度等都是必不可少的,這些信息必須要連續(xù)幀上獲取,因此我們必須要目標(biāo)檢測(cè)機(jī)制上進(jìn)行匹配跟蹤、速度估計(jì)等等一系列工作。我們會(huì)獲得T – 1(上一幀)時(shí)刻的目標(biāo)檢測(cè)結(jié)果,也會(huì)獲得當(dāng)前時(shí)刻的結(jié)果,這些結(jié)果可以通過(guò)卡爾曼濾波算法得出當(dāng)前幀預(yù)測(cè)結(jié)果,再把這個(gè)預(yù)測(cè)結(jié)果和當(dāng)前幀檢測(cè)結(jié)果通過(guò)相似度計(jì)算和匈牙利匹配關(guān)聯(lián),可以通過(guò)這速度工具來(lái)獲取場(chǎng)景中目標(biāo)物編號(hào)、速度、運(yùn)動(dòng)方向等信息,這些信息對(duì)車(chē)輛決策/規(guī)劃模塊相當(dāng)重要。

*卡爾曼濾波可以有效在時(shí)間線上對(duì)測(cè)量和預(yù)測(cè)進(jìn)行合理加權(quán)的算法。

*匈牙利算法是一種求解最大匹配的算法。

除了常見(jiàn)的目標(biāo)檢測(cè)之外,環(huán)境中還有一些其他要素需要感知,比如之前提到的植被,無(wú)法用一個(gè)矩形框來(lái)表示,因此需要語(yǔ)義分割技術(shù),它能夠獲得精細(xì)的感知結(jié)果。最終我們將目標(biāo)檢測(cè)、跟蹤和語(yǔ)義分割融合在一起,作為整體輸出給下個(gè)模塊。

02、無(wú)人車(chē)的定位感知能力如何持續(xù)進(jìn)化

無(wú)人駕駛系統(tǒng)幾個(gè)最核心的要素:算力+傳感器、算法、數(shù)據(jù)。

算力+傳感器主要依賴(lài)硬件持續(xù)升級(jí)驅(qū)動(dòng),其中包括車(chē)載控制芯片(每一代新的芯片誕生,算力都有數(shù)量級(jí)提升)、激光雷達(dá)(激光雷達(dá)性能越來(lái)越強(qiáng),成本也逐步降低,進(jìn)而推動(dòng)定位感知能力的提升)、攝像頭(分辨率不斷提升,進(jìn)而為算法提升奠定基礎(chǔ))。

算法主要依賴(lài)人腦驅(qū)動(dòng)演進(jìn),從第一個(gè)角度看,深度學(xué)習(xí)依然是目前最重要的方法,但是我們?cè)诶^續(xù)演進(jìn)的路上也面臨很多挑戰(zhàn),后續(xù)網(wǎng)絡(luò)規(guī)模還會(huì)變得更大、更復(fù)雜(現(xiàn)在最大的網(wǎng)絡(luò)已經(jīng)在接近小型哺乳動(dòng)物的神經(jīng)元個(gè)數(shù)),從而具有更高精度和更強(qiáng)功能;從第二個(gè)角度看,在工業(yè)界的實(shí)踐中,深度學(xué)習(xí)方法需要和其他的機(jī)器學(xué)習(xí)方法、非學(xué)習(xí)方法結(jié)合,以得到實(shí)際可用的、功能邊界清晰的、可靠的系統(tǒng);從第三個(gè)角度看,需要持續(xù)擴(kuò)展“運(yùn)行設(shè)計(jì)域”(ODD)。

運(yùn)行設(shè)計(jì)域簡(jiǎn)單來(lái)說(shuō)就是可正常運(yùn)行的范圍,包含以下幾個(gè)要素:天氣(雨、雪、霧等極端天氣)、光照(黃昏、夜晚、陰天等)、道路(隧道、機(jī)坪、高架)、區(qū)域(園區(qū)、城區(qū)、高速),無(wú)人駕駛車(chē)輛需要在這些要素范圍內(nèi),從易到難進(jìn)行持續(xù)擴(kuò)展。

數(shù)據(jù)主要通過(guò)數(shù)據(jù)驅(qū)動(dòng)系統(tǒng)演進(jìn)驅(qū)動(dòng),數(shù)據(jù)驅(qū)動(dòng)要解決的第一個(gè)問(wèn)題就是長(zhǎng)尾問(wèn)題(長(zhǎng)尾問(wèn)題概念來(lái)自于互聯(lián)網(wǎng),指?jìng)€(gè)性化、零散的總和卻又比較大的客戶需求,在無(wú)人駕駛領(lǐng)域指很少見(jiàn)的場(chǎng)景,但是總和同樣較大)。長(zhǎng)尾問(wèn)題之所以難解決,算法能力不夠強(qiáng)大是一個(gè)維度,這需要工業(yè)界和學(xué)術(shù)界進(jìn)行持續(xù)提升,另一個(gè)維度是在現(xiàn)有算法能力范圍內(nèi),需要通過(guò)無(wú)人駕駛系統(tǒng)來(lái)收集到最有價(jià)值的數(shù)據(jù),用數(shù)據(jù)驅(qū)動(dòng)的方式來(lái)迭代和提升系統(tǒng)能力。

數(shù)據(jù)驅(qū)動(dòng)是如何解決長(zhǎng)尾問(wèn)題的?通過(guò)異常事件數(shù)據(jù)錄制-回傳-篩選及標(biāo)注-模型訓(xùn)練-模型驗(yàn)證-部署,從而完成模型升級(jí)的迭代過(guò)程,異常事件包括人工接管(Robotaxi)、無(wú)人運(yùn)營(yíng)車(chē)輛的剮蹭、急剎車(chē)、目標(biāo)物分類(lèi)跳變等。

數(shù)據(jù)驅(qū)動(dòng)的另一個(gè)方面:場(chǎng)景、業(yè)務(wù)、傳感器類(lèi)別非常多。無(wú)人車(chē)會(huì)在不同的城市、不同的道路和區(qū)域、承擔(dān)不同的業(yè)務(wù)(物流、出租車(chē)等),同時(shí)每種車(chē)型上的傳感器配置也不一樣,這幾方面因素都會(huì)導(dǎo)致數(shù)據(jù)有明顯差異。因此我們提出了一個(gè)數(shù)據(jù)驅(qū)動(dòng)的跨場(chǎng)景、業(yè)務(wù)和傳感器的統(tǒng)一框架。這個(gè)框架可以綜合考慮不同場(chǎng)景、業(yè)務(wù)、傳感器的數(shù)據(jù),可以高效地、最大程度復(fù)用各場(chǎng)景中的數(shù)據(jù)價(jià)值,節(jié)省標(biāo)注工作成本,并提升效率。

無(wú)人駕駛車(chē)輛感知與理解這個(gè)世界的背后是一項(xiàng)復(fù)雜的工程系統(tǒng),惟有適者方能生存,在不停地認(rèn)識(shí)世界的過(guò)程中無(wú)人駕駛車(chē)輛也在不停地實(shí)現(xiàn)自身的進(jìn)化與演進(jìn),向著下一個(gè)進(jìn)化節(jié)點(diǎn)跨步前進(jìn)。

來(lái)源:電控公眾號(hào)智駕最前沿公眾號(hào)陳云培

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2541

    文章

    49945

    瀏覽量

    747465
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4551

    瀏覽量

    92019
  • 激光雷達(dá)
    +關(guān)注

    關(guān)注

    967

    文章

    3863

    瀏覽量

    188738
  • 無(wú)人駕駛
    +關(guān)注

    關(guān)注

    98

    文章

    3975

    瀏覽量

    119620
  • 智能汽車(chē)
    +關(guān)注

    關(guān)注

    30

    文章

    2725

    瀏覽量

    106892
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    數(shù)據(jù)世界的觸角:傳感器的主要功能有什么?

    傳感器的身影無(wú)處不在。它們?nèi)缤畔⒌挠|角,不斷地收集著來(lái)自物理世界數(shù)據(jù),并將其轉(zhuǎn)化為可處理、可分析的信息,為智能系統(tǒng)的決策提供了堅(jiān)實(shí)的基礎(chǔ)。本文將深入探討
    的頭像 發(fā)表于 08-13 16:52 ?647次閱讀

    百億級(jí)傳感器賽道誕生,這家國(guó)產(chǎn)傳感器龍頭公司如何掘金?

    控制和執(zhí)行的前提。感知層的傳感器是軟件控制和硬件零部件的橋梁,是物理世界與數(shù)字世界的接口,是實(shí)現(xiàn)具身智能的關(guān)鍵。 ?
    的頭像 發(fā)表于 04-12 08:44 ?198次閱讀

    未來(lái)已來(lái),多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

    /L4級(jí)自動(dòng)駕駛賽跑的元年。 馬斯克評(píng)論FSD 12.3版本的左轉(zhuǎn)彎操作就像人類(lèi)司機(jī)一樣。如果FSD 12.3版本成功,將基本顛覆目前市場(chǎng)上的智能駕駛技術(shù)路線?;凇?b class='flag-5'>數(shù)據(jù)/算法/
    發(fā)表于 04-11 10:26

    數(shù)據(jù)語(yǔ)料庫(kù)、算法框架和芯片在AI大模型中的作用和影響

    數(shù)據(jù)語(yǔ)料庫(kù)、算法框架和芯片的確是影響AI大模型發(fā)展的三大重要因素。
    的頭像 發(fā)表于 03-01 09:42 ?699次閱讀

    智能規(guī)模超通用,大模型對(duì)智能提出高要求

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)是設(shè)備通過(guò)處理數(shù)據(jù),實(shí)現(xiàn)特定結(jié)果輸出的計(jì)算能力,常用FLOPS作為計(jì)量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發(fā)表于 02-06 00:08 ?5457次閱讀

    汽車(chē)上傳感器的種類(lèi)和作用

    汽車(chē)上的傳感器有很多種,主要?dú)w類(lèi)為兩大類(lèi):車(chē)身感知傳感器和環(huán)境感知傳感器。 車(chē)身
    的頭像 發(fā)表于 01-16 15:40 ?836次閱讀
    <b class='flag-5'>汽車(chē)上傳感器</b>的種類(lèi)和作用

    淺談汽車(chē)傳感器

    汽車(chē)上的傳感器有很多種, 主要分為車(chē)身感知傳感器和環(huán)境感知傳感器兩大類(lèi)。 車(chē)身
    的頭像 發(fā)表于 01-16 13:44 ?292次閱讀

    感知智能:連接虛擬與現(xiàn)實(shí)的橋梁

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)感知智能是指通過(guò)各種傳感器獲取信息的能力,它涵蓋了視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感知能力,能夠讓計(jì)算機(jī)模仿人類(lèi)的感知過(guò)程,
    的頭像 發(fā)表于 01-04 00:09 ?1651次閱讀

    傳感器的神奇魔法:科技感知世界的橋梁

    傳感器,一個(gè)在我們的日常生活中無(wú)處不在的科技元素,如同一座橋梁,將物理世界與數(shù)字世界連接起來(lái)。沒(méi)有它,我們無(wú)法測(cè)量溫度、壓力、位移、速度、光照強(qiáng)度等物理量,也無(wú)法將這些信息轉(zhuǎn)化為可以理解
    的頭像 發(fā)表于 12-27 09:46 ?281次閱讀
    <b class='flag-5'>傳感器</b>的神奇魔法:科技<b class='flag-5'>感知</b><b class='flag-5'>世界</b>的橋梁

    傳感器數(shù)據(jù)融合算法python代碼

    傳感器數(shù)據(jù)融合算法是一種將多個(gè)傳感器收集到的數(shù)據(jù)合并到一個(gè)一致和準(zhǔn)確的表示中的技術(shù)。這種算法的目
    的頭像 發(fā)表于 12-15 10:28 ?1169次閱讀

    傳感器數(shù)據(jù)融合算法最關(guān)鍵的是

    傳感器數(shù)據(jù)融合是一個(gè)綜合處理多傳感器數(shù)據(jù)的過(guò)程,以提高對(duì)環(huán)境或目標(biāo)的感知和解釋能力。在這個(gè)過(guò)程中,各種
    的頭像 發(fā)表于 12-13 11:00 ?482次閱讀

    超百億藍(lán)海大市場(chǎng)!傳感器國(guó)產(chǎn)替代正當(dāng)時(shí)【附104頁(yè)報(bào)告】

    來(lái)源:未來(lái)智庫(kù) ,謝謝 編輯:感知芯視界 萬(wàn)仞 獲取 【104頁(yè)傳感器報(bào)告】,可在感知芯視界首頁(yè)對(duì)話框,回復(fù)“陀104”免費(fèi)下載。 1、
    的頭像 發(fā)表于 11-30 09:24 ?2613次閱讀

    車(chē)身環(huán)境感知傳感器要把握哪些趨勢(shì)?

    自主式智能汽車(chē)ADAS 系統(tǒng)是車(chē)輛從被動(dòng)安全技術(shù)向主動(dòng)安全技術(shù)的重要變革,其核心是環(huán)境感知系統(tǒng),主要由感知層、決策層和執(zhí)行層組成,本文重點(diǎn)介紹ADAS 系統(tǒng)
    的頭像 發(fā)表于 11-25 09:58 ?694次閱讀
    車(chē)身環(huán)境<b class='flag-5'>感知</b>,<b class='flag-5'>傳感器</b>要把握哪些趨勢(shì)?

    智能傳感器助力打造數(shù)字經(jīng)濟(jì)數(shù)字世界

    隨著物聯(lián)網(wǎng)和5G技術(shù)的發(fā)展,智能感知和互聯(lián)互通的時(shí)代已經(jīng)到來(lái)。智能傳感器智能傳感的前端設(shè)備,是我國(guó)工業(yè)“由大變強(qiáng)”的必由之路。
    的頭像 發(fā)表于 10-30 10:41 ?337次閱讀

    北醒CTO疏達(dá):算法的進(jìn)階將促進(jìn)激光雷達(dá)、高階智能駕駛的發(fā)展

    近日,在“2023世界智能網(wǎng)聯(lián)汽車(chē)大會(huì)”上,北醒(北京)光子科技有限公司的CTO疏達(dá)博士表示,在“重感知、輕地圖”的形勢(shì)下,融合感知
    的頭像 發(fā)表于 10-07 09:43 ?628次閱讀
    北醒CTO疏達(dá):<b class='flag-5'>算法</b>和<b class='flag-5'>算</b><b class='flag-5'>力</b>的進(jìn)階將促進(jìn)激光雷達(dá)、高階<b class='flag-5'>智能</b>駕駛的發(fā)展