0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能駕駛大模型:有望顯著提升自動駕駛系統(tǒng)的性能和魯棒性

汽車電子設(shè)計 ? 來源:芝能科技 ? 2024-05-07 17:20 ? 次閱讀

智能駕駛大模型是近年來人工智能領(lǐng)域和自動駕駛領(lǐng)域最為前沿的研究方向之一,它融合了深度學(xué)習、多模態(tài)融合、世界模型構(gòu)建等多種技術(shù),有望顯著提升自動駕駛系統(tǒng)的性能和魯棒性。

01 Transformer架構(gòu)和端到端

2361db3e-0a8e-11ef-a297-92fbcf53809c.png ? ?

Transformer架構(gòu)是近年來神經(jīng)網(wǎng)絡(luò)領(lǐng)域最具突破性的成果之一,它在自然語言處理、計算機視覺等領(lǐng)域取得了巨大成功。

Transformer架構(gòu)擅長建模遠距離依賴關(guān)系,能夠有效關(guān)聯(lián)多種模態(tài)的信息并合成為統(tǒng)一形式的信號,且其性能通常隨著參數(shù)量的擴大而大幅提升。

2365f192-0a8e-11ef-a297-92fbcf53809c.png ?

在智能駕駛領(lǐng)域,Transformer架構(gòu)被廣泛應(yīng)用于感知、預(yù)測和決策等各個環(huán)節(jié)。

在感知環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建多模態(tài)融合的感知模型,將攝像頭、雷達、激光雷達等傳感器獲取的感知信息進行融合,以獲得更加完整和準確的環(huán)境感知結(jié)果;

在預(yù)測環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建時空預(yù)測模型,預(yù)測未來道路上的行人和車輛運動軌跡,以幫助自動駕駛系統(tǒng)提前規(guī)劃行駛路徑;

在決策環(huán)節(jié),Transformer架構(gòu)可以用于構(gòu)建多模態(tài)決策模型,綜合考慮環(huán)境感知、交通規(guī)則和駕駛策略等因素,做出最優(yōu)的控制決策。

什么是端到端智能駕駛?

2365f192-0a8e-11ef-a297-92fbcf53809c.png

端到端智能駕駛致力于將獨立的感知、預(yù)測、決策等模塊融合成一個統(tǒng)一的模型,使信息能夠在模型的各個部分進行流動,從而實現(xiàn)更優(yōu)化的決策。端到端智能駕駛具有以下優(yōu)勢:

提升效率: 端到端模型可以避免中間結(jié)果的存儲和傳輸,減少計算冗余,提高整體效率。

增強魯棒性: 端到端模型可以使各個模塊之間相互協(xié)作,共同應(yīng)對復(fù)雜場景,提高系統(tǒng)的魯棒性。

降低成本: 端到端模型可以減少模型的數(shù)量和復(fù)雜度,降低軟硬件成本。

然而,端到端智能駕駛也面臨著以下挑戰(zhàn):

可解釋性: 端到端模型的內(nèi)部結(jié)構(gòu)較為復(fù)雜,難以解釋其決策過程,這可能會導(dǎo)致安全隱患。

魯棒性: 端到端模型對訓(xùn)練數(shù)據(jù)的依賴性較大,如果訓(xùn)練數(shù)據(jù)存在偏差或不足,可能會導(dǎo)致模型泛化能力差,在實際應(yīng)用中表現(xiàn)不佳。

236e2db2-0a8e-11ef-a297-92fbcf53809c.png

02 什么是多模態(tài)智能駕駛

多模態(tài)智能駕駛旨在融合視覺、聽覺、語言等多種傳感器信息,以提升感知和決策的魯棒性。

多模態(tài)智能駕駛可以克服單一傳感器感知信息不足、魯棒性差等缺點,為自動駕駛系統(tǒng)提供更加全面和可靠的環(huán)境感知。

2379b768-0a8e-11ef-a297-92fbcf53809c.png

多模態(tài)大模型可以嫁接大語言模型已涌現(xiàn)的上下文學(xué)習、零樣本學(xué)習、邏輯推理、常識判斷等能力,提高智能駕駛面對復(fù)雜場景的泛化性與可解釋性。

例如,通過視覺和激光雷達傳感器可以獲取車輛周圍的靜態(tài)環(huán)境信息,通過聽覺傳感器可以獲取周圍車輛的喇叭聲、引擎聲等動態(tài)信息,通過語言傳感器可以理解交通指示牌、語音導(dǎo)航指令等信息。

這些信息經(jīng)過多模態(tài)大模型的融合處理,可以使自動駕駛系統(tǒng)更加準確地理解周圍環(huán)境,并做出更合理的決策。

什么是世界模型?

世界模型是一種用于描述和預(yù)測駕駛環(huán)境的模型,它可以幫助自動駕駛系統(tǒng)提前規(guī)劃行駛路徑,并應(yīng)對突發(fā)情況。

世界模型通常包含以下要素:

靜態(tài)地圖: 靜態(tài)地圖描述了道路的結(jié)構(gòu)、車道線、交通標志等信息。

動態(tài)信息: 動態(tài)信息描述了道路上行駛的車輛、行人、障礙物等信息。

交通規(guī)則: 交通規(guī)則描述了道路行駛的基本規(guī)則,例如紅燈停綠燈行、限速等。

世界模型的構(gòu)建通常需要大量的駕駛數(shù)據(jù)和先進的模型訓(xùn)練方法。例如,可以利用來自攝像頭、雷達、激光雷達等傳感器的感知數(shù)據(jù),以及來自高精度地圖、交通信息等數(shù)據(jù),來訓(xùn)練世界模型。

還有哪些前沿技術(shù)?

除了上述幾項主要方向之外,還有SAM、NeRF等其他前沿技術(shù)也被應(yīng)用于智能駕駛大模型中,這些技術(shù)有望進一步提升智能駕駛系統(tǒng)的性能和能力。

SAM(Self-Attention Mapping):SAM是一種基于自注意力機制的時空感知模型,可以有效地捕捉環(huán)境中的動態(tài)變化,并預(yù)測未來環(huán)境的演化趨勢。

NeRF(Neurual Radiance Fields):NeRF是一種基于神經(jīng)網(wǎng)絡(luò)的渲染技術(shù),可以利用稀疏的觀測數(shù)據(jù)生成逼真的三維場景重建,為自動駕駛系統(tǒng)提供更加沉浸式的環(huán)境感知。

小結(jié)

智能駕駛大模型是智能駕駛領(lǐng)域近年來最具前瞻性的研究方向之一,智能駕駛大模型也面臨著一些挑戰(zhàn),例如模型的復(fù)雜度、訓(xùn)練數(shù)據(jù)的需求量、倫理問題等。 智能駕駛大模型代表了自動駕駛技術(shù)發(fā)展的未來趨勢。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234951
  • 智能駕駛
    +關(guān)注

    關(guān)注

    3

    文章

    2322

    瀏覽量

    48468
  • 深度學(xué)習
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120587
  • 自動駕駛系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    6701
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2134

    瀏覽量

    1970

原文標題:芝能智駕 | 什么是智能駕駛大模型?

文章出處:【微信號:QCDZSJ,微信公眾號:汽車電子設(shè)計】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    智能網(wǎng)聯(lián)是否是自動駕駛落地的必要條件?

    化;另一種則是智能網(wǎng)聯(lián),主張通過車輛與外部環(huán)境的互聯(lián)互通來提升自動駕駛的安全和可靠。越來越多的業(yè)內(nèi)人士認為,
    的頭像 發(fā)表于 08-29 09:02 ?170次閱讀

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    。 長期可維護: 隨著自動駕駛技術(shù)的不斷發(fā)展和更新,系統(tǒng)需要經(jīng)常進行維護和升級。FPGA的可編程和可配置使得
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有廣泛的應(yīng)用,其高性能、可配置、低功耗和低延遲等特點為自動駕駛的實現(xiàn)提供了強有
    發(fā)表于 07-29 17:09

    中級自動駕駛架構(gòu)師應(yīng)該學(xué)習哪些知識

    隨著自動駕駛技術(shù)的成熟,對系統(tǒng)架構(gòu)師的需求逐漸增加。自動駕駛系統(tǒng)架構(gòu)師負責設(shè)計整個系統(tǒng)的結(jié)構(gòu)、組件、接口和數(shù)據(jù)流;需要協(xié)調(diào)不同領(lǐng)域的專業(yè)知識
    的頭像 發(fā)表于 06-20 21:47 ?182次閱讀

    初級自動駕駛架構(gòu)師應(yīng)該學(xué)習哪些知識

    隨著自動駕駛技術(shù)的成熟,對系統(tǒng)架構(gòu)師的需求逐漸增加。自動駕駛系統(tǒng)架構(gòu)師負責設(shè)計整個系統(tǒng)的結(jié)構(gòu)、組件、接口和數(shù)據(jù)流;需要協(xié)調(diào)不同領(lǐng)域的專業(yè)知識
    的頭像 發(fā)表于 06-20 21:45 ?179次閱讀

    沃爾沃利用英偉達的SoC和AI來提升自動駕駛的安全

    在2024年英偉達GPU技術(shù)大會(NVIDIA GTC 2024)上,沃爾沃介紹了如何利用人工智能和日益提升的算力來提升自動駕駛的安全。
    的頭像 發(fā)表于 05-08 14:38 ?1010次閱讀

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    的架構(gòu),預(yù)計未來許多智能駕駛團隊都會引入“占用網(wǎng)絡(luò)”來提升系統(tǒng)能力。多維像素的應(yīng)用前景非常廣闊。昱感微的融合感知技術(shù)+BEV +Transformer+占用網(wǎng)格
    發(fā)表于 04-11 10:26

    邊緣計算與自動駕駛系統(tǒng)如何結(jié)合

    當前自動駕駛中,大規(guī)模的人工智能算法模型和大規(guī)模數(shù)據(jù)集中化分析均放在云端進行。因為,云端擁有大量的計算資源,可以在極短的時間內(nèi)完成數(shù)據(jù)的處理,但是僅依靠云端為自動駕駛汽車提供服務(wù)在很多
    發(fā)表于 03-25 09:26 ?357次閱讀
    邊緣計算與<b class='flag-5'>自動駕駛</b><b class='flag-5'>系統(tǒng)</b>如何結(jié)合

    如何利用AI技術(shù)提升自動駕駛安全

    智能交通系統(tǒng)是一個高度復(fù)雜的系統(tǒng),它涉及多種技術(shù)和工具。自動駕駛汽車、車輛安全技術(shù)和智能城市系統(tǒng)
    發(fā)表于 01-17 09:44 ?339次閱讀

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng)

    LabVIEW開發(fā)自動駕駛的雙目測距系統(tǒng) 隨著車輛駕駛技術(shù)的不斷發(fā)展,自動駕駛技術(shù)正日益成為現(xiàn)實。從L2級別的輔助駕駛技術(shù)到L3級別的受條件
    發(fā)表于 12-19 18:02

    自動駕駛“十問十答”

    ? 很多人下意識的認為自動駕駛是為了提升大家日常出行的舒適度和便捷,實際上,自動駕駛的推動最開始的主要原因之一是為了【安全】,據(jù)國外研究表明,其中95%事故與人的因素有關(guān),近70%由
    的頭像 發(fā)表于 11-29 07:40 ?672次閱讀
    <b class='flag-5'>自動駕駛</b>“十問十答”

    的含義以及如何提高模型?

    的含義以及如何提高模型? 什么是
    的頭像 發(fā)表于 10-29 11:21 ?3123次閱讀

    農(nóng)機自動駕駛顯示系統(tǒng)組成部分以及配置

    隨著科技的發(fā)展,傳統(tǒng)的農(nóng)機行業(yè)正趨于飽和,新生事物層出不窮,無論是傳統(tǒng)農(nóng)機還是從業(yè)者都面臨如何轉(zhuǎn)型升級的問題。農(nóng)機自動駕駛系統(tǒng)就是當下最熱的概念之一。身為新時代農(nóng)機人,作業(yè)的提質(zhì)增效是無論如何也繞
    發(fā)表于 10-17 17:52

    自動駕駛標準與認證研究:標準化體系助力高階自動駕駛落地和汽車出海

    自動駕駛標準的建設(shè)具有前瞻和約束,對國家自動駕駛汽車發(fā)展具有深遠的意義,目前自動駕駛標準主要圍繞L3級及以上
    的頭像 發(fā)表于 09-27 16:15 ?1132次閱讀
    <b class='flag-5'>自動駕駛</b>標準與認證研究:標準化體系助力高階<b class='flag-5'>自動駕駛</b>落地和汽車出海

    【KV260視覺入門套件試用體驗】八、VITis AI自動駕駛多任務(wù)執(zhí)行MultiTask V3

    是一種模型,旨在同時執(zhí)行自動駕駛場景中的不同任務(wù),同時實現(xiàn)優(yōu)異的性能和效率。這些任務(wù)包括對象檢測、分割、車道檢測、可行駛區(qū)域分割和深度估算,這些都是自動駕駛感知模塊的重要組成部分。
    發(fā)表于 09-26 16:43