0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

佐思汽研發(fā)布《2024年端到端自動駕駛研究報告》

佐思汽車研究 ? 來源:佐思汽車研究 ? 2024-04-20 11:21 ? 次閱讀

佐思汽研發(fā)布《2024年端到端自動駕駛研究報告》。

1

國內(nèi)端到端方案現(xiàn)狀

端到端自動駕駛是直接從傳感器信息輸入(如攝像頭圖像、LiDAR等)到控制命令輸出(如轉(zhuǎn)向、加減速等)映射的一套系統(tǒng),最早出現(xiàn)在1988年的ALVINN項目,通過相機和激光測距儀進行輸入和一個簡單的神經(jīng)網(wǎng)絡(luò)生成的轉(zhuǎn)向進行輸出。

2024年初,特斯拉FSD V12.3版本發(fā)布,智駕水平讓人驚艷,端到端自動駕駛方案受到國內(nèi)主機廠和自動駕駛方案企業(yè)的廣泛關(guān)注。

與傳統(tǒng)的多模塊方案相比,端到端自動駕駛方案將感知、預(yù)測和規(guī)劃整合到單一模型中,簡化了方案結(jié)構(gòu),可模擬人類駕駛員直接從視覺輸入做出駕駛決策,以數(shù)據(jù)和算力為主導(dǎo),能夠有效解決模塊化方案的長尾場景,提升模型的訓(xùn)練效率和性能上限。

傳統(tǒng)多模塊方案與端到端方案的對比(部分)

5f27f580-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動駕駛研究報告》

FSD V12.3版本實測圖

5f4f3b68-fec3-11ee-a297-92fbcf53809c.png

來源:公開渠道

部分主機廠對端到端方案落地量產(chǎn)的規(guī)劃

608716a4-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動駕駛研究報告》

理想端到端方案

理想認為,完整的端到端需要完成感知、跟蹤、預(yù)測、決策、規(guī)劃整個過程的模型化,是實現(xiàn)L3級別自動駕駛的最佳方案。2023年,理想推送AD Max3.0,其整體框架已經(jīng)具備端到端的理念,但距離完整的端到端尚有一定差距,2024年理想預(yù)計以此為基礎(chǔ),推進該系統(tǒng)成為一個徹底的端到端方案。

理想構(gòu)建的自動駕駛框架如下圖,分為兩個系統(tǒng):

快系統(tǒng):System1,感知周圍環(huán)境后直接執(zhí)行,為理想現(xiàn)行的端到端方案。

慢系統(tǒng):System2,多模態(tài)大語言模型,針對未知環(huán)境進行邏輯思考與探索,以解決L4未知場景下的問題。

理想自動駕駛框架

60bd65b0-fec3-11ee-a297-92fbcf53809c.png

來源:理想汽車

在端到端方案推進的過程中,理想計劃把規(guī)劃/預(yù)測模型與感知模型進行統(tǒng)一,并在原基礎(chǔ)上完成Temporal Planner的端到端,實現(xiàn)泊車/行車一體化。

2

數(shù)據(jù)成為端到端落地的關(guān)鍵

端到端方案的落地需要經(jīng)歷構(gòu)建研發(fā)團隊、配置硬件設(shè)施、數(shù)據(jù)收集處理、算法訓(xùn)練與策略定制、驗證評估、推廣量產(chǎn)等流程,部分場景痛點如表中所示:

端到端方案的部分場景痛點

60dc4930-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動駕駛研究報告》

其中,端到端自動駕駛方案中的一體化訓(xùn)練需要大量的數(shù)據(jù),因此其面臨的難點之一在于數(shù)據(jù)的收集和處理。

首先,數(shù)據(jù)的收集需要大量的時間和渠道,數(shù)據(jù)類型除了駕駛數(shù)據(jù)外還包括各種不同的道路、天氣和交通情況等場景數(shù)據(jù),其中在實際駕駛中駕駛員前方視野的駕駛數(shù)據(jù)相對便于收集,周圍方位的信息收集則難以保證。

再次,數(shù)據(jù)處理時需要設(shè)計數(shù)據(jù)提取維度、從海量的視頻片段中提取有效的特征、統(tǒng)計數(shù)據(jù)分布等,以支持大規(guī)模的數(shù)據(jù)訓(xùn)練。

元戎啟行

截至2024年3月,元戎啟行端到端自動駕駛方案已經(jīng)獲得長城汽車的定點項目,并與英偉達開展合作,預(yù)計2025年適配英偉達Thor芯片;在元戎啟行的規(guī)劃中,從傳統(tǒng)方案過渡到“端到端”自動駕駛方案,經(jīng)歷傳感器前融合、去高精度地圖、感知決策控制三個模型一體化等環(huán)節(jié)。

元戎啟行在數(shù)據(jù)環(huán)節(jié)的布局

6105113a-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動駕駛研究報告》

極佳科技

極佳科技的自動駕駛世界模型DriveDreamer,具備場景生成、數(shù)據(jù)生成、駕駛動作預(yù)測等功能;在場景/數(shù)據(jù)生成上,分為兩個步驟:

涉及單幀結(jié)構(gòu)化條件,引導(dǎo)DriveDreamer生成駕駛場景圖像,便于其理解結(jié)構(gòu)交通約束。

將其理解擴展到視頻生成。利用連續(xù)的交通結(jié)構(gòu)條件,DriveDreamer輸出駕駛場景視頻,進一步增強其對運動轉(zhuǎn)換的理解。

DriveDreamer的功能包括可連續(xù)駕駛視頻生成、與文本提示和結(jié)構(gòu)化交通限制無縫對齊

6122a984-fec3-11ee-a297-92fbcf53809c.png

來源:極佳科技

3

端到端方案加快具身機器人落地

除了自動駕駛汽車,具身機器人是端到端方案另一個主流場景。從端到端自動駕駛到機器人,需要構(gòu)建更加通用的世界模型,來適應(yīng)更加復(fù)雜、多元的現(xiàn)實使用場景,主流AGI(通用人工智能)發(fā)展的框架分為兩個階段:

階段一:基礎(chǔ)大模型理解和生成實現(xiàn)統(tǒng)一,進一步與具身智能結(jié)合,形成統(tǒng)一世界模型;

階段二:世界模型+復(fù)雜任務(wù)的規(guī)控能力和抽象概念的歸納能力,逐步演化進入交互AGI 1.0時代。

在世界模型落地的過程中,構(gòu)建端到端的VLA(Vision-Language-Action) 自主系統(tǒng)成為關(guān)鍵一環(huán)。VLA作為具身智能基礎(chǔ)大模型,能夠?qū)?D感知、推理和行動無縫鏈接起來,形成一個生成式世界模型,并建立在基于3D的大型語言模型(LLM)之上,引入一組交互標(biāo)記以與環(huán)境進行互動。

3D-VLA解決方案

6142fbe4-fec3-11ee-a297-92fbcf53809c.png

來源:University of Massachusetts Amherst、MIT-IBM Watson AI Lab等機構(gòu)

截至2024年4月,部分采用端到端方案的具身機器人廠商如下:

部分具身機器人如何應(yīng)用端到端方案

615b550e-fec3-11ee-a297-92fbcf53809c.png

來源:佐思汽研《2024年端到端自動駕駛研究報告》

以有鹿機器人為例,其具身智能大模型LPLM(Large Physical Language Model)為端到端的具身智能解決方案,通過自我標(biāo)注機制提升模型從未標(biāo)注數(shù)據(jù)中的學(xué)習(xí)效率和質(zhì)量,從而加深對世界的理解,進而加強機器人的泛化能力與跨模態(tài)、跨場景、跨行業(yè)場景下的環(huán)境適應(yīng)性。

LPLM模型架構(gòu)

6185174a-fec3-11ee-a297-92fbcf53809c.png

來源:有鹿機器人

LPLM 將物理世界抽象化,確保該類信息與 LLM 里特征的抽象等級對齊,將物理世界中每一個所指的實體顯式建模為 token,編碼幾何、語義、運動學(xué)與意圖信息。

此外,LPLM 在自然語言指令的編碼中加入了 3D grounding,一定程度上彌補了自然語言不夠精確的缺陷;其解碼器能夠通過不斷預(yù)測未來的方式去學(xué)習(xí),從而加強了模型從海量無標(biāo)簽數(shù)據(jù)中學(xué)習(xí)的能力。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2541

    文章

    49945

    瀏覽量

    747443
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4717

    瀏覽量

    99996
  • 攝像頭
    +關(guān)注

    關(guān)注

    59

    文章

    4752

    瀏覽量

    94383
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3637

    瀏覽量

    89830
  • 自動駕駛
    +關(guān)注

    關(guān)注

    781

    文章

    13449

    瀏覽量

    165254

原文標(biāo)題:端到端智駕研究:E2E自動駕駛發(fā)展現(xiàn)狀

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    實現(xiàn)自動駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?342次閱讀
    實現(xiàn)<b class='flag-5'>自動駕駛</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    是FPGA在自動駕駛領(lǐng)域的主要應(yīng)用: 一、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環(huán)境,這涉及大量的圖像處理任務(wù)。FPGA在處理圖像上的運算速度快,可并行性強,且功耗
    發(fā)表于 07-29 17:09

    理想汽車加速自動駕駛布局,成立“”實體組織

    近期,理想汽車在其智能駕駛領(lǐng)域邁出了重要一步,正式成立了專注于“自動駕駛”的實體組織,該組織規(guī)模超過200人,標(biāo)志著理想在
    的頭像 發(fā)表于 07-17 15:42 ?1189次閱讀

    豐田攜手Momenta推出全場景智能駕駛方案

    在近日舉行的廣豐田科技開放日上,一場引領(lǐng)未來的智能駕駛技術(shù)盛宴吸引了全球目光。廣豐田攜手國內(nèi)領(lǐng)先的自動駕駛解決方案提供商Momenta,共同推出了
    的頭像 發(fā)表于 06-29 17:36 ?1520次閱讀

    研發(fā)布2024北京車展新四化趨勢分析報告

    研發(fā)布2024北京車展新四化趨勢分析報告
    的頭像 發(fā)表于 05-21 15:16 ?1016次閱讀
    <b class='flag-5'>佐</b><b class='flag-5'>思</b><b class='flag-5'>汽</b><b class='flag-5'>研發(fā)布</b>《<b class='flag-5'>2024</b><b class='flag-5'>年</b>北京車展新四化趨勢分析<b class='flag-5'>報告</b>》

    小鵬汽車發(fā)布大模型

    小鵬汽車近日宣布,其成功研發(fā)發(fā)布了“國內(nèi)首個量產(chǎn)上車”的大模型,該模型可直接通過傳感器輸入內(nèi)容來控制車輛,標(biāo)志著智能
    的頭像 發(fā)表于 05-21 15:09 ?576次閱讀

    研發(fā)布2024汽車數(shù)字鑰匙產(chǎn)業(yè)趨勢研究報告

    最近三,中國汽車數(shù)字鑰匙市場迅猛增長,裝配率以每年10個百分點以上的速度攀升。
    的頭像 發(fā)表于 04-23 16:42 ?2445次閱讀
    <b class='flag-5'>佐</b><b class='flag-5'>思</b><b class='flag-5'>汽</b><b class='flag-5'>研發(fā)布</b>《<b class='flag-5'>2024</b><b class='flag-5'>年</b>汽車數(shù)字鑰匙產(chǎn)業(yè)趨勢<b class='flag-5'>研究報告</b>》

    億咖通自研智駕芯片,L2.5裝車量同比增175%

    研發(fā)布《中國汽車智駕技術(shù)與數(shù)據(jù)趨勢月度監(jiān)測報告2024
    的頭像 發(fā)表于 04-22 15:22 ?873次閱讀
    億咖通自研智駕芯片,L2.5裝車量同比增175%

    智行者聯(lián)合清華完成國內(nèi)首套全棧式自動駕駛系統(tǒng)的開放道路測試

    近日,智行者與清華大學(xué)車輛學(xué)院李克強院士、李升波教授領(lǐng)導(dǎo)的研究團隊,完成了國內(nèi)首套全棧式自動駕駛系統(tǒng)的開放道路測試。
    的頭像 發(fā)表于 04-22 09:24 ?637次閱讀
    智行者聯(lián)合清華完成國內(nèi)首套全棧式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自動駕駛</b>系統(tǒng)的開放道路測試

    理想汽車自動駕駛模型實現(xiàn)

    理想汽車在感知、跟蹤、預(yù)測、決策和規(guī)劃等方面都進行了模型化,最終實現(xiàn)了的模型。這種模型不僅完全模型化,還能夠虛擬化,即在模擬環(huán)境中進行訓(xùn)練和測試。
    發(fā)表于 04-12 12:17 ?340次閱讀
    理想汽車<b class='flag-5'>自動駕駛</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型實現(xiàn)

    未來已來,多傳感器融合感知是自動駕駛破局的關(guān)鍵

    方面表示,這是L4級自動駕駛公司和車企為了打造Robotaxi量產(chǎn)車,在國內(nèi)成立的首個合資公司。首款車型已完成產(chǎn)品定義,正在進行設(shè)計造型的聯(lián)合評審,計劃明年實現(xiàn)量產(chǎn)。未來已來,2024是全球L3
    發(fā)表于 04-11 10:26

    研發(fā)布2024車載XR(VR/AR/MR)行業(yè)研究報告

    車載XR(Extended Reality,擴展現(xiàn)實)是一種將虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)及混合現(xiàn)實(MR)技術(shù)集成車載系統(tǒng)中的創(chuàng)新技術(shù)。它可為駕駛者、乘客帶來更豐富直觀的信息交互體驗,是未來智能座艙差異化的重要體現(xiàn)。
    的頭像 發(fā)表于 03-25 15:45 ?1900次閱讀
    <b class='flag-5'>佐</b><b class='flag-5'>思</b><b class='flag-5'>汽</b><b class='flag-5'>研發(fā)布</b>《<b class='flag-5'>2024</b><b class='flag-5'>年</b>車載XR(VR/AR/MR)行業(yè)<b class='flag-5'>研究報告</b>》

    混合動力汽車研究:電動化計劃推遲 PHEV&amp;增程式占比將抬升至40%

    研發(fā)布《2023-2024全球和中國混合動力汽車研究
    的頭像 發(fā)表于 01-25 13:54 ?1766次閱讀
    混合動力汽車<b class='flag-5'>研究</b>:電動化計劃推遲 PHEV&amp;增程式占比將抬升至40%

    集團獲得L3自動駕駛路測牌照

    集團在2023底正式獲得了廣州市的L3自動駕駛路測牌照,這一里程碑標(biāo)志著廣自動駕駛技術(shù)研發(fā)
    的頭像 發(fā)表于 01-11 15:05 ?579次閱讀

    基于的Al自動駕駛決策方法

    隨著人工智能的迅速發(fā)展,自動駕駛技術(shù)正經(jīng)歷著一場革命性的變革。人工智能的出現(xiàn)為自動駕駛系統(tǒng)帶來了深度學(xué)習(xí)等方法的應(yīng)用,不再完全依賴人類專家設(shè)計特征,而是能夠自動進行特征描述和學(xué)習(xí)。
    發(fā)表于 09-25 12:33 ?762次閱讀
    基于<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的Al<b class='flag-5'>自動駕駛</b>決策方法