0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

第 N 次在公開場合 diss 激光雷達的馬斯克

ml8z_IV_Technol ? 來源:ZF ? 2019-04-29 16:41 ? 次閱讀

昨天,第 N 次在公開場合 diss 激光雷達的馬斯克,再一次讓自動駕駛圈對無人車不同的傳感器應用方案展開了熱議。

實際上,如果站在馬斯克的角度,我們其實不難理解他對激光雷達的「痛恨心理」。

畢竟特斯拉是一家面向普通消費者賣車的企業(yè),而不是一家賣自動駕駛技術和解決方案的公司

在至少 3 年內(nèi),無論是從成本、技術可靠性、安全性、美觀性甚至是用戶對自動駕駛的信任度和品味來看,大多數(shù)車企的量產(chǎn)車型,都不會把激光雷達納入考慮范疇。

當然,根據(jù)馬斯克說話常常打臉的經(jīng)典表現(xiàn)來看,或許在幾年后他會自己站出來反駁自己堅持的觀點。

事實上,在「自動駕駛汽車究竟應該用不用激光雷達」這個問題上長時間的爭論不休,衍生出了「激光雷達派」與「純計算機視覺派」。

目前,一個被激光雷達派以及大眾普遍接受的觀點是,考慮到純視覺算法在數(shù)據(jù)形式和精度上的不足,L3 級以上的自動駕駛乘用車必須要采用激光雷達。

當然,從谷歌 Waymo、通用 Cruise,再到百度阿波羅和國內(nèi)的 Pony.ai、文遠知行等自稱 L4 級自動駕駛乘用車解決方案的公司,車頂上的激光雷達一直都非常扎眼。

而「計算機視覺派」的重要組成部分則是自動駕駛技術解決方案初創(chuàng)公司,但這個解決方案到底是多高的級別,其實目前沒有確切的定論。

通常情況下,「昂貴的成本」和「技術能力」是眾多車企與計算機視覺技術公司反對采用激光雷達的主要理由。

譬如作為一家主打攝像頭方案的技術創(chuàng)業(yè)公司,2017 年 AutoX 的「炫技首秀」就是讓一輛只搭載 7 個攝像頭的林肯 MKZ 跑在普通公路的車道上。雖然后來受到了來自激光雷達派的「反擊」,其創(chuàng)始人兼 CEO 肖健雄也一直堅持以攝像頭為主的傳感器方案,

此外,部分高精地圖創(chuàng)業(yè)公司也強調(diào)從成本出發(fā),采用低成本的攝像頭方案采集高精數(shù)據(jù)。

綜合來看,截至目前自動駕駛圈內(nèi)最主流的觀點雖然是「該有的,一個都不能少」,但不難看出,做車廠的生意,對于計算機視覺公司來說,暫時性拋開激光雷達是個還不錯的主意;

而另一層面,對于計算機視覺工程師來說,想要在高級別自動駕駛解決方案上擺脫激光雷達,就要持續(xù)研究和驗證純視覺技術方案替代激光雷達的可行性。

因此,當大家還在圍觀「馬斯克罵激光雷達」時,我們想從機器之心擅長的角度出發(fā),看看能否從技術上來「驗證」這個看似不太靠譜的觀點。

很湊巧,我們發(fā)現(xiàn)了一篇來自康奈爾大學的技術論文,作者中 Yan Wang 與 Wei-Lun Chao 均為華人。該論文提出了一種新方法來縮短純視覺技術架構與激光雷達間的性能差距。

該論文提出的方法,改變了立體攝像機目標檢測系統(tǒng)的 3D 信息呈現(xiàn)形式,甚至將其稱之為——偽激光雷達數(shù)據(jù)(pseudo-LiDAR)。

研究者在擋風玻璃兩側各使用一個相對廉價的攝像機,采用其新方法之后,該攝像機在目標檢測方面的性能接近激光雷達,且其成本僅為后者的一小部分。研究者發(fā)現(xiàn)以鳥瞰圖而不是正視圖來分析攝像機捕捉到的圖像可以將目標檢測準確率提升 2 倍,從而使立體攝像機成為激光雷達的可行替代方案,且其成本相比后者要低很多。

研究主題

可靠和穩(wěn)健的 3D 目標檢測是自動駕駛系統(tǒng)的基礎要求。要想避免與行人、騎自行車的人、汽車相撞,自動駕駛汽車必須第一時間檢測出它們。

現(xiàn)有的算法嚴重依賴激光雷達(LiDAR),它可以提供周邊環(huán)境的準確 3D 點云。盡管激光雷達的準確率很高,但出于以下原因,自動駕駛行業(yè)急需激光雷達的替代品:

首先,激光雷達非常昂貴,給自動駕駛硬件增加了大量費用;

其次,過度依賴單個傳感器會帶來安全風險,在一個傳感器出現(xiàn)故障時利用備用傳感器是較優(yōu)的選擇。一個自然的選擇是來自立體攝像機或單目攝像機的圖像。光學相機性價比較高(比激光雷達便宜了多個數(shù)量級),且可以高幀率運行,能夠提供稠密深度圖,而激光雷達信號只有 64 個或 128 個稀疏旋轉激光束。

近期的多項研究探索了在 3D 目標檢測中使用單目攝像機和立體深度(視差)估計 [19, 13, 32]。但是,目前主要的成果仍然是激光雷達方法的補充。

例如,KITTI 基準上的一個頂尖算法 [17] 使用傳感器融合(sensor fusion)將汽車的 3D 平均精度(AP)從激光雷達的 66% 提升到了激光雷達+單目圖像的 73%。而在僅使用圖像的算法中,當前最優(yōu)算法的 AP 僅為 10% [30]。

對后者較差性能的一個直觀且流行的解釋是基于圖像的深度估計準確率較低。

與激光雷達相反,立體深度估計的誤差隨著深度增加而呈現(xiàn)二階增長。但是,對激光雷達和立體深度估計器生成的 3D 點云進行視覺對比后發(fā)現(xiàn),這兩種數(shù)據(jù)模態(tài)之間存在高質(zhì)量的匹配,甚至遠處的物體也是如此(詳見圖 1)。

圖 1:來自視覺深度估計的偽激光雷達(pseudo-LiDAR)信號。左上:KITTI 街景圖像,其中汽車周圍的紅色邊界框是通過激光雷達獲取的,而綠色邊界框是通過偽激光雷達獲取的。左下:估計到的視差圖。右:偽激光雷達(藍色)vs 激光雷達(黃色)。其中偽激光雷達點與激光雷達的點很好地對齊。

解決方案

這篇論文提供了另一種解釋——研究者假設立體攝像機和激光雷達之間性能差距的主要原因不在于深度準確率的差異,而是在于在立體攝像機上運行的 ConvNet 3D 目標檢測系統(tǒng)的 3D 信息表示。

具體來說,激光雷達信號通常被表示為 3D 點云或者「鳥瞰」視角圖,并據(jù)此進行處理。在這兩種情況下,目標的形狀和大小都不會隨著深度而發(fā)生變化。

而基于圖像的深度估計主要是針對每個像素,通常被表示為額外的圖像通道,使得遠處的對象很小,不易被檢測到。更糟糕的是,這種表示的像素近鄰將 3D 空間中較遠區(qū)域的點聚集在一起,這就使得在這些通道上執(zhí)行 2D 卷積的卷積網(wǎng)絡更難推理,以及準確地定位 3D 空間中的物體。

為了驗證這一論斷,該研究引入了一種適用于立體攝像機 3D 目標檢測的兩步法。首先將來自立體攝像機或單目攝像機的估計深度圖轉換為 3D 點云,即模擬激光雷達信號的偽激光雷達;然后利用現(xiàn)有的基于激光雷達的 3D 目標檢測流程 [23, 16],直接在偽激光雷達表示上進行訓練。

通過改變偽激光雷達的 3D 深度表示,使基于圖像的 3D 目標檢測算法獲得前所未有的準確率提升。具體來說,在 KITTI 基準上獲得 0.7 交并比(IoU)的汽車實例在驗證集上獲得了 37.9% 的 3D AP,比之前最優(yōu)圖像方法的準確率提升了 2 倍。這樣就能把基于立體攝像機和基于激光雷達的系統(tǒng)之間的差距減半。

圖 2:用于 3D 目標檢測的兩步 pipeline。給定立體或單目攝像機圖像,研究者首先預測深度圖,然后將其轉換為激光雷達坐標系統(tǒng)中的 3D 點云,即偽激光雷達。然后像處理激光雷達一樣處理它,因此任何基于激光雷達的 3D 檢測算法都能在其上使用。

研究者對立體深度估計和 3D 目標檢測算法的多種組合進行了評估,并得到了非常一致的結果。這表明性能的提升是由于使用了偽激光雷達表示,它較少依賴于 3D 目標檢測架構的創(chuàng)新或深度估計技術。

總之,該論文有以下貢獻:

首先,通過實驗證明,基于立體攝像機和基于激光雷達的 3D 目標檢測技術之間的性能差異不是因為估計深度的質(zhì)量,而是因為表示。

其次,研究者提出了一種新型 3D 目標檢測估計深度表示——偽激光雷達,將之前的最優(yōu)性能提升了 2 倍,達到了當前最佳水平。

這一研究結果表明,在自動駕駛汽車中使用立體攝像頭是可能的,這樣既能夠極大地降低成本,又能夠改進安全性能。

論文:Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for Autonomous Driving

論文鏈接:https://arxiv.org/abs/1812.07179

摘要:3D 目標檢測是自動駕駛的一項重要任務。如果 3D 輸入數(shù)據(jù)是通過精確但昂貴的激光雷達獲得的,那么目前的技術可以獲得高度精確的檢測率?;谳^便宜的單目攝像機或立體攝像機圖像數(shù)據(jù)的方法目前能夠達到的準確率較低,這種差距通常被歸因于基于圖像的深度估計技術缺陷。

然而,在本文中,研究者認為,數(shù)據(jù)表示(而非其質(zhì)量)是造成這種差距的主要原因。研究者將卷積神經(jīng)網(wǎng)絡的內(nèi)部工作原理考慮在內(nèi),提出將基于圖像的深度圖轉換為偽激光雷達表示——本質(zhì)上是模擬激光雷達信號。有了這種表示,我們就能應用當下基于激光雷達的各種不同檢測算法。

在流行的 KITTI 基準上,該論文提出的方法在基于圖像的性能方面取得了令人印象深刻的改進,超越當前最佳方法,將 30 米范圍內(nèi)的目標檢測準確率從當前最佳的 22% 提高到了 74%。截至論文提交時,該論文提出的算法在基于立體圖像方法的 KITTI 3D 目標檢測排行榜上達到了當前最高水平。

實驗

研究者通過不同的深度估計和目標檢測算法,在不同的設置下評估了有/沒有偽激光雷達的情況下 3D 目標檢測的結果(如下表)。偽激光雷達得到的結果顯示為藍色,真實激光雷達的結果顯示為灰色。

第 N 次在公開場合 diss 激光雷達的馬斯克

表 1:3D 目標檢測結果。表中顯示了汽車分類的 AP_BEV / AP_3D 百分率、對應于鳥瞰圖和 3D 目標框檢測的平均精度。

第 N 次在公開場合 diss 激光雷達的馬斯克

表 4:行人和騎車人類別的 3D 目標檢測結果。研究者報告了 IoU = 0.5(標準度量)時的 AP_BEV / AP_3D,并將 PSMNET(藍色)估計的偽激光雷達和激光雷達(灰色)進行比較,兩者都使用 F-POINTNET 算法。

圖 4:定性比較。研究者使用 AVOD 算法對激光雷達、偽激光雷達和正視圖(立體)進行了比較。紅色框中的是 Groundtruth,綠色框中的是預測框;偽激光雷達圖像(下面一行)中的觀測者在最左邊向右看。正視圖方法(右)甚至錯誤計算了附近目標的深度,并且完全忽視了遠處的目標。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 激光雷達
    +關注

    關注

    967

    文章

    3863

    瀏覽量

    188743
  • 馬斯克
    +關注

    關注

    1

    文章

    790

    瀏覽量

    21190

原文標題:馬斯克剛罵了激光雷達,這篇用純視覺代替激光雷達的名校論文「力挺」了他

文章出處:【微信號:IV_Technology,微信公眾號:智車科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    馬斯克:比特幣是有價值的

    特斯拉硅谷車主的一場活動中馬斯克表示比特幣以及一些其他加密貨幣是有價值的. 在這次在線活動中,馬斯克還談到了星艦的第五試飛、星鏈Mini、Optimus人形機器人,以及Robota
    的頭像 發(fā)表于 07-31 17:59 ?1292次閱讀

    ?小鵬新車或放棄激光雷達 馬斯克發(fā)評論

    新聞,馬斯克評論區(qū)回復到:“...”。 但X平臺也有網(wǎng)友提出不同意見,表示:“So much for Tesla being wrong for not using LiDAR(特斯拉不使用激光雷達是錯誤
    的頭像 發(fā)表于 07-10 08:39 ?149次閱讀

    曾被馬斯克嫌棄的激光雷達,已在新能源汽車領域提前“跨越鴻溝”

    近日,市場研究機構YoleIntelligence發(fā)布了《2024年全球車載激光雷達市場報告》?!秷蟾妗凤@示,2023年,全球車載激光雷達市場規(guī)模達到了5.38億美元,同比勁增79%。其中,乘用車
    的頭像 發(fā)表于 07-09 08:05 ?1382次閱讀
    曾被<b class='flag-5'>馬斯克</b>嫌棄的<b class='flag-5'>激光雷達</b>,已在新能源汽車領域提前“跨越鴻溝”

    馬斯克也給英偉達打工了

    馬斯克融來的60億美元巨資,讓xAI彎道超車,估值一躍成為全球第二大AI獨角獸。但馬斯克AI行業(yè)內(nèi)積累的人望,以及此刻大模型創(chuàng)業(yè)之激烈,他的入局遠遠談不上眾望所歸。而xAI由此被拉起的高昂估值,也
    的頭像 發(fā)表于 06-03 08:04 ?196次閱讀
    <b class='flag-5'>馬斯克</b>也給英偉達打工了

    狂踩激光雷達馬斯克,如今竟成Luminar的榜一大哥?

    近日,激光雷達頭部玩家Luminar發(fā)布Q1財報,致股東的信中表示,特斯拉已成為Luminar第一季度最大的激光雷達客戶。此言一出,頓時語驚四座,當初堅決拋棄激光雷達
    的頭像 發(fā)表于 05-28 08:05 ?154次閱讀
    狂踩<b class='flag-5'>激光雷達</b>的<b class='flag-5'>馬斯克</b>,如今竟成Luminar的榜一大哥?

    馬斯克稱特斯拉的FSD系統(tǒng)不需要激光雷達

    萬美元的激光雷達設備。 然而,埃隆·馬斯克對此回應稱,特斯拉已經(jīng)不需要激光雷達技術來收集自動駕駛所需的“基準真實數(shù)據(jù)”。 他進一步明確表示:“我們甚至不再需要它們來做這件事了。 ”這與馬斯克
    的頭像 發(fā)表于 05-14 18:46 ?954次閱讀
    <b class='flag-5'>馬斯克</b>稱特斯拉的FSD系統(tǒng)不需要<b class='flag-5'>激光雷達</b>

    特斯拉一季度采購逾200萬美元Luminar激光雷達

    美國激光雷達供應商Luminar近期公布,特斯拉成為其一季度傳感器的最大買家,占該公司2100萬美元總營收的逾10%,預計超過200萬美元。這一消息令人矚目,因為特斯拉素以其純視覺智能駕駛技術聞名,而特斯拉的首席執(zhí)行官埃隆·馬斯克公開
    的頭像 發(fā)表于 05-09 15:06 ?402次閱讀

    Luminar: 特斯拉是其最大激光雷達客戶

    特斯拉作為全球唯一堅持純視覺智能駕駛技術路線的汽車制造商,其首席執(zhí)行官埃隆·馬斯克(Elon Musk)對激光雷達持否定態(tài)度,甚至稱之為“拐杖”,并聲稱依賴激光雷達的自動駕駛技術終將失敗。
    的頭像 發(fā)表于 05-08 16:15 ?263次閱讀

    特斯拉馬斯克的社交平臺X平臺投放廣告

    眾所周知,馬斯克一貫對廣告持排斥態(tài)度。特斯拉此前從未聘請明星代言或投放廣告(盡管曾有例外)。盡管特斯拉的支持者和投資者多次建議其嘗試廣告策略,但馬斯克始終堅決反對,甚至公開表示“厭惡”廣告。
    的頭像 發(fā)表于 04-18 10:20 ?299次閱讀

    馬斯克:AI發(fā)展速度前所未見 但馬斯克起訴OpenAI及其創(chuàng)始人

    馬斯克:AI發(fā)展速度前所未見? 現(xiàn)在市場上對于任何OpenAI的消息都非常敏感,我們分享一下馬斯克對OpenAI起訴的一些事項。 馬斯克日前的一
    的頭像 發(fā)表于 03-02 15:29 ?1155次閱讀

    馬斯克署名論文揭秘腦機接口傳感器芯片原理!首次披露!

    馬斯克署名論文首次公開透露Neuralink腦機接口及N1腦部傳感器芯片原理!馬斯克竟是第一作者?!貢獻多大? 今天,大家想必又被馬斯克刷屏
    的頭像 發(fā)表于 02-20 08:40 ?349次閱讀
    <b class='flag-5'>馬斯克</b>署名論文揭秘腦機接口傳感器芯片原理!首次披露!

    馬斯克550億美元薪酬方案被推翻 馬斯克4000億薪酬被判無效

    Neuralink的成功準備大撈一筆的時候,外媒爆出馬斯克特斯拉的550億美元薪酬計劃被美國特拉華州衡平法院首席法官駁回,而對于對于法官的裁決結果,馬斯克則在社交媒體上回應稱:“永遠不要在特拉華州注冊公司”。 事件起因是根據(jù)
    的頭像 發(fā)表于 01-31 11:18 ?1730次閱讀

    【洞見芯趨勢】決戰(zhàn)智駕,2024年或是激光雷達的天下!

    增長期。 汽車有沒有必要裝激光雷達,此前業(yè)內(nèi)一直存在不同聲音。華為余承東認為激光雷達作為智能汽車的重要感知器件之一,為了保護駕駛者的安全必不可少。特斯拉馬斯克則認為激光雷達并非最佳選擇
    的頭像 發(fā)表于 12-14 18:15 ?330次閱讀
    【洞見芯趨勢】決戰(zhàn)智駕,2024年或是<b class='flag-5'>激光雷達</b>的天下!

    單線激光雷達和多線激光雷達區(qū)別

    單線激光雷達和多線激光雷達區(qū)別? 單線激光雷達和多線激光雷達是兩種常用的激光雷達技術。它們
    的頭像 發(fā)表于 12-07 15:48 ?3774次閱讀

    馬斯克的xAI公司尋求融資10億美元

    馬斯克先生在公開場合曾經(jīng)表達過這樣的理念:我們的世界亟需有一家非Google和Microsoft之外的可信賴的人工智能服務提供商來滿足日益增長的需求。值得一提的是,當前的OpenAI背后所倚仗的投資大佬正是微軟公司。
    的頭像 發(fā)表于 12-06 10:41 ?583次閱讀