無人駕駛傳感,通常意義上認為是“三雷達一相機”:激光雷達、毫米波雷達、超聲波雷達和相機。實際上,行業(yè)里認為可能以后還會使用紅外,只要是對傳感感知有利的傳感器,無人駕駛的研究上是不介于使用的。
下面逐個介紹傳感類型和傳感信息處理方法。之所以叫方法,而不叫算法,是因為只是從宏觀上說明數(shù)據(jù)是如何處理的。
相機
相機分為單目、雙目、多目、環(huán)視。
攝像頭是應(yīng)用范圍最大也是最不可替代的傳感方案,無論是哪個廠的方案,特斯拉也好,奔馳寶馬也好,都離不開攝像頭。這是因為,攝像頭具有一個獨一無二的能力。以現(xiàn)有工業(yè)技術(shù)來看,在所有傳感器當(dāng)中,只有攝像頭具備識別能力,而且這個識別能力還會根據(jù)算法實現(xiàn)迭代優(yōu)化。對于自動駕駛的具體場景來說,識別能力非常關(guān)鍵。
目前智能車上有使用單目攝像頭(用于目標(biāo)和障礙物識別)+雷達(測距,有的還用于目標(biāo)識別),或者使用雙目攝像頭(雙目攝像頭比單目攝像頭能更好地解決測距問題)。
在自動駕駛場景中,偏高速的場景往往會用毫米波雷達來解決測距問題,而在低速場景使用雙目來測距則仍會受到陰雨、光線等外界條件的影響。所以有識別能力且不以判斷距離為核心的單目攝像頭是必不可少的視覺傳感。
圖像處理方法
圖像處理的辦法有兩類:
1、傳統(tǒng)的模式識別
簡單來說就是對識別到的物體進行特征提取,然后將提取到的特征與現(xiàn)有模板進行比對,然后完成分類、識別的任務(wù)。使用這一類技術(shù)的最有代表性的公司就是以色列的 Mobileye。但模式識別存在一個問題,就是所有的判斷都是基于已經(jīng)了解的知識。
換句話說,是通過枚舉的方式來認識這個世界。如果遇到了此前沒有見過的物體,那么系統(tǒng)就無法完成識別判斷。這在 ADAS、有人類輔助的低級自動駕駛場景中可行,但在更高級別的自動駕駛場景,例如車里的人做別的事讓車自己行駛,那么這種方法就可能出現(xiàn)問題。
Mobileye 在這個技術(shù)路徑上積累了多年經(jīng)驗,已收集和迭代了全球各種駕駛場景的數(shù)據(jù)。國內(nèi)也有走與 Mobielye 相同路線的公司,但想在算法和數(shù)據(jù)上超越 Mobileye 基本上是非常困難的,需要很長的時間和大量資源的投入。
從自動駕駛場景的基本屬性來看,交通場景屬于非結(jié)構(gòu)化的場景。什么是非結(jié)構(gòu)化?
簡單來說,結(jié)構(gòu)化的數(shù)據(jù)是可以通過一、兩個物理量表征出來的,但非結(jié)構(gòu)化數(shù)據(jù)和場景卻很難用一、兩個量表征出來。例如,一個復(fù)雜的十字路口就沒有辦法單純滴用幾個人、幾盞燈、幾個小孩這樣的量來表征。
而隨著這一輪人工智能的興起,深度學(xué)習(xí)在自動駕駛場場景中就起到了非常關(guān)鍵的作用,可以通過一系列數(shù)據(jù)訓(xùn)練模型來解決問題,而且隨著數(shù)據(jù)量的增加,模型的識別和判斷能力會逐漸提升。如此看來,投資走模式識別技術(shù)路線的公司在短期內(nèi)機會相對較小。
從技術(shù)角度出發(fā),深度學(xué)習(xí)能力的判斷無非就是考量模型和數(shù)據(jù)。
首先看的是數(shù)據(jù),想看看有沒有一些特殊的方式能夠讓一家公司能夠擁有先于業(yè)內(nèi)其他企業(yè)數(shù)據(jù)獲取能力,擁有更低成本、更高效率的數(shù)據(jù)獲取方式,這是我們當(dāng)時考量的一個基礎(chǔ)。
其實,我們在理解數(shù)據(jù)上也走很長的一段路。最開始,我們以為在出租車上掛一個行車記錄儀出去跑一跑、拍一拍就 OK 了,但這跟實際需要的數(shù)據(jù)相差甚遠。
為什么呢?因為實際需要的數(shù)據(jù)需要多元化的數(shù)據(jù)??赡茉诟咚俟妨伺牧藥兹f公里但是由于車輛少、場景單一,大多數(shù)數(shù)據(jù)都沒什么用。
后來我們了解到,實際需要的數(shù)據(jù)叫做全駕乘狀態(tài)的車輛數(shù)據(jù)。除了攝像頭自身標(biāo)定出來的有人和物的數(shù)據(jù),還要伴隨著場景中的汽車狀態(tài)數(shù)據(jù),例如 CAN 總線數(shù)據(jù)、GPS 數(shù)據(jù)等。
相比之下,簡單依靠出租車搭載行車記錄儀得到的數(shù)據(jù)并不完備,這種全駕乘狀態(tài)的車輛數(shù)據(jù)才是核心,而且必須與專業(yè)機構(gòu)、車廠合作才能獲取。
另外一點就是模型。在考量算法模型時,我們其實有很大的顧慮?,F(xiàn)在有很多成熟的開源框架,例如 TensorFlow、Caffe 等等。這些開源算法框架的存在似乎是把門檻降低了。但是理解之后,我們發(fā)現(xiàn),同樣是 TensorFlow,不同企業(yè)、不同廠家拿過來使用以后,產(chǎn)生的效果是不一樣的。原因在于,模型優(yōu)化這件事情有三個層面。
第一個層面是簡單的參數(shù)調(diào)整。例如對某一個網(wǎng)絡(luò)層的某一個參數(shù)進行調(diào)參,并不知道調(diào)出來的效果是什么樣的,只能一次一次的試,有點像算命。
第二個層面是可以改開源算法框架的源代碼,進而優(yōu)化里面的細節(jié)公式。這個層面可能需要對 TensorFlow 體系有比較深入的理解,同時對工程化有比較深入的認知,往往具備產(chǎn)業(yè)背景。
第三個層面不但可以調(diào)整技術(shù)源代碼,還可以根據(jù)自己的數(shù)學(xué)理解和開發(fā)能力,用不同的數(shù)據(jù)方法優(yōu)化底層的數(shù)據(jù)公式。這個層面除了對產(chǎn)業(yè)和工程存在要求,最好還要具備比較深的數(shù)學(xué)功底。這些經(jīng)歷可以幫助研發(fā)人員在模型嘗試的過程中少走很多彎路。
激光雷達
激光雷達種類
第一個是機械旋轉(zhuǎn)式激光雷達。這類激光雷達有機械旋轉(zhuǎn)機構(gòu),相對笨重,如果要將旋轉(zhuǎn)機構(gòu)做到可靠性高,滿足車規(guī)級要求,成本會很高。我們認為,這類激光雷達的機會是窗口性的,未來其他技術(shù)成熟了,這類激光雷達可能會退出市場。這也是所謂的非固態(tài)激光雷達,人們通常把下面這三種成為固態(tài)激光雷達。
第二類是 MEMS 激光雷達。這類激光雷達是把所有的機械結(jié)構(gòu)做到半導(dǎo)體工藝上,集成到單個芯片。目前,國外有以色列公司 Innoluce 正在嘗試這一技術(shù)路徑,國內(nèi)也有走類似路線公司,但國內(nèi)在其核心原件 MEMS 振鏡一直量產(chǎn)能力不強。而且這個方案在成本上不太可靠。
第三類是光學(xué)相控陣激光雷達。這類激光雷達對工藝要求極其苛刻,因此量產(chǎn)也是一個問題。
第四類是面陣激光雷達。之前面陣激光雷達較多應(yīng)用于航天軍工領(lǐng)域,精度較高,但是造價昂貴。
評論
查看更多