一、“智能無(wú)人駕駛技術(shù)”現(xiàn)在發(fā)展到什么階段了?
到目前為止,無(wú)人車發(fā)展可以分為三個(gè)階段。
階段一:UGV 軍方背景時(shí)代:2001 - 2007
2001年,因?yàn)閼?zhàn)爭(zhēng)中的大量傷亡,美國(guó)國(guó)防部出臺(tái)法案:到2015年,美軍1/3的地面作戰(zhàn)車輛必須為無(wú)人駕駛。 (Section 220 of the FY2001 defense authorization act)。 自此,DARPA (美國(guó)的國(guó)防科工委)成為無(wú)人車輛科研的先驅(qū)。當(dāng)時(shí)無(wú)人車的英文名稱為Unmanned-Ground Vehicle (UGV) 一聽(tīng)就充滿了軍事的味道。
2004年,為促進(jìn)無(wú)人車發(fā)展,DARPA組織了第一屆無(wú)人車?yán)μ魬?zhàn)賽Grand Challenge,賽程穿越加州到內(nèi)華達(dá)沙漠,全程150英里。參賽隊(duì)伍包括斯坦福,卡內(nèi)基梅隆大學(xué)等頂尖高校,然而,沒(méi)有一個(gè)參賽隊(duì)完成比賽。就連表現(xiàn)最好的卡內(nèi)基梅隆隊(duì),也只是行駛了約7.3英里。
2005年,僅僅1年之后,由我導(dǎo)師的導(dǎo)師Sebastian Thrun領(lǐng)軍的斯坦福大學(xué)隊(duì)Stanley就完成了拉力賽全部路程,并奪得第一名??▋?nèi)基梅隆大學(xué)屈居第二。
(我和無(wú)人車技術(shù)先驅(qū)Sebastian)
今天我想就無(wú)人車的核心技術(shù)談一談我的看法和認(rèn)識(shí)。
二、無(wú)人車涉及的核心技術(shù)
無(wú)人車是一個(gè)非常完備的系統(tǒng),從技術(shù)上,可以分為以下幾個(gè)模塊:
1、perception Perception指的是無(wú)人車如何能夠識(shí)別周邊的環(huán)境,例如街道范圍,信號(hào)燈、路標(biāo)等,知道應(yīng)該停止還是 前進(jìn)。如果交通標(biāo)志非常清晰、易讀,那么無(wú)人車相對(duì)比較好識(shí)別。
但難點(diǎn)在于,如何識(shí)別模糊的標(biāo)志呢?
比如,芝加哥一到冬天,風(fēng)就特別大,還飄著雪花,能把整個(gè)stop sign全都遮蓋掉。駕駛員都難以分辨那 是個(gè)stop sign還是別的標(biāo)志。那在這種極端情況下,無(wú)人車如何能夠正確安全的駕駛? 這里主要用到的技術(shù)就是computer vision,machine learning等技術(shù)。隨著深度學(xué)習(xí)的技術(shù)的普及和 深入,Perception 這幾年有了很大的進(jìn)展,整個(gè)路標(biāo)、路況識(shí)別的準(zhǔn)確率有了質(zhì)的提高。這為無(wú)人車安全 行駛提供了非常堅(jiān)實(shí)的基礎(chǔ)。但Andrew Ng在一次硅谷的論壇上透露,目前無(wú)人車還無(wú)法精確識(shí)別小范圍動(dòng)作,例如手指頭指揮車輛前進(jìn)還是后退。
2、sensor fusion & localization不管是激光、聲納還是雷達(dá)傳感器、傳回來(lái)的信號(hào)都是帶有大量的noise和不確定性的。如何過(guò)濾這些無(wú)用 信息,將客觀世界進(jìn)行3D甚至4D還原,就是sensor fusion和localization的這一步。
那么,如何在有大量noise的、不確定的情況下,去定位車的位置呢?
比較常用的方法有Particle Filter、 Kalman Filter等等。 從硬件的角度講,前些年,無(wú)人車主要使用雷達(dá)或者聲納作為傳感器,但最近比較流行的是LIDAR(light detection and ranging)系統(tǒng),就是用激光束在不同的時(shí)間和空間進(jìn)行照射,獲取信息。 激光的好處非常多,比如穿透率高、速度快、準(zhǔn)確率高。但激光系統(tǒng)普遍成本較高。如果無(wú)人車要量產(chǎn)的 話,激光系統(tǒng)昂貴的造價(jià)是一個(gè)阻礙。 那么LIDAR系統(tǒng)具體怎么運(yùn)作呢? 激光束打到物體上,形成反射的信號(hào),系統(tǒng)通過(guò)信號(hào)的距離和深度,形成一個(gè)個(gè)的數(shù)據(jù)點(diǎn)。
第一步,clustering。把點(diǎn)的外形和profile定義出來(lái);
第二步,用機(jī)器學(xué)習(xí)做classification,識(shí)別該物體到底是灌木叢、磚塊還是人;
第三步,modeling和prediction。理解和預(yù)測(cè)該物體的運(yùn)動(dòng)形態(tài)、速度和不確定性。 通過(guò)這些步驟,對(duì)外界環(huán)境進(jìn)行3D或者4D的還原。
3、motion planning and decision making Motion planning和decision making就是無(wú)人車的大腦,也是我博士期間主要的一個(gè)研究方向。
這一步就是在sensor fusion做完之后,在不確定的、動(dòng)態(tài)的環(huán)境下,如何讓無(wú)人車做出正確的判斷和計(jì)劃。比如 從A和B點(diǎn),全程100公里,如何確定遠(yuǎn)程、中程和近程計(jì)劃?
Motion Planning & Decision Making的難點(diǎn)主要在兩點(diǎn): 第一,運(yùn)算量非常大,search space指數(shù)型增長(zhǎng)。
舉一個(gè)簡(jiǎn)單的例子,一個(gè)10個(gè)關(guān)節(jié)的機(jī)器臂,每個(gè)關(guān)節(jié)都有180度的活動(dòng)空間,如果每一度都是一個(gè)自由度的,那這個(gè)復(fù)雜度呈指數(shù)級(jí)增長(zhǎng)的,高達(dá)180的10次方。從無(wú)人車實(shí)踐的角度講,這個(gè)復(fù)雜度會(huì)比機(jī)器 臂高很多, 尤其是在不確定未知環(huán)境下。
第二,不確定的因素很多,整個(gè)motion planning和搜索出來(lái)的結(jié)果,要不斷隨著你的信息的變化而變 化。 比如,在戰(zhàn)場(chǎng)上,某個(gè)作戰(zhàn)車輛要通過(guò)某個(gè)橋,按照GPS信號(hào)和地圖,這個(gè)橋是完好無(wú)損的,但車輛開(kāi)到 該地點(diǎn)的時(shí)候,發(fā)現(xiàn)橋被炸掉了,這時(shí)就需要快速的更新計(jì)劃。
或者,在高速上,無(wú)人車沿著一個(gè)車道行駛,突然發(fā)現(xiàn)有一頭鹿橫穿馬路。這時(shí)候,如何在毫秒級(jí)別的時(shí) 間里,把之前規(guī)劃的路線和速度,進(jìn)行最安全的調(diào)整。這是一個(gè)非常艱巨的也是非常關(guān)鍵的技術(shù)。
這里用到的主要技術(shù)有Incremental Search-Based algorithm,sampling based planning algorithm等等。
Incremental search based algorithm。在motion planning領(lǐng)域,主要指的就是如A*,D*,D* Lite, MT-D* Lite等算法。我和我導(dǎo)師之前在研究的moving target D* Lite,也屬于這一部分。這一算法就是解決在未知、不確定、動(dòng)態(tài)的環(huán)境下,如何從A點(diǎn)到達(dá)B點(diǎn)。從實(shí)現(xiàn)上,就是通過(guò)新的信息,更新search space,在更短的時(shí)間里,維持那些不需要更改的信息和計(jì)劃,只是局部的把那些危害到生命健康的計(jì)劃進(jìn) 行修改。
Sampling based planning algorithm(RRT sacrifice of optimality)。簡(jiǎn)單來(lái)講,這種算法就是通 過(guò)抽樣,把比較復(fù)雜的search space進(jìn)行簡(jiǎn)化,加快搜索和運(yùn)算的速度。但是這個(gè)算法的問(wèn)題是會(huì)犧牲最 優(yōu)性。 這兩種search都在不同的系統(tǒng)有應(yīng)用。 這里舉一個(gè)例子,講一講motion planning真正在現(xiàn)實(shí)中的應(yīng)用。無(wú)人車過(guò)去10年的應(yīng)用主要在軍方和航天上,比如說(shuō)火星探測(cè)器。
對(duì)于火星探測(cè)器來(lái)說(shuō),motion planning的算法面臨著兩個(gè)大問(wèn)題: 第一個(gè)是power of computing,要節(jié)能。在當(dāng)時(shí),節(jié)能這么重要主要是因?yàn)榛鹦翘綔y(cè)器的太陽(yáng)能板功能 比較弱。當(dāng)時(shí)只有在陽(yáng)光垂直照射,偏差不超過(guò)十幾度的情況下,火星探測(cè)器有足夠的功率前進(jìn)。
所以, 不可能把所有功率放在CPU上去運(yùn)算路徑,這個(gè)算法必須非常節(jié)能。 另一個(gè)是efficiency,運(yùn)算要快。火星地面不比城市路面,如果每次遇到什么情況的時(shí)候,比如有個(gè)坑、 大石頭之類的,火星車都要停下來(lái),運(yùn)算完了再走,那這個(gè)火星車運(yùn)行效率就太低了。 為了解決這兩個(gè)問(wèn)題,motion planning的算法也有了長(zhǎng)足的進(jìn)步。(NASA的火星探測(cè)器用的就是我導(dǎo)師寫(xiě)的D* Lite的優(yōu)化變種,加拿大宇航局的系統(tǒng)里也在使用過(guò)我和我導(dǎo)師研發(fā)的D* Lite, GAA* 的優(yōu)化版 本)
4、Control 和System Integration 如何在一個(gè)復(fù)雜的系統(tǒng)里,把各個(gè)元器件集成起來(lái),能夠和諧的工作,沿著規(guī)劃的路線、速度等進(jìn)行安全的行駛。
-
無(wú)人駕駛
+關(guān)注
關(guān)注
98文章
4016瀏覽量
120091
原文標(biāo)題:谷歌資深工程師:自動(dòng)駕駛汽車涉及哪些技術(shù)?
文章出處:【微信號(hào):IV_Technology,微信公眾號(hào):智車科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論