劍橋大學(xué)工程系團(tuán)隊(duì)創(chuàng)辦的Wayve憑借機(jī)器學(xué)習(xí)算法,只需要使用攝像頭和基本的衛(wèi)星導(dǎo)航就可以實(shí)現(xiàn)自動(dòng)駕駛汽車在陌生的道路上行駛。
自從2016年,英偉達(dá)公開(kāi)了用于自動(dòng)駕駛汽車的端到端深度學(xué)習(xí)技術(shù)之后,已經(jīng)有不計(jì)其數(shù)的公司、單位甚至愛(ài)好者用此技術(shù)做出自動(dòng)駕駛的demo。簡(jiǎn)單網(wǎng)絡(luò)結(jié)構(gòu),可以實(shí)現(xiàn)攝像頭輸入到剎車油門方向盤輸出的直接映射。然而這種低門檻也注定了它可以解決的問(wèn)題并不多,很難應(yīng)對(duì)具體駕駛環(huán)境上的復(fù)雜性。有專家甚至認(rèn)為端到端不適合開(kāi)發(fā)實(shí)用無(wú)人駕駛系統(tǒng),可以做demo,大規(guī)模商用可能非常困難。
端到端只配做demo嗎?由劍橋大學(xué)團(tuán)隊(duì)創(chuàng)辦的Wayve無(wú)人駕駛軟件公司卻不這么認(rèn)為。他們沒(méi)有用高精地圖,也沒(méi)有用激光雷達(dá)等昂貴的傳感器,當(dāng)然也沒(méi)有給汽車手工輸入規(guī)則,只訓(xùn)練20小時(shí)數(shù)據(jù),就可以在從未跑過(guò)的道路上駕駛。
Wayve 研發(fā)團(tuán)隊(duì)認(rèn)為既然是自動(dòng)駕駛,就不需要手工編碼一些規(guī)定,要充分的展現(xiàn)其智能的特性。團(tuán)隊(duì)采用了當(dāng)下大熱的深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)算法,建立了一個(gè)可以像人類一樣慢慢學(xué)習(xí)駕駛的自動(dòng)駕駛系統(tǒng)。
經(jīng)過(guò)探索、優(yōu)化和評(píng)估三個(gè)步驟進(jìn)行迭代,采用深度確定性策略梯度(Deep deterministic policy gradients,DDPG),來(lái)解決車道保持問(wèn)題。
現(xiàn)有技術(shù)的圖像分類體系結(jié)構(gòu)具有數(shù)百萬(wàn)個(gè)參數(shù),而Wayve團(tuán)隊(duì)的網(wǎng)絡(luò)構(gòu)架是一個(gè)深度網(wǎng)絡(luò),有4個(gè)卷積層和3個(gè)完全連接層,總共只有不到1萬(wàn)個(gè)參數(shù),所有處理都在汽車GPU上執(zhí)行。
在強(qiáng)化學(xué)習(xí)仿真測(cè)試中,通過(guò)隨機(jī)生成曲線車道,以及道路紋理和車道標(biāo)記,然后根據(jù)收集的數(shù)據(jù)優(yōu)化策略,再不斷重復(fù)。
結(jié)合了圖像翻譯和行為克隆的端到端零鏡頭框架
大多數(shù)自駕車公司使用模擬來(lái)驗(yàn)證他們的系統(tǒng),而Wayve讓自動(dòng)駕駛汽車在仿真中廣泛學(xué)習(xí)如何處理罕見(jiàn)的邊緣情況。Wayve訓(xùn)練汽車進(jìn)行模擬駕駛,并將學(xué)到的知識(shí)轉(zhuǎn)化到現(xiàn)實(shí)世界。
Wayve沒(méi)有將模擬和現(xiàn)實(shí)世界視為兩個(gè)不同的領(lǐng)域,而是設(shè)計(jì)了一個(gè)框架,將兩者結(jié)合起來(lái),既可以在模擬中訓(xùn)練轉(zhuǎn)向決策,又可以在現(xiàn)實(shí)世界中展現(xiàn)出類似的行為而無(wú)需進(jìn)行真正的演示。
Wayve的模型由一對(duì)最初用于圖像轉(zhuǎn)換的卷積變分自動(dòng)編碼器式的網(wǎng)絡(luò)組成,用于圖像翻譯,即無(wú)監(jiān)督圖像到圖像的翻譯網(wǎng)絡(luò)(Unsupervised Image-to-Image Translation Networks, UNIT))。在兩個(gè)域之間沒(méi)有任何已知的對(duì)齊或?qū)?yīng)關(guān)系的情況下,模型能夠在它們之間進(jìn)行轉(zhuǎn)換。下圖是一個(gè)捕捉場(chǎng)景主要布局的例子。值得注意的是,模擬器的視覺(jué)保真度在學(xué)習(xí)駕駛時(shí)并不是最重要的,他們的模擬世界就像卡通一樣,依舊可以很好的完成仿真模擬。Wayve研究稱,內(nèi)容保真度比視覺(jué)保真度更重要。但是,有效地模擬其他交通參與者的行為仍然是一個(gè)巨大的挑戰(zhàn)。
基于真實(shí)世界的駕駛數(shù)據(jù)和精心設(shè)計(jì)的邊緣案例來(lái)模擬場(chǎng)景
汽車由基于模型的深層強(qiáng)化學(xué)習(xí)系統(tǒng)驅(qū)動(dòng),該算法從離線收集的真實(shí)數(shù)據(jù)中學(xué)習(xí)預(yù)測(cè)模型。這讓模型學(xué)習(xí)并使用預(yù)測(cè)模型所想象的新場(chǎng)景數(shù)據(jù)來(lái)訓(xùn)練駕駛。
Wayve致力于開(kāi)發(fā)更豐富,更強(qiáng)大的時(shí)態(tài)預(yù)測(cè)模型,并相信這是構(gòu)建智能安全自動(dòng)駕駛汽車的關(guān)鍵。
目前,該系統(tǒng)已經(jīng)部署在 JaguarI-PACE 車上。這輛車贏得了2019年度歐洲年度車型的稱號(hào),未來(lái)將在整個(gè)英國(guó)和歐洲大陸收集數(shù)據(jù)。當(dāng)下,讓數(shù)據(jù)逐漸積累,其驅(qū)動(dòng)算法可能達(dá)到人類駕駛員質(zhì)量的95%,能夠處理交通燈,環(huán)形交叉路口,十字路口等。
盡管有人會(huì)覺(jué)得端到端的自動(dòng)駕駛系統(tǒng),既不聰明也不靈活,發(fā)生問(wèn)題難以解釋,然而Wayve在用其強(qiáng)大的算法證明這種深度學(xué)習(xí)的技術(shù)不只可以做demo,未來(lái)也可以保證安全,也可以商用。
審核編輯 黃昊宇
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
27839瀏覽量
204617 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
781文章
13449瀏覽量
165277
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論