12月30日,位于上海的特斯拉工廠將開(kāi)始交付Model 3。意味著,這家工廠將在開(kāi)工357天后開(kāi)始向客戶交付汽車,這將創(chuàng)下全球汽車制造商在華的新紀(jì)錄。
上海工廠是特斯拉全球計(jì)劃的一部分,目的是增強(qiáng)其在世界最大汽車市場(chǎng)的影響力,更重要的是本地化的工程研發(fā)團(tuán)隊(duì)也即將落地,目的之一就是適應(yīng)中國(guó)路況的自動(dòng)駕駛功能優(yōu)化。
?
目前,特斯拉在國(guó)內(nèi)的Autopilot版本更新一直落后于美國(guó)市場(chǎng)。而在今年9月,交通運(yùn)輸部部長(zhǎng)***會(huì)見(jiàn)特斯拉CEO馬斯克時(shí),雙方就自動(dòng)駕駛技術(shù)發(fā)展交換了意見(jiàn)。顯然,特斯拉在過(guò)去一年時(shí)間,已經(jīng)頻繁與中國(guó)的相關(guān)主管部門(mén)進(jìn)行各種溝通,這在過(guò)去是不常見(jiàn)的。
彼時(shí),交通運(yùn)輸部特別強(qiáng)調(diào)了歡迎包括特斯拉在內(nèi)的各國(guó)新能源汽車制造商、自動(dòng)駕駛研發(fā)機(jī)構(gòu)和企業(yè)與中國(guó)科研單位、企業(yè)加強(qiáng)技術(shù)交流和研發(fā)合作,不斷拓展合作范圍,共同推動(dòng)自動(dòng)駕駛技術(shù)落地。
而馬斯克表示,特斯拉愿與中方一道努力,持續(xù)加強(qiáng)在自動(dòng)駕駛技術(shù)研發(fā)、標(biāo)準(zhǔn)制定等方面的交流與合作,期待得到中國(guó)交通運(yùn)輸部的更多支持。
與此同時(shí),最快于明年部署全自動(dòng)駕駛系統(tǒng)的特斯拉,正在陸續(xù)披露一系列和自動(dòng)駕駛功能相關(guān)的技術(shù)細(xì)節(jié)。
一、全自動(dòng)駕駛底層技術(shù)陸續(xù)曝光
這其中,近日披露的一個(gè)專利對(duì)于其全球化部署意味深重。這個(gè)名為數(shù)據(jù)管道(data pipeline)和深度學(xué)習(xí)系統(tǒng)的專利,優(yōu)化了用于深度學(xué)習(xí)的圖像處理過(guò)程,除了車端深度學(xué)習(xí)的流程優(yōu)化之外,還特別提到了未來(lái)如何在全球市場(chǎng)共享數(shù)據(jù)。
按照專利的描述,從單一車輛上提取的圖像數(shù)據(jù)信息將與其他特斯拉用戶在全球范圍內(nèi)收集的數(shù)據(jù)進(jìn)行比較,一方面緩解駕駛員在自動(dòng)駕駛時(shí)系統(tǒng)可能執(zhí)行錯(cuò)誤過(guò)程的擔(dān)憂,同時(shí)在特斯拉自動(dòng)駕駛軟件穩(wěn)定版本的性能基礎(chǔ)上加以改進(jìn),而且改進(jìn)的過(guò)程比以前更有效率。
“通過(guò)這個(gè)過(guò)程,特斯拉能夠從車輛的攝像頭和傳感器捕捉的圖像中保持盡可能高的分辨率。這樣,神經(jīng)網(wǎng)絡(luò)就可以更有效地從它所接收的數(shù)據(jù)包中學(xué)習(xí)。這使得神經(jīng)網(wǎng)絡(luò)能夠以更有效的方式處理更好的圖像,從而為更快地改進(jìn)自動(dòng)駕駛技術(shù)打開(kāi)了大門(mén)?!?/p>
而特斯拉的新數(shù)據(jù)管道和深度學(xué)習(xí)專利為更快的自動(dòng)駕駛改進(jìn)鋪平了道路。這項(xiàng)新專利,意味著特斯拉的數(shù)據(jù)傳輸管道可能是業(yè)內(nèi)最大的之一,因?yàn)樗鼜臄?shù)十萬(wàn)輛配備了大量傳感器的汽車中提取數(shù)據(jù)。
在應(yīng)用中,特斯拉解釋了其系統(tǒng)正在解決的問(wèn)題:
用于實(shí)現(xiàn)自動(dòng)駕駛的深度學(xué)習(xí)系統(tǒng)通常依靠捕獲的傳感器數(shù)據(jù)作為輸入。在傳統(tǒng)的學(xué)習(xí)系統(tǒng)中,通過(guò)將捕獲的傳感器數(shù)據(jù)從傳感器格式轉(zhuǎn)換為與學(xué)習(xí)系統(tǒng)的初始輸入層兼容的格式,使捕獲的傳感器數(shù)據(jù)與深度學(xué)習(xí)系統(tǒng)兼容。
這種轉(zhuǎn)換可能包括壓縮和下采樣,從而降低原始傳感器數(shù)據(jù)的信號(hào)保真度。此外,更換傳感器可能需要一個(gè)新的轉(zhuǎn)換過(guò)程。因此,需要一種定制的數(shù)據(jù)管道,可以最大限度地從捕獲的傳感器數(shù)據(jù)中獲取信號(hào)信息,為深度學(xué)習(xí)網(wǎng)絡(luò)提供更高層次的信號(hào)信息,進(jìn)行深度學(xué)習(xí)分析。
特斯拉在專利申請(qǐng)中描述了它的解決方案:
本發(fā)明公開(kāi)了一種數(shù)據(jù)管道,該數(shù)據(jù)管道將傳感器數(shù)據(jù)作為獨(dú)立組件提取并提供給用于自動(dòng)駕駛的深度學(xué)習(xí)網(wǎng)絡(luò)。在一些實(shí)施例中,使用深度學(xué)習(xí)網(wǎng)絡(luò)和從傳感器接收的輸入數(shù)據(jù)實(shí)現(xiàn)自動(dòng)駕駛。
例如,安裝在車輛上的傳感器將車輛周圍環(huán)境的實(shí)時(shí)傳感器數(shù)據(jù)(如視覺(jué)、雷達(dá)和超聲波數(shù)據(jù))提供給神經(jīng)網(wǎng)絡(luò),用于確定車輛控制響應(yīng)。
在一些實(shí)施例中,網(wǎng)絡(luò)使用多層實(shí)現(xiàn)。根據(jù)傳感器數(shù)據(jù)的信號(hào)信息,將傳感器數(shù)據(jù)提取為兩個(gè)或多個(gè)不同的數(shù)據(jù)組件。例如,特征或邊緣數(shù)據(jù)可以從全局?jǐn)?shù)據(jù)中分離出來(lái),提取到不同的數(shù)據(jù)組件中。
而不同的數(shù)據(jù)組件保留了目標(biāo)相關(guān)的數(shù)據(jù),例如,數(shù)據(jù)最終會(huì)被深度學(xué)習(xí)網(wǎng)絡(luò)用來(lái)識(shí)別邊緣和其他特征。在一些實(shí)施例中,不同的數(shù)據(jù)組件作為存儲(chǔ)與識(shí)別特定目標(biāo)功能高度相關(guān)的數(shù)據(jù)的容器,但它們本身并不識(shí)別或檢測(cè)功能。
不同的數(shù)據(jù)組件提取數(shù)據(jù),以確保在機(jī)器學(xué)習(xí)網(wǎng)絡(luò)的適當(dāng)階段進(jìn)行準(zhǔn)確的特征檢測(cè)。在某些實(shí)施例中,可以對(duì)不同的數(shù)據(jù)組件進(jìn)行預(yù)處理,以增強(qiáng)其包含的特定信號(hào)信息??梢詫?duì)數(shù)據(jù)組件進(jìn)行壓縮或下采樣,以提高資源和計(jì)算效率。然后在系統(tǒng)的不同層將不同的數(shù)據(jù)組件提供給深度學(xué)習(xí)系統(tǒng)。
深度學(xué)習(xí)網(wǎng)絡(luò)能夠利用提取過(guò)程中保留的信號(hào)信息作為輸入,準(zhǔn)確地識(shí)別和檢測(cè)與數(shù)據(jù)組件的目標(biāo)數(shù)據(jù)(如邊緣、對(duì)象等)相關(guān)的特征。
例如,將特征和邊緣數(shù)據(jù)提供給網(wǎng)絡(luò)的第一層,將全局光照數(shù)據(jù)提供給網(wǎng)絡(luò)的后一層。通過(guò)提取不同的數(shù)據(jù)組件,每個(gè)組件保留各自的目標(biāo)信號(hào)信息,網(wǎng)絡(luò)可以更有效地處理傳感器數(shù)據(jù)。
同時(shí),不再接收傳感器數(shù)據(jù)作為網(wǎng)絡(luò)的初始輸入,而是在網(wǎng)絡(luò)的最適當(dāng)層向網(wǎng)絡(luò)提供最有用的信息。在一些實(shí)施例中,由于不同的數(shù)據(jù)組件可以充分利用其各自組件的圖像分辨率來(lái)實(shí)現(xiàn)其預(yù)期目的,因此網(wǎng)絡(luò)將分析捕獲的傳感器數(shù)據(jù)的更完整版本。
例如,特征和邊緣的輸入可以利用特征和邊緣數(shù)據(jù)的整個(gè)分辨率、位范圍和位深度,而全局光照的輸入可以利用全局光照數(shù)據(jù)的整個(gè)分辨率、位范圍和位深度。
有趣的是,專利中列出的三位工程師中的兩位已經(jīng)不在特斯拉工作了。至于剩下這位工程師是否還在特斯拉尚不清楚。這至少說(shuō)明此項(xiàng)專利已經(jīng)在內(nèi)部應(yīng)用較長(zhǎng)時(shí)間。
二、實(shí)際行駛數(shù)據(jù)+深度學(xué)習(xí)+OTA
一直以來(lái),特斯拉的神經(jīng)網(wǎng)絡(luò)接受大量真實(shí)數(shù)據(jù)的訓(xùn)練,這些數(shù)據(jù)是從用戶實(shí)際行駛收集來(lái)的。目前,所有的特斯拉車型都配備了某種版本的Autopilot,累計(jì)總共行駛了大約20億英里。
當(dāng)特斯拉為Autopilot添加一個(gè)新功能時(shí),它首先會(huì)向一小群“early access”用戶進(jìn)行部署。從他們的車中記錄的數(shù)據(jù)然后被用來(lái)完善功能,隨后用戶群被擴(kuò)大,然后更多的完善。一開(kāi)始看起來(lái)粗糙和不可靠的新功能可以在幾周內(nèi)改變。
更讓人驚訝的是,在今年彭博社的一次用戶調(diào)查中,特斯拉車主在很大程度上支持馬斯克的做法,即使自動(dòng)駕駛偶爾會(huì)出問(wèn)題。
以最新發(fā)布的智能召喚(也可以理解為L(zhǎng)4的自主泊車)為例,盡管網(wǎng)絡(luò)上不少功能出故障的視頻,但調(diào)查結(jié)果顯示,高達(dá)70%的車主認(rèn)可該功能。不過(guò),一些安全倡導(dǎo)者批評(píng)特斯拉把客戶當(dāng)作實(shí)驗(yàn)品。
馬斯克表示,現(xiàn)實(shí)世界的訓(xùn)練(提升自動(dòng)駕駛功能)是減少車禍的最快途徑,也可能是唯一途徑。至少對(duì)于智能召喚來(lái)說(shuō),錯(cuò)誤發(fā)生在停車場(chǎng)(低速),并且不太可能造成嚴(yán)重的傷害。
智能召喚是特斯拉實(shí)現(xiàn)自動(dòng)駕駛的高頻場(chǎng)景之一,停車場(chǎng)對(duì)自動(dòng)駕駛來(lái)說(shuō)是出了名的難。一方面,不在道路法規(guī)管轄范圍內(nèi);另一方面,不同停車場(chǎng)的標(biāo)記線、行駛路線不規(guī)則以及車流、人流混雜。
智能召喚需要對(duì)人類行為有深刻的理解。在智能召喚發(fā)布后的第一個(gè)月里,特斯拉車主們使用了100多萬(wàn)次。馬斯克表示,這將有助于“讓我們能夠檢查這些角落里的情況,并從中進(jìn)行快速學(xué)習(xí)”。
看看用戶的真實(shí)評(píng)論,或許你更能明白其中的道理。
“雖然這款軟件目前還處于測(cè)試階段,但在駕駛員的監(jiān)督下使用已經(jīng)足夠了。這是完全自動(dòng)駕駛的先驅(qū),隨著時(shí)間的推移,它會(huì)變得更加可靠,就像Autopilot一樣?!北M管我們經(jīng)常會(huì)在網(wǎng)絡(luò)上看到一些車主對(duì)功能的濫用,但實(shí)際上大多是特斯拉車主仍然非常謹(jǐn)慎使用,并且期待功能的不斷完善。
作為軟件定義汽車最典型的代表,自動(dòng)駕駛的真正商業(yè)化,應(yīng)該是在車企、用戶及系統(tǒng)之間形成一個(gè)真正的閉環(huán),從而基于真正有效的數(shù)據(jù)來(lái)反哺系統(tǒng)的不斷自我學(xué)習(xí)。
這或許也能解釋,為什么今年特斯拉收購(gòu)了計(jì)算機(jī)視覺(jué)初創(chuàng)公司DeepScale。后者有一項(xiàng)名為SqueezeNet的解決方案,可以實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)在更小的設(shè)備上工作,并且允許以超高效的方式處理大量數(shù)據(jù)。
這在全自動(dòng)駕駛時(shí)代尤其重要,因?yàn)橄到y(tǒng)從車輛的多傳感器中收集了大量數(shù)據(jù)。特斯拉基于自主研發(fā)的FSD芯片,基于DeepScale的技術(shù)幫助更好地優(yōu)化硬件、數(shù)據(jù)處理和深度學(xué)習(xí),而無(wú)線更新(OTA)則是一個(gè)高效的解決方案為系統(tǒng)不斷迭代提供助力。
然而,今天典型的CNN/DNN模型的空中更新需要大量的數(shù)據(jù)傳輸。DeepScale的另一項(xiàng)核心技術(shù)就是保證更小的模型需要更少的通信,使得頻繁的更新更加可行。
這包括較小的卷積神經(jīng)網(wǎng)絡(luò)(CNNs)在分布式訓(xùn)練中需要較少的服務(wù)器間通信;更小的CNNs需要更少的帶寬將新模型從云端導(dǎo)出到自動(dòng)駕駛汽車上;較小的CNNs更適合部署在內(nèi)存有限的FPGAs和其他硬件上。
使用SqueezeNet,可以實(shí)現(xiàn)與AlexNet相比模型尺寸減少50倍,同時(shí)達(dá)到或超過(guò)了AlexNet的top 1和top 5的精度。模型的縮減量遠(yuǎn)高于SVD、網(wǎng)絡(luò)裁剪和深度壓縮。
同時(shí),應(yīng)用8位量化的深度壓縮,SqueezeNet得到一個(gè)0.66MB的模型(比32位的AlexNet小363×),與AlexNet的精度相當(dāng)。此外,在SqueezeNet上采用6位量化和33%稀疏的深度壓縮,可以得到一個(gè)0.47MB的模型(比32位AlexNet小510×),并且具有同等的精度。
有趣的是,DeepScale的第一款產(chǎn)品是一款名為Carver21的感知軟件,專門(mén)用來(lái)優(yōu)化自動(dòng)駕駛汽車前置攝像頭的數(shù)據(jù)處理。這與一直堅(jiān)持視覺(jué)優(yōu)先的特斯拉非常匹配,同時(shí)其也擁有道路上最大的聯(lián)網(wǎng)車隊(duì),大量的真實(shí)數(shù)據(jù)對(duì)于DeepScale也是最佳的實(shí)踐。
這就是DeepScale的SqueezeNet發(fā)揮作用的地方。由于其精確度與最先進(jìn)的神經(jīng)網(wǎng)絡(luò)相匹配,因此能夠?qū)ι窠?jīng)網(wǎng)絡(luò)進(jìn)行有效的訓(xùn)練,并保證神經(jīng)網(wǎng)絡(luò)模型的最小化,并且保證硬件上的可用資源進(jìn)行速度-精度的權(quán)衡。
DeepScale的全棧深度學(xué)習(xí)方法使人工智能軟件與各種處理器和傳感器緊密集成,實(shí)現(xiàn)可定制的自動(dòng)駕駛功能。模塊負(fù)責(zé)從訓(xùn)練、開(kāi)發(fā)、部署,甚至數(shù)據(jù)收集/管理的每一個(gè)方面。
實(shí)時(shí)決策對(duì)任何無(wú)人駕駛汽車都至關(guān)重要。能夠在集中式的高計(jì)算環(huán)境中部署更多具有更高精度的深度學(xué)習(xí)功能是任何自動(dòng)駕駛汽車制造商所希望的。而且,在這么小的計(jì)算空間里部署多個(gè)DNN正是DeepScale的解決方案非常適合特斯拉的原因。
而隨著特斯拉的車隊(duì)(搭載Autopilot)增加到100萬(wàn)輛,它的月行駛里程將達(dá)到10億英里左右(相當(dāng)于之前一年的數(shù)據(jù)),比Waymo的月行駛里程約100萬(wàn)英里高出1000倍。這意味著特斯拉具有從0.001%的里程中收集大量邊緣訓(xùn)練樣本的機(jī)會(huì)。
評(píng)論
查看更多