4月18日消息,據外媒報道,特斯拉收購計算機視覺初創(chuàng)公司DeepScale的交易開始收獲回報,通過收購完整團隊開始為這家電動汽車制造商提供新的專利。
2019年年底,有消息稱特斯拉收購了位于舊金山灣區(qū)的初創(chuàng)公司DeepScale,該公司專注于開發(fā)自動駕駛汽車的“深度神經網絡”,收購金額未披露。DeepScale專注于計算節(jié)能的深度學習系統(tǒng),這也是特斯拉關注的重點領域,特斯拉決定設計自己的電腦芯片來驅動自動駕駛軟件。有猜測稱,特斯拉收購這個團隊是為了加速其機器學習的發(fā)展。
現在,特斯拉公布了名為“用擴充數據訓練機器模型的系統(tǒng)和方法”的新專利,我們也看到了這筆收購帶來的成果。這項專利的發(fā)明者包括DeepScale的三名成員,分別是馬修·庫珀(Matthew Cooper)、帕拉斯·賈因(Paras Jain)和哈西姆蘭·辛格·西杜(Harsimran Singh Sidhu)。
目前在特斯拉旗下工作的DeepScale團隊正在嘗試申請的這個系統(tǒng),它與利用幾個不同傳感器觀測場景的數據來訓練神經網絡有關,比如特斯拉司機輔助駕駛系統(tǒng)Autopilot傳感器陣列中的八個攝像頭。
特斯拉在專利申請中描述了這種情況的困難:“在典型的機器學習應用中,數據可以通過多種方式進行擴充,以避免過度擬合用于獲取訓練數據的捕獲設備的特征模型。例如,在用于訓練計算機模型的典型圖像集中,圖像可能代表許多不同捕獲環(huán)境的對象,這些環(huán)境具有與被捕獲對象相關的不同傳感器特征。例如,這樣的圖像可以通過不同的傳感器特性來捕獲,就像不同的尺度、焦距、鏡頭類型、預處理或后處理、軟件環(huán)境以及傳感器陣列硬件等等。這些傳感器在不同的外部參數方面也可能有所不同,例如成像傳感器的位置和方向相對于捕獲圖像時的環(huán)境。所有這些不同類型的傳感器特性都會導致所捕獲的圖像在圖像集中呈現不同的形式,使正確地訓練計算機模型變得更加困難。”
對此,特斯拉團隊總結了他們應對這個問題的解決方案:
第一個部分是用于訓練預測計算機模型一組參數的方法。該實施例可以包括:1)識別由一組攝像頭捕獲的圖像,該圖像被附加到一個或多個圖像收集系統(tǒng)中;2)對于圖像集合中的每一幅圖像,識別該圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下特定步驟生成增強圖像:通過用維護圖像的攝像頭屬性的圖像操縱功能修改圖像來為該組圖像生成增強圖像,并將該增強訓練圖像與該圖像的訓練輸出相關聯;4)訓練預測計算機模型的該組參數以基于包括該圖像和該組增強圖像的圖像訓練集來預測訓練輸出。
第二部分包括具有一個或多個處理器和存儲指令的非暫時性計算機存儲介質系統(tǒng),該指令在由一個或多個處理器執(zhí)行時,會使處理器執(zhí)行相關操作,這些操作包括:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像采集系統(tǒng)的圖像集合;2)對于所述圖像集合中的每幅圖像,識別圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強圖像:通過用維護圖像的攝像頭屬性的圖像處理函數修改圖像來為該組圖像生成增強圖像,并將該增強訓練圖像與該圖像的訓練輸出相關聯;4)訓練預測計算機模型的參數集來預測基于圖像訓練集的訓練輸出,包括圖像和增強圖像集。
第三部分包括具有供處理器執(zhí)行指令的非暫時性計算機可讀介質,該指令在由處理器執(zhí)行時使得處理器能夠:1)識別由一組攝像頭捕獲的、同時附著到一個或多個圖像采集系統(tǒng)的一組圖像;2)對于該組圖像中的每幅圖像,識別該圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過以下步驟為一組圖像生成增強圖像:通過用維持圖像的攝像頭屬性的圖像操作功能修改圖像來為一組圖像生成增強圖像,并將增強的訓練圖像與圖像的訓練輸出相關聯;4)訓練計算機模型以學習基于包括圖像和該組增強圖像的圖像訓練集來預測訓練輸出。
正如之前報道的那樣,特斯拉正在經歷“對特斯拉Autopilot的重大基礎性重寫”。作為重寫的一部分,首席執(zhí)行官埃隆·馬斯克(Elon Musk)表示:“神經網絡正在吸收越來越多的問題?!?/p>
新專利中還將包括一個標簽系統(tǒng),馬斯克稱3D標簽將改變游戲規(guī)則:汽車進入有八個攝像頭的場景,畫一條路,然后你可以用3D標記那條路。這種用多個攝像頭訓練機器學習系統(tǒng)的新方法,就像特斯拉的Autopilot一樣,帶有附加數據,可以成為Autopilot更新的一部分。
-
特斯拉
+關注
關注
66文章
6287瀏覽量
126413 -
機器學習
+關注
關注
66文章
8353瀏覽量
132315
發(fā)布評論請先 登錄
相關推薦
評論