0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

針對智能駕駛應用,深度學習應該如何落地呢?

高工智能汽車 ? 來源:未知 ? 作者:李倩 ? 2018-07-03 16:53 ? 次閱讀

本文由前向啟創(chuàng)&CTO張暉介紹了前向啟創(chuàng)在TI TDA芯片上,使用深度學習方法,解決智能駕駛感知問題的一些經(jīng)驗。

深度學習以其強大的特征表示能力,已經(jīng)在許多應用領域中體現(xiàn)出了不俗的性能。而針對智能駕駛應用,深度學習應該如何落地呢?

前向啟創(chuàng)&CTO張暉認為,主要存在有兩大技術挑戰(zhàn):一是主芯片的選型,二則是針對特定芯片的深度學習算法的設計與實現(xiàn)。

前向啟創(chuàng)&CTO張暉,2004年畢業(yè)于華中科技大學,獲雙學士學位;2004-2005年就職于美國安凱微電子,任算法工程師;005-2013年就職于美國ZORAN(CSR/Qualcomm)公司,任算法研發(fā)經(jīng)理;近15年算法芯片化與產(chǎn)品化經(jīng)驗;在ACCV、ICPR等國際會議上發(fā)表學術論文多篇;擁有多項中美發(fā)明專利。

TI智能駕駛ASIC

針對智能駕駛產(chǎn)品主處理器芯片進行選型,應該將汽車智能駕駛產(chǎn)品的主要訴求——高可靠性與低成本,作為主要參考依據(jù)。

從業(yè)界角度來看,智能駕駛主芯片可分兩大流派,一派為ASIC,將特定的算法計算引擎芯片化,代表企業(yè)有如TI、Mobileye、nVidia、Ambarella等;另一派則為FPGA,代表企業(yè)有如Xilinx,Altera等。

而ASIC以其定制性,在成本、功耗、算力、彈性、車規(guī)、功能安全等級以及量產(chǎn)周期上達到了更好的平衡。

TI(Texas Instuments)自2010年起開始提供針對智能駕駛的ASIC芯片TDA(TIDriverAssist)系列,至今已經(jīng)迭代到了第四代。

經(jīng)過多年的演進,TI已經(jīng)將多項針對智能駕駛的算法逐步芯片化、引擎化,其功能安全等級,也達到了ASIL-C級。

TI的ASIC芯片TDA(TIDriverAssist)系列

TI的智能駕駛芯片以其優(yōu)異的性價比,已被全球超過15家Tier1、25家OEM主機廠所采用,成功在近100款車型中量產(chǎn),已累積出貨近4千萬片。目前前向啟創(chuàng)也采用TI ASIC芯片。

深度網(wǎng)絡設計

網(wǎng)絡模型設計是深度學習應用的關鍵,如何設計一個能滿足產(chǎn)品化要求的智能駕駛感知網(wǎng)絡呢?

張暉認為,主要存在著兩大關鍵點,第一需要貼近任務和系統(tǒng)需求,即必須針對智能駕駛系統(tǒng)應用對感知層的需求來進行網(wǎng)絡設計,切不可為了使用深度學習而選擇深度神經(jīng)網(wǎng)絡

第二需要考慮到芯片嵌入式平臺算力受限系統(tǒng),必須因芯設計,切不可盲目的進行網(wǎng)絡堆砌,導致運算量過大,而造成無法部署到芯片上的問題。

從智能駕駛的任務來看,Level2–Level3系統(tǒng)對感知提出了更高的要求,例如AEB-Cross需要檢測車輛側面狀態(tài),TJA(TrafficJamAssistance)更需要識別出可通行區(qū)域,即FreeSpace,等等。

針對車輛側面檢測,前向啟創(chuàng)重新設計了一套FINet網(wǎng)絡,將傳統(tǒng)的2D-BoundingBox擴展到了3D-BoundingBox,可以對車輛的多個表面進行檢測。

前向啟創(chuàng)針對車輛側面檢測設計的FINet網(wǎng)絡

而針對FreeSpace任務,前向啟創(chuàng)重新設計了的FINet可將此任務分解為,對Flat平坦可通行區(qū)域;Step路沿臺階;以及Obstacle障礙物三大類目標進行分割。

前向啟創(chuàng)針對FreeSpace任務,F(xiàn)INet分解為三大類目標

深度網(wǎng)絡優(yōu)化

常見的深度學習網(wǎng)絡都對主芯片的算力提出了比較高的要求。

常見網(wǎng)絡在對720P@30fps圖像進行推理時,對算力的要求

由上圖可看出,大部分網(wǎng)絡對算力的要求超過了1Tops,而類似TITDA2x這類低功耗芯片目前達不到1Tops算力要求。所以在網(wǎng)絡基礎模型設計好后,為了大幅降低模型的GMACS以適應算力受限的芯片平臺,就需要針對芯片進行網(wǎng)絡的細調(diào)整(FineTuning)及優(yōu)化。

針對TIASIC的芯片架構,前向啟創(chuàng)主要采用了兩大方法進行網(wǎng)絡優(yōu)化,第一卷積稀疏化,第二8-BIT量化技術。

第一,卷積稀疏化方法是通過調(diào)整損失函數(shù),對權重小于動態(tài)閾值的卷積核中的系數(shù)進行歸零處理,再將此稀疏度的張量重新進行調(diào)優(yōu)訓練,對已歸零處理后的系數(shù)不再進行反向傳播更新,最后以達到在保證稀疏度的情況下,訓練精度沒有明顯的下降。

兩種不同稀疏度的目標函數(shù)下,通過調(diào)優(yōu)訓練出來的濾波器的核

第二,動態(tài)8-BIT量化技術,動態(tài)指的是在8-BIT的最大位寬的前提下,盡量高地提高張量的量化精度,即有符號與否,定標值是多少,都隨張量的范圍而進行動態(tài)調(diào)整。

在完成以上兩步優(yōu)化后,前向啟創(chuàng)的FINet網(wǎng)絡在精度下降不到1%的情況下,整體提速了近10倍。

芯片級部署與實現(xiàn)

針對智能駕駛應用,TI的TDA系列芯片采用了多核異構的芯片架構來達到算力與功耗平衡,而其中的子處理器是可配置的,如DSP和EVE等子處理器單元數(shù)可以選擇,以求針對系統(tǒng)要求,達到更合適的性價比。

整體芯片架構如圖所示

多核異構架構的最大優(yōu)點就是能夠?qū)⒉煌愋偷挠嬎慊蚩刂迫蝿债惡嘶?,TITDA系列芯片的設計初衷中,視覺感知的中低層計算任務主要被集中到了DSP和EVE這兩類子處理器上:

TITDA系列芯片的設計

EVE作為TI針對智能駕駛應用而專門設計的向量硬件加速器,在同等功耗下,相比于現(xiàn)有其它智能駕駛芯片,每個EVE核能夠達到8倍的計算性能的提升。

每個EVE核能夠達到8倍的計算性能的提升

針對深度神經(jīng)網(wǎng)絡中最耗時的卷積運算部分,在部署階段,前向啟創(chuàng)主要使用了其中的EVE核來進行計算,利用EVE中的SIMD特性,可以將FINet中的卷積運算部分提速8倍左右。

完成在TI芯片上的部署后,前向啟創(chuàng)FINet網(wǎng)絡整體上能夠達到實時感知的系統(tǒng)性能要求。

在TITDA這類成熟的ASIC上,通過網(wǎng)絡設計、網(wǎng)絡優(yōu)化以及芯片部署這三大步,就能基本實現(xiàn)深度神經(jīng)網(wǎng)絡的初步框架。

在后續(xù)的產(chǎn)品化過程中,還需根據(jù)實際的系統(tǒng)需求,對這三步進行閉環(huán)式的迭代,以求達到系統(tǒng)性能與算力的最佳平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:智能駕駛感知產(chǎn)品化:基于TI ASIC深度神經(jīng)網(wǎng)絡的設計與實現(xiàn) | GGAI經(jīng)驗談

文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Nanopi深度學習之路(1)深度學習框架分析

    學習,也就是現(xiàn)在最流行的深度學習領域,關注論壇的朋友應該看到了,開發(fā)板試用活動中有【NanoPi K1 Plus試用】的申請,介紹中NanopiK1plus的高大上優(yōu)點之一就是“可運行
    發(fā)表于 06-04 22:32

    百度深度學習研究院科學家深度講解人工智能

    的研發(fā)經(jīng)驗。在過去的工作中,他發(fā)表過論文十余篇,申請中國專利超過100項,其中已經(jīng)授權的有95項。他曾任職百度深度學習研究院,負責人臉識別方向,曾經(jīng)多次帶領團隊在主流的人臉檢測、人臉識別競賽上取得
    發(fā)表于 07-19 10:01

      華為云深度學習服務,讓企業(yè)智能從此不求人

    深度學習服務的發(fā)布,大幅降低了企業(yè)深度學習訓練的技術門檻、性能門檻和數(shù)據(jù)量門檻,因此,華為云深度學習
    發(fā)表于 08-02 20:44

    硅谷組建團隊、L3產(chǎn)品落地,想法多多的騰訊自動駕駛

    `日前有消息顯示,騰訊在領英發(fā)布招聘廣告,表示其在加利福尼亞州帕洛阿爾托的汽車駕駛研發(fā)團隊需要招聘至少九類工程師職位,其中包括移動規(guī)劃,傳感器匯合,車輛智能和機器學習等方面。根據(jù)公開信息顯示,這些
    發(fā)表于 11-13 11:33

    人工智能、數(shù)據(jù)挖掘、機器學習深度學習的關系

    人工智能、數(shù)據(jù)挖掘、機器學習深度學習之間,主要有什么關系?
    發(fā)表于 03-16 11:35

    深度學習是什么

    創(chuàng)客們的最酷“玩具”  智能無人機、自主機器人、智能攝像機、自動駕駛……今年最令硬件創(chuàng)客們著迷的詞匯,想必就是這些一線“網(wǎng)紅”了。而這些網(wǎng)紅的背后,幾乎都和計算機視覺與深度
    發(fā)表于 07-19 06:17

    智能駕駛的狂想與現(xiàn)實落地 精選資料分享

    編輯導讀:隨著人工智能的技術發(fā)展,很多領域開始了革命式創(chuàng)新,智能駕駛就是其中的一個典型代表。本篇文章中作者介紹了智能駕駛的發(fā)展歷程以及行業(yè)現(xiàn)
    發(fā)表于 07-27 07:45

    智能駕駛域控制器的SoC芯片選型

    1、智能駕駛域控制器的SoC芯片選型隨著智能駕駛行業(yè)的發(fā)展,智能駕駛功能日益復雜,領航高速輔助、
    發(fā)表于 08-11 15:55

    人工智能深度學習未來應該如何發(fā)展的詳細概述

    深度學習從12、13年甚囂塵上,到如今的塵埃落地,浪潮一再的退去。面對疲軟的風口,養(yǎng)肥的豬,人工智能將何去何從?
    的頭像 發(fā)表于 06-02 10:00 ?4064次閱讀
    人工<b class='flag-5'>智能</b><b class='flag-5'>深度</b><b class='flag-5'>學習</b>未來<b class='flag-5'>應該</b>如何發(fā)展的詳細概述

    探討深度學習在自動駕駛中的應用

    深度強化學習的理論、自動駕駛技術的現(xiàn)狀以及問題、深度強化學習在自動駕駛技術當中的應用及基于
    的頭像 發(fā)表于 08-18 10:19 ?5112次閱讀

    基于魔視智能先進的嵌入式深度學習技術的輔助自動駕駛產(chǎn)品正式量產(chǎn)落地

    深度學習有效的推動了人工智能技術飛躍,但是算法復雜性對于芯片算力的依賴始終困擾著整車產(chǎn)品工程。如何在低成本低功耗的硬件芯片局限下實現(xiàn)高度智能和實時的復雜神經(jīng)網(wǎng)絡,一直是困擾人工
    的頭像 發(fā)表于 10-18 17:12 ?3466次閱讀

    深度學習技術與自動駕駛設計的結合

    在過去的十年里,自動駕駛汽車技術取得了越來越快的進步,主要得益于深度學習和人工智能領域的進步。作者就自動駕駛中使用的
    發(fā)表于 10-28 16:07 ?1993次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>技術與自動<b class='flag-5'>駕駛</b>設計的結合

    深度學習:搜索和推薦中的深度匹配問題

    深度匹配問題,非常solid的綜述,針對里面的一些方法,尤其是feature-based的深度學習方法增加了近期一些相關paper。推薦系統(tǒng)和搜索
    的頭像 發(fā)表于 11-05 09:47 ?4044次閱讀

    深度學習算法在自動駕駛規(guī)控中的應用解讀

    雖然目前公開的自動駕駛規(guī)控算法相關資料大都是針對基于規(guī)則的算法的,但筆者打開招聘軟件卻經(jīng)常能看到自動駕駛企業(yè)招聘規(guī)控算法工程師時會要求候選人懂深度
    的頭像 發(fā)表于 11-16 09:57 ?1149次閱讀

    深度學習在自動駕駛中的關鍵技術

    隨著人工智能技術的飛速發(fā)展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。在自動駕駛系統(tǒng)中,深度學習技術發(fā)揮著至關重要的作用。它通過模擬人
    的頭像 發(fā)表于 07-01 11:40 ?630次閱讀