昨天,深耕人工智能加速器領(lǐng)域的 Imagination Technologies帶來(lái)了一款瞄準(zhǔn)ADAS的神器----多核IMG Series4 NNA,號(hào)稱(chēng)為ADAS而生的終極AI加速器!其多核算力可以高達(dá)600 TOPS!而且,它不止可以應(yīng)用在ADAS領(lǐng)域還可以應(yīng)用到更多領(lǐng)域!牛!
“汽車(chē)行業(yè)正處于變革的風(fēng)口浪尖,自動(dòng)駕駛汽車(chē)和自動(dòng)駕駛出租車(chē)等新的應(yīng)用場(chǎng)景對(duì)人工智能(AI)的性能水平提出了更高的要求,它們需要高的算力,為此,Imagination已經(jīng)與汽車(chē)行業(yè)和其他重視功能安全的行業(yè)中的領(lǐng)先企業(yè)和創(chuàng)新者展開(kāi)了合作。Series4剛一推出就獲得了業(yè)界的認(rèn)可,已經(jīng)有多家公司授權(quán)該IP?!盜magination Technologies產(chǎn)品管理部門(mén)總監(jiān)Gilberto Rodriguez在發(fā)布會(huì)上指出,“Series4 NNA擁有全新的多核架構(gòu),可提供600 TOPS(每秒萬(wàn)億次操作)甚至更高的超高性能,并且可為大型神經(jīng)網(wǎng)絡(luò)工作負(fù)載提供低帶寬和極低的延遲?!?/p>
對(duì)于汽車(chē)自動(dòng)駕駛,要實(shí)現(xiàn)更高級(jí)的功能必須有強(qiáng)大的算力做保障,ABI Research智慧出行和汽車(chē)首席分析師James Hodgson表示預(yù)計(jì)到2027年左右,對(duì)ADAS的需求將增長(zhǎng)兩倍,但汽車(chē)從L2和L3級(jí)ADAS向L4和L5級(jí)全自動(dòng)駕駛演進(jìn)的過(guò)程中,神經(jīng)網(wǎng)絡(luò)的廣泛應(yīng)用將是至關(guān)重要的因素。這些系統(tǒng)將要處理數(shù)以百計(jì)的復(fù)雜場(chǎng)景,從多個(gè)攝像頭和激光雷達(dá)等大量傳感器中提取數(shù)據(jù),從多個(gè)攝像頭和激光雷達(dá)等大量傳感器中提取數(shù)據(jù),從而實(shí)現(xiàn)自動(dòng)代客泊車(chē)、十字路口管理和復(fù)雜城市環(huán)境安全導(dǎo)航等解決方案。而高性能、低延遲和高能效的結(jié)合將是實(shí)現(xiàn)高度自動(dòng)駕駛的關(guān)鍵所在。 據(jù)Gilberto 介紹,Imagination自從2017年在業(yè)界率先推出NNA神經(jīng)網(wǎng)絡(luò)加速器以后,至今已經(jīng)是第三代產(chǎn)品,第一代第二代瞄準(zhǔn)安防、消費(fèi)電子等領(lǐng)域,已經(jīng)獲得很多公司的采用,對(duì)于NNA的未來(lái)規(guī)劃,Imagination一直在考慮如何可以執(zhí)行完整的網(wǎng)絡(luò)推理的同時(shí)滿(mǎn)足功能安全要求。Series4 NNA針對(duì)明確的場(chǎng)景需求,在內(nèi)核架構(gòu)上做了突破,從而大幅度提升了AI處理能效,為了這些突破,公司在Series3 NNA推出2年后才推出了4系列NNA。
據(jù)介紹,Series4 NNA有良好的可擴(kuò)展性和靈活性,其多核架構(gòu)支持在多個(gè)內(nèi)核之間對(duì)工作負(fù)載進(jìn)行靈活的分配和同步。Imagination的軟件提供了精細(xì)的控制能力,并通過(guò)對(duì)多個(gè)工作負(fù)載進(jìn)行批處理、拆分和調(diào)度而提高了靈活性,現(xiàn)在可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個(gè)集群配置 2個(gè)、4個(gè)、6個(gè)或者8個(gè)內(nèi)核。
Series4的每個(gè)單核能夠以不到一瓦的功耗提供12.5 TOPS的性能。舉例來(lái)說(shuō),一個(gè)8內(nèi)核集群可以提供100 TOPS的算力,那么,配有6個(gè)8核集群的解決方案就可以提供600 TOPS的算力。在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。
延遲是AI運(yùn)算最關(guān)鍵的指標(biāo)之一,Imagination通過(guò)將多個(gè)單核組成2核、4核、6核或8核的多核集群,所有內(nèi)核可以相互協(xié)作,并行處理一個(gè)任務(wù),降低處理延遲,縮短響應(yīng)時(shí)間。例如,對(duì)于一個(gè)8核集群,理想情況下延遲會(huì)減少為單核獨(dú)立執(zhí)行時(shí)的1/8。 節(jié)省帶寬的專(zhuān)利技術(shù) 在進(jìn)行人工智能計(jì)算中,帶寬是一個(gè)重要指標(biāo),如果能節(jié)省帶寬,則可以大幅度地提升能效,此外,據(jù)介紹,Imagination在4系列NNA使用了一個(gè)專(zhuān)利的技術(shù)--Tensor Tiling技術(shù)(Imagination’s Tensor Tiling,ITT),可以將帶寬使用減少90%!
Gilberto解釋說(shuō),在人工智能計(jì)算中,各層以融合內(nèi)核的形式運(yùn)行在加速器的硬件流水線(xiàn)里,融合內(nèi)核之間的特征圖需要通過(guò)外部存儲(chǔ)進(jìn)行交換,使用緊耦合的SRAM可以提升效率,通過(guò)tiling技術(shù),充分利用緊耦合的SRAM來(lái)融合更多的層,更多的層被融合后,減少了需要通過(guò)外部存儲(chǔ)交換的特征圖。 這樣,通過(guò)對(duì)計(jì)算任務(wù)進(jìn)行tiling,充分利用片上存儲(chǔ),提升數(shù)據(jù)處理效率,并節(jié)省訪(fǎng)問(wèn)外部存儲(chǔ)的帶寬。ITT利用本地?cái)?shù)據(jù)的依賴(lài)性將中間數(shù)據(jù)保存在片上存儲(chǔ)器中,這樣可以最大限度地減少將數(shù)據(jù)傳輸至外部存儲(chǔ)器,從而將帶寬降低多達(dá)90%。ITT是一種可擴(kuò)展的算法,在擁有大量輸入數(shù)據(jù)的網(wǎng)絡(luò)上具有顯著優(yōu)勢(shì)。 他舉例說(shuō)明,這是沒(méi)有使用ITT的ResNetv2-50運(yùn)算過(guò)程
這是使用了ITT的ResNetv2-50運(yùn)算過(guò)程
此外,他指出Series4NNA在處理任務(wù)上也有很強(qiáng)的靈活性,任務(wù)可以在多個(gè)維度被拆分,例如所有NNA單核可以運(yùn)行不同的工作負(fù)載,如下圖core 0 可以執(zhí)行A任務(wù),core 1可以執(zhí)行B任務(wù),core 2可以執(zhí)行C任務(wù),core 3可以執(zhí)行D任務(wù),也可以組合為一起共同執(zhí)行一個(gè)任務(wù),或者為特定任務(wù)保留一個(gè)或一組單核。還可以在運(yùn)行時(shí)動(dòng)態(tài)分配,總之靈活性非常強(qiáng)。
可以按照?qǐng)鼍靶枰獙?shí)現(xiàn)延遲和吞吐量之間的平衡。
此外, Series4 NNA還可以和 Imagination 的GPU實(shí)現(xiàn)協(xié)同,進(jìn)行更靈活的組合。
發(fā)力汽車(chē)ADAS
“Imagination和汽車(chē)領(lǐng)域的芯片廠(chǎng)商如TI、瑞薩等都有很好的長(zhǎng)期合作,也了解芯片廠(chǎng)商以及一些造車(chē)新勢(shì)力的需求?!盜magination Technologies人工智能業(yè)務(wù)高級(jí)總監(jiān)Andrew Grant表示:“我們相信Series4 NNA將成為開(kāi)發(fā)先進(jìn)駕駛輔助系統(tǒng)和自動(dòng)駕駛汽車(chē)的行業(yè)標(biāo)準(zhǔn)平臺(tái)。一些創(chuàng)新者已經(jīng)在著手打造支持下一代ADAS功能和自動(dòng)駕駛汽車(chē)的芯片。任何希望在汽車(chē)領(lǐng)域扮演重要角色的公司或研發(fā)團(tuán)隊(duì)是時(shí)候?qū)⑦@項(xiàng)技術(shù)集成至他們的平臺(tái)中了。”
據(jù)他介紹,Series4包含IP級(jí)別的安全功能且設(shè)計(jì)流程符合ISO 26262標(biāo)準(zhǔn),可以幫助客戶(hù)獲得ISO 26262認(rèn)證。ISO 26262是旨在解決汽車(chē)電子產(chǎn)品風(fēng)險(xiǎn)的行業(yè)安全標(biāo)準(zhǔn)。Series4可以在不影響性能的情況下,安全地進(jìn)行神經(jīng)網(wǎng)絡(luò)推理。硬件安全機(jī)制可以保護(hù)編譯后的網(wǎng)絡(luò)、網(wǎng)絡(luò)的執(zhí)行和數(shù)據(jù)處理管道。 他表示Series4 NNA是以軟核的RTL代碼形式提供給客戶(hù)的,Imagination的軟件工具可以輕松幫助客戶(hù)導(dǎo)入設(shè)計(jì)。
Imagination Technologies中國(guó)區(qū)戰(zhàn)略市場(chǎng)與生態(tài)高級(jí)總監(jiān)時(shí)昕博士表示中國(guó)車(chē)廠(chǎng)和一些造車(chē)新勢(shì)力在推進(jìn)汽車(chē)智能駕駛方面力度很大,Imagination愿意以最新的技術(shù)和高性?xún)r(jià)比的IP幫助產(chǎn)業(yè)健康良性發(fā)展。
責(zé)任編輯:lq
-
加速器
+關(guān)注
關(guān)注
2文章
790瀏覽量
37688 -
AI
+關(guān)注
關(guān)注
87文章
29854瀏覽量
268151 -
adas
+關(guān)注
關(guān)注
309文章
2163瀏覽量
208486
原文標(biāo)題:瞄準(zhǔn)ADAS,算力突破600T!這顆AI加速器IP牛!
文章出處:【微信號(hào):Open_FPGA,微信公眾號(hào):OpenFPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論