專注于智能互聯(lián)設(shè)備的全球領(lǐng)先信號(hào)處理IP授權(quán)公司CEVA宣布推出一款基于DSP的全新產(chǎn)品,為低功耗嵌入式系統(tǒng)帶來深度學(xué)習(xí)和人工智能(AI)能力。這款全面的可擴(kuò)展集成硬件和軟件IP平臺(tái)的核心是全新圖像和視覺DSP CEVA-XM6 ,使得開發(fā)人員能夠高效地利用神經(jīng)網(wǎng)絡(luò)和機(jī)器視覺能力,用于智能手機(jī)、無人駕駛車輛、監(jiān)控、機(jī)器人、無人機(jī)和其它帶有相機(jī)功能的智能器件。
與上一代CEVA-XM4智能視覺DSP相比,這個(gè)基于CEVA-XM6的新型視覺平臺(tái)的神經(jīng)網(wǎng)絡(luò)性能提高至八倍,所有計(jì)算機(jī)視覺內(nèi)核性能改善達(dá)到三倍。這個(gè)新型架構(gòu)集成的關(guān)鍵增強(qiáng)功能包括新的矢量和標(biāo)量處理單元,以及指令集、存儲(chǔ)帶寬和 DMA的大量增強(qiáng)功能。
這個(gè)新型視覺平臺(tái)進(jìn)一步擴(kuò)展了CEVA產(chǎn)品在實(shí)施神經(jīng)網(wǎng)絡(luò)時(shí)與采用GPU的主流架構(gòu)相比的性能優(yōu)勢。與用于計(jì)算機(jī)視覺和深度學(xué)習(xí)的領(lǐng)先GPU嵌入式系統(tǒng)相比,CEVA最新的圖像和視覺平臺(tái)的性能每瓦特效率(performance-per-watt efficiency)提升25倍以上,用于AlexNet和GoogLeNet等卷積神經(jīng)網(wǎng)絡(luò)(CNN)的處理速度加快四倍。
CEVA視覺業(yè)務(wù)部副總裁兼總經(jīng)理Ilan Yona稱:“隨著計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)成為主流,我們需要在高功耗GPU引擎產(chǎn)生的深度神經(jīng)網(wǎng)絡(luò)和部署這些功率和性能受限的嵌入式應(yīng)用之間架起橋梁,消除中間的鴻溝。我們的新型視覺平臺(tái)在這方面非常出色,為開發(fā)人員提供最全面的技術(shù)集,能夠快速應(yīng)對(duì)這些嵌入式使用案例?!?/p>
這款視覺平臺(tái)集成了大量軟件和硬件IP,為在嵌入式系統(tǒng)中部署機(jī)器視覺和深度學(xué)習(xí)提供上市時(shí)間和功率優(yōu)勢。除CEVA-XM6 DSP本身之外,這平臺(tái)還包括CNN特定功能加速器和圖像去扭曲(針對(duì)所有類型的圖像變換)、CEVA受到廣泛贊譽(yù)的CDNN2神經(jīng)網(wǎng)絡(luò)軟件框架、OpenCV、OpenCL和OpenVX API、CEVA-CV計(jì)算機(jī)視覺庫,以及一組廣泛應(yīng)用的優(yōu)化算法。
嵌入式視覺聯(lián)盟創(chuàng)立者Jeff Bier道:“各種終端產(chǎn)品的設(shè)計(jì)人員都渴望在其設(shè)計(jì)中集成視覺智能。通常,這些開發(fā)人員使用的視覺和深度學(xué)習(xí)算法要求以低成本、低功耗,并且可編程的方法提供極高的處理性能。我非常贊賞CEVA長期致力于提供滿足這些需求的處理器和軟件工具?!?/p>
技術(shù)特點(diǎn)
CEVA-XM6以強(qiáng)大的CEVA-XM4和CEVA-MM3101處理器為基礎(chǔ),并已經(jīng)有了超過25個(gè)設(shè)計(jì)項(xiàng)目。它具備了一系列提供突破性神經(jīng)網(wǎng)絡(luò)性能和高級(jí)計(jì)算機(jī)視覺處理能力的架構(gòu)創(chuàng)新和增強(qiáng)功能,包括:
創(chuàng)新矢量處理單元(VPU)架構(gòu):確保95%以上的MAC利用率,是現(xiàn)今業(yè)界中無人能及的卓越水平
· 增強(qiáng)并行分散 – 集中存儲(chǔ)負(fù)荷機(jī)制:進(jìn)一步改善視覺算法性能,包括SLAM和深度映射。
· Sliding Window 2.0? :這個(gè)專利機(jī)制利用圖像處理的像素重疊,有助于在更廣泛的神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)更高的利用率,以及適應(yīng)這些網(wǎng)絡(luò)日益增加的復(fù)雜性。
· 選件32路SIMD矢量浮點(diǎn)單元,其中包括IEEE半精度標(biāo)準(zhǔn)(FP16)和重大的非線性運(yùn)算增強(qiáng)。
· 其它改進(jìn)包括加速CNN性能的增強(qiáng)3D數(shù)據(jù)處理方案,與CEVA-XM4相比,控制代碼性能改進(jìn)了50%,并具有進(jìn)一步縮小代碼尺寸的新的可擴(kuò)展單元及多核和系統(tǒng)集成支持。
除CEVA-XM6 DSP外,這種視覺平臺(tái)的其它關(guān)鍵部件包括:
· CDNN加速器:16位CDNN加速器具有512 MACs/cycle,確保提供業(yè)界最佳性能以處理目前最復(fù)雜的神經(jīng)網(wǎng)絡(luò)。CDNN加速器還用于釋放CEVA-XM6 DSP內(nèi)的256 MAC單元,允許并行運(yùn)行其它計(jì)算機(jī)視覺任務(wù)。這種靈活的方法使得CDNN加速器配合CEVA-XM6的架構(gòu)成為了支持新的圖像算法、網(wǎng)絡(luò)結(jié)構(gòu)和改變快速演變的深度學(xué)習(xí)空間中的層類型的最佳選擇。
· 圖像去扭曲加速器 :對(duì)于寬角攝像頭應(yīng)用,比如360度攝像頭來說,圖像去扭曲加速器支持ARM幀緩沖壓縮(AFBC)協(xié)議,提供最佳系統(tǒng)互操作性。
· 加速器認(rèn)知補(bǔ)充軟件:在CEVA-XM6 DSP上運(yùn)行,提供高效加速器利用率,使設(shè)計(jì)人員能夠進(jìn)一步差異化其產(chǎn)品設(shè)計(jì)。
· CDNN2軟件框架:經(jīng)優(yōu)化及與CEVA-XM6和加速器協(xié)作,使得開發(fā)人員很容易利用此工具生成并將其專有神經(jīng)網(wǎng)絡(luò)移植到CEVA-XM6上,從而顯著加速利用最新最先進(jìn)的網(wǎng)絡(luò)拓?fù)浜蛯拥男阅?,包括支持Caffe和Google的機(jī)器學(xué)習(xí)軟件庫TensorFlow。
· 符合ISO 26262主動(dòng)安全性的產(chǎn)品包:在汽車應(yīng)用場合支持下一代ADAS和自主駕駛解決方案的需求。
CEVA的CDNN2軟件框架同時(shí)針對(duì)CEVA-XM6和CDNN加速器優(yōu)化,完全支持16位定點(diǎn)精度,確保運(yùn)行在32位浮點(diǎn)環(huán)境中培訓(xùn)的網(wǎng)絡(luò)時(shí)精度降低小于1%。這是神經(jīng)網(wǎng)絡(luò)從研發(fā)過渡到面向大批量汽車和消費(fèi)者應(yīng)用的高成本和功率效益解決方案的關(guān)鍵。
供貨
CEVA將于2016年第四季向主要客戶授權(quán)許可CEVA-XM6 DSP和視覺平臺(tái)組件,并且將于2017年第一季進(jìn)行普通授權(quán)許可。
如要了解有關(guān)CEVA-XM6 DSP和視覺平臺(tái)的更多信息,請(qǐng)?jiān)L問公司網(wǎng)頁。可在CEVA YouKu通道觀看介紹CEVA-XM6的視頻。
評(píng)論
查看更多