0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI之路上FPGA芯片將是關(guān)鍵?

姚小熊27 ? 來源:網(wǎng)絡(luò)整理 ? 2018-05-31 11:16 ? 次閱讀

FPGA受青睞的原因分析

首先,編程FPGA的軟件棧已經(jīng)演進了,尤其是在Altera的幫助下,F(xiàn)PGA增加了對OpenCL開發(fā)環(huán)境的支持。但不是每個人都是OpenCL的狂熱粉絲。

先有Nvidia為其Tesla GPU加速器創(chuàng)建了自己的CUDA并行編程環(huán)境。再有SRC計算機公司不但早在2002年就為國防和智能領(lǐng)域提供混合CPU-FPGA系統(tǒng),到了2016年年中,進一步將自己研發(fā)的Carte編程環(huán)境進入了商業(yè)市場,這個編程環(huán)境可以使C和Fortran程序自動轉(zhuǎn)換為FPGA的硬件描述語言(HDL)。

另一個推動FPGA被采用的因素是隨著芯片制造技術(shù)難以持續(xù)縮進,多核CPU性能的提高越來越艱難。 雖然CPU的性能獲得了大跳躍,但主要用于擴展CPU的性能吞吐量,而不是單個CPU內(nèi)核的個體性能。(我們知道架構(gòu)增強是有難度的)。但是FPGA和GPU加速器的每瓦性能都有了令人信服的改進。

根據(jù)微軟的運行測試,在執(zhí)行深度學(xué)習(xí)算法的時候,CPU-FPGA和CPU-GPU混合計算在的每瓦性能也不相伯仲。GPU在運行中更熱和有類似的每瓦性能表現(xiàn),但是同時他們也帶來了更強的工作能力。

提高了每瓦性能解析了為什么世界上最強大的超級計算機在20世紀(jì)90年代后期轉(zhuǎn)移到并行集群,并且解析了為什么現(xiàn)在他們轉(zhuǎn)向了混合機器,而不是英特爾的下一個以 CPU-GPU為混合主力的Xeon Phi的處理器“Knights Landing (簡稱KNL)。

在Altera FPGA協(xié)處理器和Xeon Phi處理器Knights Landing的幫助下,英特爾不但可以保持自己的在高端的競爭優(yōu)勢。并且在與Nvidia 、IBM和 Mellanox組成的Open power聯(lián)盟競爭中繼續(xù)領(lǐng)先。

英特爾堅信超大規(guī)模計算,云端和HPC市場的工作負(fù)載會快速成長。為促進其計算業(yè)務(wù)繼續(xù)蓬勃發(fā)展。這情況下只能成為FPGA的賣家,否則別人就會搶去這唯一的出路。

但英特爾并不是這樣跟大家說。他們說:“我們不認(rèn)為這是一種防守戰(zhàn)或者其他,”英特爾的CEO Brian Krzanich在Altera收購消息后的新聞發(fā)布會上說。

“我們認(rèn)為物聯(lián)網(wǎng)和數(shù)據(jù)中心都是龐大的。這些也是我們的客戶想要構(gòu)建的產(chǎn)品。我們30%的云端工作負(fù)載將在這些產(chǎn)品上,這是基于我們對如何看待趨勢變化以及市場發(fā)展的預(yù)測。

這是用來證明這些工作負(fù)載能以一種或另一種方式轉(zhuǎn)移到硅中。我們認(rèn)為最好的做法是使用有業(yè)界最佳性能和成本優(yōu)勢的Xeon處理器和FPGA組合。這將給工業(yè)領(lǐng)域帶來更好的產(chǎn)品和性能。而在IoT中,這將擴展到潛在市場對抗ASIC和ASSP;而在數(shù)據(jù)中心中,則會將workload轉(zhuǎn)移到硅,推動云的快速增長。

Krzanich解釋道:“你可以把FPGA想象成一堆gate,且能夠隨時編程。根據(jù)他們的想法,其算法會隨著時間的推移和學(xué)習(xí)變得更聰明。FPGA可以用作多個領(lǐng)域的加速器,可以在進行加密的同時進行面部搜索,而且能在基本上在微秒內(nèi)重新編程FPGA。這比大規(guī)模的單個定制部件的成本低得多且具備更高的靈活性?!?/p>

FPGA在AI中的優(yōu)勢

現(xiàn)在流行的AI(人工智能)模型基本上都是由人工神經(jīng)網(wǎng)絡(luò)構(gòu)成。這些人工神經(jīng)網(wǎng)絡(luò)運行起來都需要龐大的計算。下圖是一個簡單的人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以用它來理解AI需要的計算量。這個簡單的模型只有4個輸入和和三個輸出,每過圓圈代表一個神經(jīng)單元,相當(dāng)于一個神經(jīng)細(xì)胞。而每個箭頭代表至少一個乘法和加法運算。所以這個超級簡單的神經(jīng)網(wǎng)絡(luò)每運行一次需要超過18次乘法和加法運算。而上一篇文章演示用的例子則復(fù)雜得多,它由16層神經(jīng)網(wǎng)絡(luò)構(gòu)成。其中第一層神經(jīng)網(wǎng)絡(luò)需要大約9千萬次乘法和加法運算,而第二層神經(jīng)網(wǎng)絡(luò)則需要約19億次乘法和加法。

對于這些龐大的計算,傳統(tǒng)計算機的CPU架構(gòu)已經(jīng)很難滿足要求,很多AI計算都會使用GPU來加速。原本GPU設(shè)計出來是為了加快3D圖像的處理,它不必像CPU那樣需要執(zhí)行復(fù)雜的控制指令,可以把大部分的硬件資源用于計算,所以它的計算能力要遠高于集成度相當(dāng)?shù)腃PU。下圖中綠色部分的ALU是CPU的計算單元,而同樣面積的GPU則幾乎被綠色的計算單元占滿。也正因為計算能上的巨大差異,前段時間很火的比特幣挖礦大量使用了顯卡中的GPU來計算。同樣也是因為AI應(yīng)用方面的潛力再加上比特幣挖礦的需求,GPU供應(yīng)商英偉達的股票價格節(jié)節(jié)攀升。

AI之路上FPGA芯片將是關(guān)鍵?

新的CPU架構(gòu)也不甘落后,紛紛加強了計算能力,比如Intel的AVX擴展指令可以同時處理512bit的計算,硬件上相當(dāng)于8個32bit的的計算單元。ARM的VFPv3也是專注于計算能力的提升,VFPv3包含了32個64bit的計算單元。當(dāng)前的CPU基本上都含有多個內(nèi)核,所以在一顆CPU中總的運算單元大概幾十個到上百個。類似的,F(xiàn)PGA也內(nèi)嵌了這些硬件計算資源,而且應(yīng)用時間更早。舉個例子,Lattice ECP3-150是10年前(2007年)就已經(jīng)推出的產(chǎn)品,它內(nèi)嵌了320個DSP硬核,相當(dāng)于80個32bit的運算單元。而Intel的AVX是2008年才出現(xiàn)。從計算能力上比較,F(xiàn)PGA與新架構(gòu)的CPU能力相當(dāng)。雖然計算能力上不及GPU,但是如果考慮功耗的問題,那么FPGA可以甩開GPU好幾條街。下面把一些常見的CPU, GPU的性能和功耗列出來供參考。為了便于比較,計算能力統(tǒng)一用G-flops來表示,1 G-flops相當(dāng)于每秒能完成10億次浮點運算。為什么要浮點運算呢?因為AI神經(jīng)網(wǎng)絡(luò)從輸入到輸出需要經(jīng)歷很多次乘法和加法運算,很容易產(chǎn)生大數(shù)字。如果使用整數(shù)來表示,32bit最高范圍是10的9次方,超過這個范圍就會發(fā)生溢出錯誤。而浮點運算因為是用科學(xué)記數(shù)法來表示,32bit浮點數(shù)最高范圍可以到10的38次方,保證絕大部分AI運算不會溢出。

AI之路上FPGA芯片將是關(guān)鍵?

從上面的數(shù)據(jù)不難看出FPGA兼顧了高運算能力和低功耗的優(yōu)點。至于GPU,雖然運算能力最強,但是它的功耗幾乎相當(dāng)于半個電飯鍋,比較適合在實驗室里訓(xùn)練AI。如果放在移動設(shè)備上,相當(dāng)于背著半個電飯鍋到處跑,簡直就是一背鍋俠。一旦AI模型訓(xùn)練好,需要在移動設(shè)備上運行,那么FPGA無疑是非常好的選擇。

僅極少數(shù)手機搭載過FPGA芯

根據(jù)富比士(Forbes)報導(dǎo),Chipworks表示,這款FPGA芯片是由美國萊迪思半導(dǎo)體(Lattice Semiconductor)所生產(chǎn),型號為“ICE5LP4K”,主要設(shè)計作為配置在手機這類低功耗的裝置中。FPGA芯片在經(jīng)制造及安裝至某裝置中后,將能夠被進行重新配置。

值得注意的是,這類芯片導(dǎo)入資料中心領(lǐng)域則是被運用在加速機器學(xué)習(xí)(ML)應(yīng)用上。在智能型手機領(lǐng)域,除了蘋果首次將FPGA芯片導(dǎo)入iPhone設(shè)計外,最大競爭對手三星電子(Samsung Electronics)早在2014年推出Galaxy S5旗艦機時便開始采用萊迪思半導(dǎo)體的FPGA芯片,當(dāng)時三星未說明搭載這款FPGA芯片的功用,不過到了Galaxy S6便未再采用。

對于iPhone 7搭載FPGA芯片,市場研究公司Tirias Research首席分析師Kevin Krewell表示蘋果此舉一反常態(tài),讓智能型手機新內(nèi)建FPGA芯片將增加額外的生產(chǎn)成本,至今僅少數(shù)手機有搭載FPGA芯片。

iPhone 7首搭載FPGA芯片

Krewell認(rèn)為,蘋果首度在iPhone上搭載FPGA芯片,準(zhǔn)備以此芯片來運行機器學(xué)習(xí)演算法,有可能是未來將推出與先進健康偵測有關(guān)的功能。

其他方面也可能作為尚未發(fā)布的虛擬實境(VR)或擴增實境(AR)功能所需的額外影像處理之用。但也有可能該FPGA芯片只是一個臨時的應(yīng)急解決方案,可能蘋果最終會在未來的iPhone中改搭載一款專門的芯片。

由于蘋果未對外透露該FPGA芯片的功用,因此目前外界仍不清楚該FPGA芯片配置起了何種功用,或iPhone 7是否已有在運用這款芯片,但基于該FPGA芯片可再程式化的本質(zhì),未來蘋果可能會透過將iPhone 7韌體升級的方式,來改變提升這款芯片的功能。

蘋果在iPhone 7系列中新增更多AI元素,例如iPhone 7搭載的先進相機鏡頭的技術(shù)即源自于新款影像訊號處理器的運算視覺演算法,此為蘋果內(nèi)部自有設(shè)計專利。

在AI研發(fā)上蘋果則與Google走不同的路線,更加注重裝置本身而非云端運算,蘋果的理由是將資料上傳至云端,不比直接在裝置上運算更具安全及隱私性。

FPGA芯片發(fā)展?jié)摿?/strong>

除了萊迪思半導(dǎo)體外,英特爾(Intel)旗下Altera及賽靈思(Xilinx)兩家大型FPGA芯片制造商也生產(chǎn)許多適合用于資料中心的FPGA芯片,這類資料中心便是FPGA芯片開始普及的應(yīng)用領(lǐng)域,因為FPGA芯片在該領(lǐng)域能夠加速機器學(xué)習(xí)軟件?;诖诵酒瑵摿?,這也是為何英特爾會在2015年以167億美元買下Altera的一大主因。

英特爾一直渴望維持該公司在全球資料中心處理器市場的領(lǐng)導(dǎo)地位,因此已開始將其服務(wù)器處理器與Altera的FPGA芯片進行配對整合;微軟(Microsoft)同樣大舉投資于生產(chǎn)自有客制化FPGA芯片,借以強化該公司資料中心的AI運算能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1620

    文章

    21510

    瀏覽量

    598879
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28875

    瀏覽量

    266199
  • iPhone7
    +關(guān)注

    關(guān)注

    1

    文章

    1350

    瀏覽量

    41341
收藏 人收藏

    評論

    相關(guān)推薦

    通向FPGA之路---七天玩轉(zhuǎn)Altera教程

    本系列教程的宗旨是在力求全面介紹Altera及其QuartusII軟件原理的基礎(chǔ)上,對何如使用Altera FPGA進行基礎(chǔ)設(shè)計、時序分析、驗證、優(yōu)化四大方面進行講解通向FPGA之路---七天玩轉(zhuǎn)
    發(fā)表于 12-04 14:36

    AI運算核心,FPGA領(lǐng)域前程遠大

    轉(zhuǎn)帖AI(人工智能)系統(tǒng)開發(fā)近年快速躍進,戰(zhàn)場已從過去「軟件開發(fā)」走向「硬件芯片」競爭,搭配網(wǎng)絡(luò)普及型塑出大數(shù)據(jù),使得真實世界的無限復(fù)雜與快速計算可以藉由AI實現(xiàn)。半導(dǎo)體供應(yīng)鏈主要受惠AI
    發(fā)表于 12-05 08:09

    手把手教你設(shè)計人工智能芯片及系統(tǒng)--(全階設(shè)計教程+AI芯片FPGA實現(xiàn)+開發(fā)板)

    AI芯片產(chǎn)品的設(shè)計和開發(fā);技巧提升:課程剖析AI芯片開發(fā)流程及技巧,學(xué)員可熟悉AI芯片架構(gòu)設(shè)計的
    發(fā)表于 07-19 11:54

    29頁PPT,詳細(xì)介紹Ouroboros的語音AI芯片

    阿里達摩院發(fā)布一款名為Ouroboros的語音AI芯片。據(jù)官方表示,這款芯片是業(yè)界首款專門用于語音合成算法的AI芯片,它基于
    發(fā)表于 10-16 16:32

    【免費直播】讓AI芯片擁有最強大腦—AI芯片的操作系統(tǒng)設(shè)計介紹.

    推薦】FPGA軟件無線電開發(fā)(全階視頻教程+開發(fā)板+實例)詳情鏈接:http://url.elecfans.com/u/5e4a12f2ba手把手教你設(shè)計人工智能芯片及系統(tǒng)(全階設(shè)計教程+AI
    發(fā)表于 11-07 14:18

    從 Android 到 AI 之路:Java與Python 攜手同行

    ` 從 Android 到 AI 之路:Java與Python 攜手同行 1.以Python撰寫 AI模型框架(Framework)2.準(zhǔn)備Java與Python協(xié)同開發(fā)環(huán)境3.在Android
    發(fā)表于 12-17 09:52

    Cyclone V SoC FPGA學(xué)習(xí)之路

    Cyclone V SoC FPGA學(xué)習(xí)之路第二章:硬件篇(內(nèi)部資源)前言上一章了解了《cycloneV device datasheet》,其中數(shù)據(jù)手冊里重點介紹了電源要求,時序參數(shù)性能等。下面
    發(fā)表于 07-23 07:06

    ai芯片和gpu的區(qū)別

    ai芯片和gpu的區(qū)別▌車載芯片的發(fā)展趨勢(CPU-GPU-FPGA-ASIC)過去汽車電子芯片以與傳感器一一對應(yīng)的電子控制單元(ECU)為
    發(fā)表于 07-27 07:29

    AI芯片的前生今世與未來之路

    芯片發(fā)展的大趨勢來看,目前尚處于AI芯片發(fā)展的初級階段,無論是科研還是產(chǎn)業(yè)應(yīng)用都有巨大的創(chuàng)新空間。我們相信,未來十年將是AI
    的頭像 發(fā)表于 07-24 15:44 ?4403次閱讀

    AI芯片領(lǐng)域 賽靈思認(rèn)為FPGA芯片將是重頭戲

    3月19日,全球第一大FPGA廠商賽靈思公司新任總裁兼CEOVictorPeng表示,要進一步推動計算加速、計算存儲及網(wǎng)絡(luò)加速領(lǐng)域的創(chuàng)新與部署,讓客戶在人工智能(AI)推斷、視頻與圖像處理、基因組學(xué)等領(lǐng)域受益于芯片性能和單位功耗
    發(fā)表于 11-23 17:30 ?1148次閱讀

    維納和圖靈:AI研究之路關(guān)鍵節(jié)點和分歧之處

    圖靈和維納的思想都對人工智能的研究之路產(chǎn)生了重要影響,本文討論了AI發(fā)展過程中的主要困難,特別是解釋了圖靈的人工智能方法和維納的人工智能方法之間的關(guān)鍵區(qū)別,啟發(fā)現(xiàn)有AI方法的未來研究方
    的頭像 發(fā)表于 08-01 18:09 ?4231次閱讀

    FPGA迎接AI時代而不是專用芯片

    AI芯片領(lǐng)域,前有英偉達GPU獨領(lǐng)風(fēng)騷,后有谷歌對外開放TPU,賽靈思CEO Victor則認(rèn)為FPGA芯片將是重頭戲。
    發(fā)表于 08-21 15:10 ?512次閱讀

    AI時代即將到來,FPGA是最好的迎接方式

    AI芯片領(lǐng)域,前有英偉達GPU獨領(lǐng)風(fēng)騷,后有谷歌對外開放TPU,賽靈思CEO Victor則認(rèn)為FPGA芯片將是重頭戲。
    發(fā)表于 11-22 15:37 ?541次閱讀

    淺談中國AI芯片的創(chuàng)新之路

    清華大學(xué)微納電子系副主任、微電子所副所長尹首今(1)日發(fā)表了以《中國AI芯?的創(chuàng)新之路》為主題的演講。
    的頭像 發(fā)表于 12-01 11:17 ?2452次閱讀

    fpga芯片和人工智能芯片的區(qū)別

    FPGA芯片和人工智能芯片AI芯片)在設(shè)計和應(yīng)用上存在一些關(guān)鍵的區(qū)別,這些區(qū)別主要體現(xiàn)在它們的
    的頭像 發(fā)表于 03-14 17:26 ?895次閱讀