0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA取代AI加速器中的GPU

eeDesigner ? 2020-07-21 15:14 ? 次閱讀

AI軟件初創(chuàng)公司Mipsology正在與Xilinx合作,以使FPGA能夠僅使用一個附加命令即可替換AI加速器應(yīng)用程序中的GPU。Mipsology的“零努力”軟件Zebra將GPU代碼轉(zhuǎn)換為可在FPGA上的Mipsology的AI計(jì)算引擎上運(yùn)行,而無需進(jìn)行任何代碼更改或重新培訓(xùn)。

賽靈思今天宣布,將為數(shù)據(jù)中心向Zebra交付最新版本的Alveo U50卡。Zebra已經(jīng)在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。

Xilinx Alveo U50卡,旨在取代AI Acceleration中的GPU
賽靈思最新版本的Alveo U50數(shù)據(jù)中心加速卡現(xiàn)在帶有Mipsology的Zebra軟件,用于轉(zhuǎn)換GPU AI代碼以在FPGA上運(yùn)行(圖片:Xilinx)

Xilinx營銷副總裁Ramine Roane表示:“ Zebra帶給我們的Alveo卡的加速水平使CPU和GPU加速器感到羞愧?!?/span>“與Zebra結(jié)合使用,Alveo U50滿足了AI工作負(fù)載的靈活性和性能需求,并為任何部署提供了高吞吐量和低延遲性能優(yōu)勢?!?/span>


過去,即插即用的FPGA對于非專業(yè)人士來說很難編程,但是Mipsology希望將FPGA變成即插即用的解決方案,就像CPU或GPU一樣容易使用。這樣做的想法是使從其他類型的加速切換到FPGA盡可能容易。

Mipsology首席執(zhí)行官Ludovic Larzul說:“最好的方式是[Mipsology],我們使用FPGA之上的軟件來使它們透明化,就像Nvidia用Cuda CuDNN來使GPU對AI用戶完全透明一樣。“在接受EE Times采訪時(shí)。

至關(guān)重要的是,這可以由非專家完成,而無需具備深厚的AI專業(yè)知識或FPGA技能,因?yàn)闊o需進(jìn)行模型再培訓(xùn)即可過渡。

“易用性非常重要,因?yàn)楫?dāng)您查看人們的AI項(xiàng)目時(shí),他們通常無法訪問設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的AI團(tuán)隊(duì),” Larzul說。“通常,如果有人安裝了一個機(jī)器人系統(tǒng)或一個視頻監(jiān)視系統(tǒng)……他們會讓其他團(tuán)隊(duì)或其他團(tuán)體開發(fā)神經(jīng)網(wǎng)絡(luò)并對其進(jìn)行培訓(xùn)。一旦獲得了[訓(xùn)練有素的模型],他們就不會更改它,因?yàn)樗麄儧]有專業(yè)知識?!?/span>

Mipsology Zebra軟件堆棧。 Zebra使FPGA能夠取代GPU
斑馬的堆棧。該技術(shù)適用于數(shù)據(jù)中心,邊緣和嵌入式應(yīng)用程序(圖片:Mipsology)

與Xilinx對比當(dāng)Xilinx
已經(jīng)擁有自己的神經(jīng)網(wǎng)絡(luò)加速器引擎(XDNN)時(shí),為什么會支持第三方軟件?

“一句話的重點(diǎn)是:我們做得更好,”拉爾祖爾說。“另一句話是:我們的作品。”

Mipsology在Zebra中擁有自己的計(jì)算引擎,該引擎支持客戶現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,與XDNN不同,Larzul表示XDNN支持大量演示,但不太適合定制神經(jīng)網(wǎng)絡(luò)。他說,這使使用XDNN建立和運(yùn)行自定義網(wǎng)絡(luò)“痛苦”。盡管XDNN可以在不受GPU威脅的應(yīng)用程序中競爭,但Zebra旨在使FPGA根據(jù)性能,成本和易用性直接采用GPU。

Mipsology Zebra堆棧詳細(xì)-幫助FPGA取代GPU
斑馬的堆棧詳細(xì)。目的是通過盡可能多地隱藏硬件來使FPGA成為從GPU或CPU到AI加速的更簡單的切換(圖片:Mipsology)

Larzul說,大多數(shù)客戶改變GPU解決方案的動機(jī)是成本。

他說:“他們想降低硬件成本,但又不想重新設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)?!?/span>“(避免了)一筆非經(jīng)常性的費(fèi)用,因?yàn)槲覀兡軌蛲该鞯靥鎿QGPU,并且無需重新訓(xùn)練或修改神經(jīng)網(wǎng)絡(luò)。”

FPGA還具有可靠性,部分原因是因?yàn)樗鼈冊?a target="_blank">芯片領(lǐng)域不那么積極,并且通常比包括GPU在內(nèi)的其他加速器類型運(yùn)行溫度更低。這在需要長期維護(hù)成本的數(shù)據(jù)中心中尤其重要。

拉爾祖爾說:“總擁有成本不僅僅是董事會的價(jià)格?!?/span>“確保系統(tǒng)正常運(yùn)行還需要付出代價(jià)?!?/span>

Zebra還旨在使FPGA在性能上競爭。Larzul說,盡管FPGA通常提供比其他加速器更少的TOPS(每秒Tera操作),但由于Zebra精心設(shè)計(jì)的計(jì)算引擎,它們能夠更有效地使用TOPS。

Ludovic Larzul(圖片:Mipsology)
Ludovic Larzul(圖片:Mipsology)

“這是大多數(shù)加速AI的ASIC初創(chuàng)企業(yè)都忘記了的-他們在做很大的一塊硅片,試圖包裝更多的TOPS,但是他們沒有考慮如何在網(wǎng)絡(luò)上映射它以提高效率”,他說,并指出Zebra的基于FPGA的引擎比TOPS量為6倍的GPU每秒能夠處理更多圖像。

如何實(shí)現(xiàn)的?盡管Larzul沒有提供確切的細(xì)節(jié),但他確實(shí)表示它們不依賴修剪,因?yàn)榫冉档吞螅灾劣诓贿M(jìn)行重新培訓(xùn)就無法接受。由于相同的原因,它們不使用極限量化(低于8位)。

Zebra的引擎加快了CNN的速度,而CNN如今已廣泛用于圖像和視頻處理應(yīng)用程序,但Zebra也可以應(yīng)用于使用類似數(shù)學(xué)概念的BERT(Google的自然語言處理模型)。Zebra的未來迭代可能會覆蓋其他類型的神經(jīng)網(wǎng)絡(luò),包括LSTM(長期短期記憶)和RNN(遞歸神經(jīng)網(wǎng)絡(luò)),但這很難實(shí)現(xiàn),因?yàn)镽NN在數(shù)學(xué)上更加多樣化。

EVE
Mipsology的團(tuán)隊(duì)成立于2015年,在法國約有30人從事研發(fā)工作,在加利福尼亞有一個小團(tuán)隊(duì),主要負(fù)責(zé)業(yè)務(wù)發(fā)展。公司已獲得總計(jì)700萬美元的資金,其中200萬美元是2019年法國政府創(chuàng)新競賽的獎金。

Mipsology的核心團(tuán)隊(duì)來自EVE,這一家ASIC仿真器公司,于2012年被Synopsys收購,用于其ZeBu(零錯誤)硬件輔助驗(yàn)證產(chǎn)品,當(dāng)時(shí)是Cadence鈀金驗(yàn)證平臺的競爭對手。Larzul認(rèn)為,幾乎所有主要的ASIC公司都使用EVE技術(shù)在設(shè)計(jì)周期內(nèi)驗(yàn)證ASIC。該技術(shù)依賴于連接在一起的數(shù)千個FPGA來重現(xiàn)ASIC行為。

Mipsology擁有12項(xiàng)正在申請的專利,并且與Xilinx密切合作,并且與第三方加速器卡兼容,例如Western Digital小型(SFF U.2)卡和Vega-4001等研華卡。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1625

    文章

    21628

    瀏覽量

    601259
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4673

    瀏覽量

    128596
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29824

    瀏覽量

    268117
收藏 人收藏

    評論

    相關(guān)推薦

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負(fù)載設(shè)計(jì)的Gaudi3加速器,這款新芯片雖在速度上不及英偉達(dá)熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優(yōu)勢聚焦于其更為親民的價(jià)格與總擁有成本(TCO)上。
    的頭像 發(fā)表于 09-26 16:16 ?723次閱讀

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統(tǒng)高級<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理

    美國限制向中東AI加速器出口,審查國家安全

    AI加速器能協(xié)助數(shù)據(jù)中心處理大量人工智能聊天機(jī)器人和其他工具的開發(fā)信息。如今,它們已然成為構(gòu)建AI基礎(chǔ)設(shè)施的企業(yè)和政府的必需品。
    的頭像 發(fā)表于 05-31 09:20 ?504次閱讀

    臺積電:AI服務(wù)處理預(yù)計(jì)翻番,拉動收入增長?

    臺積電將 AI 服務(wù)處理嚴(yán)格限定為用于 AI 訓(xùn)練與推理的 GPU、CPU 及 AI
    的頭像 發(fā)表于 04-19 15:04 ?316次閱讀

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?693次閱讀

    Hitek Systems開發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲應(yīng)用的需求。
    的頭像 發(fā)表于 03-22 14:02 ?545次閱讀
    Hitek Systems開發(fā)基于PCIe的高性能<b class='flag-5'>加速器</b>以滿足行業(yè)需求

    FPGA在深度學(xué)習(xí)應(yīng)用或?qū)?b class='flag-5'>取代GPU

    ,這使其在 AI 應(yīng)用面臨著一些挑戰(zhàn)。 Larzul 表示,想要解決這些問題的解決方案便是實(shí)現(xiàn)現(xiàn)場可編程門陣列 (FPGA),這也是他們公司的研究領(lǐng)域。FPGA 是一種處理
    發(fā)表于 03-21 15:19

    瑞薩發(fā)布下一代動態(tài)可重構(gòu)人工智能處理加速器

    瑞薩最新發(fā)布的動態(tài)可重構(gòu)人工智能處理(DRP-AI加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在
    的頭像 發(fā)表于 03-08 13:45 ?692次閱讀

    家居智能化,推動AI加速器的發(fā)展

    提高了系統(tǒng)的運(yùn)算能力和數(shù)據(jù)處理能力,還為用戶帶來了更加智能化、個性化的生活體驗(yàn)。 ? AI 加速器的發(fā)展 ? 在人工智能和機(jī)器學(xué)習(xí)任務(wù)變得日益復(fù)雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足以處理這些任務(wù)。然而,隨著深度學(xué)習(xí)模型的出現(xiàn)
    的頭像 發(fā)表于 02-23 00:18 ?4509次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGAAI加速源代碼

    使用硬件加速器來進(jìn)一步提升性能。我寫的這個簡化的代碼只是為了幫助理解FPGA如何可能參與AI計(jì)算的過程。在實(shí)際的FPGA AI
    發(fā)表于 02-12 16:18

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場的運(yùn)動。本文將詳細(xì)介紹回旋加速器
    的頭像 發(fā)表于 01-30 10:02 ?3460次閱讀

    FPGAGPU的區(qū)別

    FPGA(現(xiàn)場可編程門陣列)和GPU(圖形處理)是兩種常見的硬件加速器,用于提高計(jì)算和處理速度。盡管它們在很多方面都有重疊,但在架構(gòu)、設(shè)計(jì)和應(yīng)用上存在許多區(qū)別。在本文中,我們將詳細(xì)探
    的頭像 發(fā)表于 12-25 15:28 ?1620次閱讀

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實(shí)驗(yàn)設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)等領(lǐng)域。其主要原理是通過電場和磁場的作用,對帶電粒子進(jìn)行加速,在高速運(yùn)動過程中使其獲得較大的動
    的頭像 發(fā)表于 12-18 13:52 ?1940次閱讀

    21489的IIR加速器濾波參數(shù)設(shè)置如何對應(yīng)加速器的濾波參數(shù)?

    目前在用21489內(nèi)部的IIR加速器去做一個低通濾波,在例程的基礎(chǔ)上修改參數(shù)。通過平板的fda 工具工具去設(shè)計(jì)參數(shù),但是設(shè)計(jì)出來的參數(shù)不知道如何對應(yīng)加速器的濾波參數(shù),手冊里也看得不是很明白。 設(shè)計(jì)的參數(shù)如下: 請問
    發(fā)表于 11-30 08:11

    PCIe在AI加速器的作用

    從線上購物時(shí)的“猜你喜歡”、到高等級自動駕駛汽車上的實(shí)時(shí)交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI加速器。AI加速器是一種高性能的并行計(jì)算設(shè)備,旨在高效處理神經(jīng)
    的頭像 發(fā)表于 11-18 10:36 ?1992次閱讀
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b><b class='flag-5'>中</b>的作用