0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FPGA、eFPGA、加速卡,全面應(yīng)對(duì)多樣化的邊緣AI

21克888 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:黃晶晶 ? 2022-07-13 16:41 ? 次閱讀

與將數(shù)據(jù)處理集中在云計(jì)算設(shè)施或數(shù)據(jù)中心進(jìn)行云端訓(xùn)練和推理的模式不同,邊緣AI在本地就能給終端設(shè)備提供智能化功能,并且具有低延遲、隱私保護(hù)等優(yōu)勢。據(jù)市場咨詢公司ABI Research的數(shù)據(jù)顯示,預(yù)計(jì)到2025年,邊緣AI芯片市場的收入將達(dá)到122億美元,云AI芯片市場的收入將達(dá)到119億美元,邊緣AI芯片市場將超過云AI芯片組市場。邊緣AI芯片當(dāng)前主要用于AI推理,未來可實(shí)現(xiàn)邊緣AI訓(xùn)練乃至自主學(xué)習(xí),從而使得邊緣AI更加智能。由于邊緣AI的興起,不同于云端AI的GPU占據(jù)主流,FPGAASIC等芯片在邊緣AI的價(jià)值得到更多體現(xiàn)。

最近,電子發(fā)燒友采訪到Achronix中國區(qū)總經(jīng)理郭道正,郭總分享了作為一家FPGA廠商怎么看到邊緣AI,以及Achronix有哪些先進(jìn)的解決方案等話題

邊緣AI對(duì)FPGA和eFPGA的需求


郭道正表示,邊緣AI將在智能化時(shí)代發(fā)揮巨大的作用,但是邊緣AI的應(yīng)用場景數(shù)量眾多,這意味著它們需要不同的計(jì)算器件和算力等級(jí)。這也意味著邊緣的計(jì)算架構(gòu)應(yīng)該有很高的靈活性,而這正是FPGA技術(shù)在提供并行計(jì)算的同時(shí)還能提供的。在工業(yè)應(yīng)用中還有一些特殊的要求,如工業(yè)通信協(xié)議轉(zhuǎn)換或者時(shí)常更新等,而FPGA是滿足這些要求的最好技術(shù)。

Achronix中國區(qū)總經(jīng)理郭道正



他進(jìn)一步指出,實(shí)際上,邊緣AI也不得不面臨許多云端推理/機(jī)器學(xué)習(xí)不會(huì)面對(duì)的制約因素,如系統(tǒng)的大小、功耗和成本等;同時(shí),邊緣AI的計(jì)算設(shè)備不得不面臨來自于各種各樣的傳感器等數(shù)據(jù)源的數(shù)據(jù);此外,這些數(shù)據(jù)可能還是通過不同的專用通信協(xié)議傳輸過來的,這在許多垂直行業(yè)中非常常見。因此,邊緣AI的計(jì)算架構(gòu)必須擁有足夠的靈活性和可編程性,這也就是我們認(rèn)為FPGA是邊緣AI最好技術(shù)之一。

不過正因?yàn)檫吘堿I面對(duì)的復(fù)雜性,因此獨(dú)立FPGA似乎并不能完全滿足所需。因此,Achronix為解決方案提供商提供了eFPGA IP。郭道正說道:“在他們自己面向邊緣AI推出的ASIC或SoC等芯片上,他們可以在其特有的計(jì)算器件旁邊引入我們的Speedcore eFPGA IP來作為硬件加速器,從而為整個(gè)邊緣AI解決方案帶來非常高的性價(jià)比和能效,并同時(shí)為新的應(yīng)用場景、新的算法、新的協(xié)議甚至新的傳感器保持足夠的靈活性?!?br />

全面FPGA技術(shù)和三大產(chǎn)品組合


Achronix為邊緣AI提供了全面的FPGA技術(shù)和產(chǎn)品組合。Achronix的解決方案包括Speedster7t系列獨(dú)立FPGA芯片、Speedcore eFPGA IP和VectorPath加速卡,所有這些都由Achronix ACE工具鏈提供支持。

Speedster7t系列獨(dú)立FPGA芯片

據(jù)介紹,Speedster7t FPGA的特點(diǎn)是在其高性能、高密度邏輯陣列之外,還具有二維片上網(wǎng)絡(luò)(2D NoC)和機(jī)器學(xué)習(xí)處理器(MLP),該器件采用7nm工藝打造。這樣,開發(fā)人員就不必?fù)?dān)心數(shù)據(jù)在流進(jìn)流出以及芯片內(nèi)部流動(dòng)的帶寬。

具體來看,Speedster7t FPGA架構(gòu)的各個(gè)方面都經(jīng)過了優(yōu)化,以便為AI/ML應(yīng)用創(chuàng)建一個(gè)優(yōu)化的、平衡的、大規(guī)模并行的計(jì)算引擎。每個(gè)Speedster7t FPGA都具有一個(gè)大規(guī)模并行的可編程計(jì)算單元陣列,并被整合成全新的機(jī)器學(xué)習(xí)處理器(MLP)模塊。每個(gè)MLP都是一個(gè)高度可配置的、計(jì)算密集型的單元模塊,具有多達(dá)32個(gè)乘法器,支持4到24位的整數(shù)格式和各種浮點(diǎn)格式,包括直接支持Tensorflow的bfloat16格式和塊浮點(diǎn)(BFP)格式。同時(shí),Speedster7t系列FPGA芯片中集成的2D NoC可以全面消除芯片內(nèi)外部的數(shù)據(jù)傳輸瓶頸。

嵌入式FPGA(eFPGA)

異構(gòu)計(jì)算是邊緣AI發(fā)展中非常確信的趨勢之一,因此許多邊緣計(jì)算解決方案采用的高集成度系統(tǒng)級(jí)芯片(SoC)或?qū)S?a href="http://ttokpm.com/v/tag/123/" target="_blank">集成電路(ASIC)都集成了嵌入式FPGA(eFPGA),從而可以幫助解決方案提供商為垂直行業(yè)開發(fā)邊緣AI解決方案,并為特定的邊緣應(yīng)用場所打造專門的解決方案。在部署的規(guī)模不斷提升之際,一個(gè)SoC或者ASIC解決方案的規(guī)模經(jīng)濟(jì)效應(yīng)將更加明顯。

Speedcore嵌入式FPGA(eFPGA)IP為ASIC和SoC帶來了強(qiáng)大的和靈活的可編程邏輯。客戶可以將Speedcore eFPGA集成到ASIC或SoC中,可用于高性能、計(jì)算密集型和實(shí)時(shí)處理應(yīng)用,諸如人工智能(AI)、機(jī)器學(xué)習(xí)(ML)、5G無線、網(wǎng)絡(luò)、存儲(chǔ)和汽車。當(dāng)然,它也可以用于這些領(lǐng)域中的大量邊緣AI應(yīng)用。

郭道正表示,與獨(dú)立FPGA芯片的設(shè)計(jì)過程不同,eFPGA設(shè)計(jì)人員可以針對(duì)客戶應(yīng)用,選擇所需邏輯、DSP(或MLP)、2D NoC和存儲(chǔ)資源的確切數(shù)量。當(dāng)需要靈活性時(shí),業(yè)界也可以使用eFPGA,同時(shí)通過消除獨(dú)立FPGA的多余功能來降低系統(tǒng)成本、功耗和電路板面積,諸如高速I/O這些功能在以SoC或者ASIC形態(tài)進(jìn)入大批量生產(chǎn)時(shí)是不需要的。

VectorPath S7t-VG6加速卡

VectorPath S7t-VG6加速卡旨在為人工智能(AI)、機(jī)器學(xué)習(xí)(ML)、網(wǎng)絡(luò)和數(shù)據(jù)中心應(yīng)用開發(fā)高性能計(jì)算和加速功能時(shí),縮短產(chǎn)品上市時(shí)間。該加速卡采用了Achronix的高性能Speedster7t AC7t1500 FPGA。VectorPath S7t-VG6是Achronix與領(lǐng)先的企業(yè)級(jí)FPGA加速器產(chǎn)品供應(yīng)商BittWare聯(lián)合開發(fā),可提供400G和200G以太網(wǎng)接口、GDDR6總存儲(chǔ)帶寬高達(dá)4 Tbps以及一整套軟件和工具,可以立即開始使用。

憑借這一獨(dú)特的產(chǎn)品組合,解決方案提供商能夠使用VectorPath加速卡為制造領(lǐng)域快速開發(fā)邊緣AI/ML解決方案,可適用于不同的垂直市場。此外,解決方案提供商可以將其硬件解決方案集成到帶有Speedcore eFPGA的SoC或ASIC之中,并將FPGA開發(fā)移植到芯片中,為制造領(lǐng)域的邊緣AI提供最高的成本效益和功耗效率。

發(fā)展規(guī)劃


邊緣AI不僅得到了FPGA、ASIC廠商的重視,我們看到現(xiàn)在一些廠商在MCU當(dāng)中集成AI加速器使得MCU更加智能。對(duì)于這樣的邊緣AI趨勢,郭道正認(rèn)為,MCU只是在邊緣使用的處理器品類之一。由于邊緣應(yīng)用的多樣性,在不同垂直領(lǐng)域或者應(yīng)用場景中可能需要MCU、通用處理器、應(yīng)用處理器甚至諸如PLC等技術(shù)領(lǐng)域中的特定處理器,而且它們已經(jīng)在不同的應(yīng)用場景中構(gòu)筑了自己相應(yīng)的優(yōu)勢和生態(tài)系統(tǒng)。而當(dāng)智能化時(shí)代到來之后,所有這些處理器都有一個(gè)共同的需求:它們都需要硬件加速器來高效地處理AI/ML算法,這也是邊緣計(jì)算領(lǐng)域中非常清晰的異構(gòu)計(jì)算大趨勢。

他說道,與僅用傳統(tǒng)處理器來運(yùn)行AI/ML算法的模式相比,F(xiàn)PGA是最高效的硬件數(shù)據(jù)處理加速器之一。FPGA技術(shù)在邊緣計(jì)算方面的應(yīng)用包括板級(jí)、芯片級(jí)和eFPGA等形式,但是Achronix是唯一一家提供獨(dú)立FPGA芯片、eFPGA IP和加速卡的供應(yīng)商,并提供了完整的ACE開發(fā)工具來支持所有種類的應(yīng)用。據(jù)此,邊緣AI解決方案提供商可以為其應(yīng)用和其他要求選擇最好的解決方案,并高效地重復(fù)使用他們的開發(fā)成果和IP。

面對(duì)如今規(guī)模高達(dá)100億美元并且還在不斷擴(kuò)展的硬件加速器市場。Achronix也部署了多項(xiàng)舉措。郭道正談到,其一是Achronix一直在不斷擴(kuò)大自己的團(tuán)隊(duì),這既包括不斷擴(kuò)大的高層管理人員團(tuán)隊(duì),他們?yōu)锳chronix帶來了在不用領(lǐng)域內(nèi)豐富的經(jīng)驗(yàn)或者技術(shù)特長,而且還包括我們一直在延聘的開發(fā)、工程、運(yùn)營和客戶支持團(tuán)隊(duì)成員。在中國,我們也在進(jìn)一步擴(kuò)大中國團(tuán)隊(duì),以確??蛻舻某晒Α?br />
其二,除了組織架構(gòu)性擴(kuò)展,Achronix也在不斷將FPGA技術(shù)推向更遠(yuǎn)的新領(lǐng)域。例如,先進(jìn)的封裝可以支持Achronix基于chiplet技術(shù)構(gòu)建模塊化產(chǎn)品。通過利用先進(jìn)的封裝,Achronix可以更快地進(jìn)行創(chuàng)新以滿足多個(gè)市場的需求,而不必為每一代新產(chǎn)品重新設(shè)計(jì)整個(gè)單片F(xiàn)PGA器件。展望未來,云和邊緣計(jì)算、網(wǎng)絡(luò)設(shè)備、人工智能和機(jī)器學(xué)習(xí)、5G/6G無線網(wǎng)絡(luò)設(shè)備、金融科技、工業(yè)和汽車等領(lǐng)域都是Achronix在未來5年內(nèi)主要的市場機(jī)遇。
通過前面對(duì)挑戰(zhàn)和解決方案的分析,我們可以發(fā)現(xiàn)FPGA技術(shù)是邊緣AI硬件平臺(tái)的最佳選擇,以應(yīng)對(duì)來自技術(shù)、經(jīng)濟(jì)規(guī)模和面向未來的解決方案等挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1625

    文章

    21636

    瀏覽量

    601315
  • IP
    IP
    +關(guān)注

    關(guān)注

    5

    文章

    1616

    瀏覽量

    149277
  • Achronix
    +關(guān)注

    關(guān)注

    1

    文章

    72

    瀏覽量

    22511
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    PCIe加速卡在數(shù)據(jù)中心的應(yīng)用

    隨著數(shù)據(jù)中心的快速發(fā)展,對(duì)計(jì)算能力的需求也在不斷增長。PCIe(Peripheral Component Interconnect Express)加速卡作為一種高性能的計(jì)算設(shè)備,已經(jīng)在
    的頭像 發(fā)表于 11-06 09:32 ?229次閱讀

    Primemas選擇Achronix eFPGA技術(shù)用于Chiplet平臺(tái)

    高性能 FPGA 和嵌入式FPGAeFPGA) IP 的領(lǐng)導(dǎo)者 Achronix Semiconductor Corporation 和使用Chiplet 技術(shù)開發(fā)創(chuàng)新 SoC Hub
    的頭像 發(fā)表于 09-18 16:16 ?453次閱讀

    大模型向邊端側(cè)部署,AI加速卡朝高算力、小體積發(fā)展

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AI加速卡是專門用于處理人工智能應(yīng)用中的大量計(jì)算任務(wù)的模塊。它集成了高性能的計(jì)算核心和大量的內(nèi)存,旨在加速機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法的計(jì)算過程。當(dāng)前,AI
    的頭像 發(fā)表于 09-17 00:18 ?2894次閱讀

    EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速卡

    AI加速卡,通常也被稱為AI算力,是一種專為加速人工智能(AI)應(yīng)用和算法而設(shè)計(jì)的硬件設(shè)備。
    發(fā)表于 09-10 14:56 ?0次下載

    基于菲數(shù)科技FA728Q加速卡實(shí)現(xiàn)低時(shí)延LLT應(yīng)用

    菲數(shù)科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎(chǔ)設(shè)施開發(fā)高性能FPGA加速卡。
    的頭像 發(fā)表于 08-30 17:13 ?445次閱讀
    基于菲數(shù)科技FA728Q<b class='flag-5'>加速卡</b>實(shí)現(xiàn)低時(shí)延LLT應(yīng)用

    基于FPGA的實(shí)時(shí)邊緣檢測系統(tǒng)設(shè)計(jì),Sobel圖像邊緣檢測,FPGA圖像處理

    摘要 :本文設(shè)計(jì)了一種 基于 FPGA 的實(shí)時(shí)邊緣檢測系統(tǒng) ,使用OV5640 攝像頭模塊獲取實(shí)時(shí)的視頻圖像數(shù)據(jù),提取圖像邊緣信息并通過 VGA顯示。FPGA 內(nèi)部使用流水線設(shè)計(jì)和 并
    發(fā)表于 05-24 07:45

    借助全新 AMD Alveo? V80 計(jì)算加速卡釋放計(jì)算能力

    對(duì)于大規(guī)模數(shù)據(jù)處理,最佳性能不僅取決于原始計(jì)算能力,還取決于高存儲(chǔ)器帶寬。 因此,全新 AMD Alveo? V80 計(jì)算加速卡專為具有大型數(shù)據(jù)集的內(nèi)存受限型應(yīng)用而設(shè)計(jì),這些應(yīng)用需要 FPGA 硬件
    發(fā)表于 05-16 14:09 ?193次閱讀
    借助全新 AMD Alveo? V80 計(jì)算<b class='flag-5'>加速卡</b>釋放計(jì)算能力

    新型的FPGA器件將支持多樣化AI/ML創(chuàng)新進(jìn)程

    的來臨,而是包括GPU、FPGA和NPU等一眾數(shù)據(jù)處理加速器時(shí)代的來臨,就像GPU以更高的計(jì)算密度和能效勝出CPU一樣,各種加速器件在不同的AI/ML應(yīng)用或者細(xì)分市場中將各具優(yōu)勢,未來
    的頭像 發(fā)表于 04-02 15:25 ?296次閱讀
    新型的<b class='flag-5'>FPGA</b>器件將支持<b class='flag-5'>多樣化</b><b class='flag-5'>AI</b>/ML創(chuàng)新進(jìn)程

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開發(fā)者大會(huì)上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,標(biāo)志著英偉達(dá)在
    的頭像 發(fā)表于 03-20 11:38 ?1045次閱讀

    【國產(chǎn)FPGA+OMAPL138開發(fā)板體驗(yàn)】(原創(chuàng))5.FPGAAI加速源代碼

    使用硬件加速器來進(jìn)一步提升性能。我寫的這個(gè)簡化的代碼只是為了幫助理解FPGA如何可能參與AI計(jì)算的過程。在實(shí)際的FPGA AI
    發(fā)表于 02-12 16:18

    研華發(fā)布EAI-3100邊沿AI加速卡,搭載英特爾銳炫A370M移動(dòng)GPU

    據(jù)了解,EAI-3100邊緣AI加速卡是研華與英特爾緊密合作的工業(yè)級(jí)GPU圖形解決方案,面向于市場對(duì)于GPU和視覺AI性能不斷提升的需求。通過此舉,研華為構(gòu)建更為開放的
    的頭像 發(fā)表于 02-02 14:19 ?597次閱讀

    寧暢參與發(fā)布AI加速卡液冷設(shè)計(jì)白皮書

    近日,由寧暢參與起草的《基于標(biāo)準(zhǔn)PCIe接口的人工智能加速卡液冷設(shè)計(jì)》白皮書正式發(fā)布。該技術(shù)白皮書由開放計(jì)算標(biāo)準(zhǔn)工作委員會(huì)(OCTC)歸口,旨在為冷板式人工智能加速卡的設(shè)計(jì)提供重要指導(dǎo)。
    的頭像 發(fā)表于 01-09 11:28 ?721次閱讀

    瞬變對(duì)AI加速卡供電的影響

    ,尤其是在學(xué)習(xí)和推理時(shí)。這種需求不斷地將供電網(wǎng)絡(luò)的邊界推向前所未有的新水平。這些高密度工作負(fù)載變得愈加復(fù)雜,更高的瞬態(tài)需求推動(dòng)配電網(wǎng)絡(luò)的每個(gè)部分都必須高效運(yùn)行。AI加速卡嚴(yán)格的功耗要求對(duì)系統(tǒng)性能也有影響。本文將討論AI
    的頭像 發(fā)表于 12-01 18:10 ?376次閱讀
    瞬變對(duì)<b class='flag-5'>AI</b><b class='flag-5'>加速卡</b>供電的影響

    千億級(jí)遠(yuǎn)程醫(yī)療市場爆發(fā),互聯(lián)醫(yī)療設(shè)備如何應(yīng)對(duì)需求多樣化?

    千億級(jí)遠(yuǎn)程醫(yī)療市場爆發(fā),互聯(lián)醫(yī)療設(shè)備如何應(yīng)對(duì)需求多樣化
    的頭像 發(fā)表于 11-24 17:03 ?431次閱讀
    千億級(jí)遠(yuǎn)程醫(yī)療市場爆發(fā),互聯(lián)醫(yī)療設(shè)備如何<b class='flag-5'>應(yīng)對(duì)</b>需求<b class='flag-5'>多樣化</b>?

    國產(chǎn)FPGA簡介

    電子、AI、數(shù)據(jù)中心。 安路科技(上海) 核心技術(shù):全流程TD軟件系統(tǒng) 主要產(chǎn)品:高端PHOENIX(鳳凰)、中端EAGLE(獵鷹)、低端ELF(精靈)系列FPGA。 應(yīng)用方案:LED顯示屏、工業(yè)自動(dòng)
    發(fā)表于 11-20 16:20