0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于FPGA的異構(gòu)計(jì)算是趨勢(shì)

SwM2_ChinaAET ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-25 09:17 ? 次閱讀

算起來(lái),人工智能AI)概念已經(jīng)提出60多年了,而最近兩年,得益于智能終端的普及帶來(lái)的數(shù)據(jù)爆發(fā)式增長(zhǎng),以及深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)算法的發(fā)展,AI市場(chǎng)受到了空前的關(guān)注,但AI要得以快速普及,還缺少高算力的推動(dòng),需要提供更好的硬件加速條件。

2018年4月17日,業(yè)界領(lǐng)先的異構(gòu)加速和業(yè)務(wù)卸載方案提供商杭州加速云信息技術(shù)有限公司在京舉辦了科技峰會(huì)及新產(chǎn)品發(fā)布會(huì),隆重發(fā)布了四大創(chuàng)新產(chǎn)品(兩個(gè)系列硬件加速產(chǎn)品(SC-OPS, SC-VPX)、兩個(gè)IP庫(kù) (FDNN, FBLAS))及三大解決方案(深度學(xué)習(xí)解決方案、高性能計(jì)算及數(shù)字信號(hào)處理解決方案、邊緣計(jì)算解決方案)。

搶先布局異構(gòu)計(jì)算

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO鄔剛是學(xué)習(xí)通信出身,最早跟隨中國(guó)程控電話交換機(jī)之父鄔江興院士進(jìn)入通信行業(yè)。兩年之后,他加入了華為負(fù)責(zé)芯片設(shè)計(jì)。2007年開(kāi)始創(chuàng)業(yè),創(chuàng)辦過(guò)3家公司,對(duì)CPU總線、多核處理器的發(fā)展有著清晰的理解。經(jīng)過(guò)多年的積累和對(duì)未來(lái)市場(chǎng)的預(yù)估,2015年9月,鄔剛先生創(chuàng)辦了加速云。

杭州加速云信息技術(shù)有限公司創(chuàng)始人兼CEO 鄔剛

加速云的解決方案可以廣泛應(yīng)用于深度學(xué)習(xí)、人工智能、金融、機(jī)器視覺(jué)等領(lǐng)域。目前已與阿里、騰訊、科大訊飛等多家企業(yè)開(kāi)展深入合作。

“加速云是從技術(shù)上推導(dǎo)出來(lái)的一家公司,起源于2014年我們家迎來(lái)第一個(gè)小朋友,在陪產(chǎn)過(guò)程中形成的一個(gè)想法?!?鄔剛先生提及創(chuàng)辦加速云的心路歷程,“在2014年,按照英特爾的發(fā)展,下一步一定是異構(gòu),我們當(dāng)時(shí)認(rèn)為異構(gòu),要么用GPU,要么用FPGA。英特爾在GPU上有一次失敗嘗試,加上GPU自身功耗太高等問(wèn)題,F(xiàn)PGA會(huì)是異構(gòu)計(jì)算的一個(gè)理想選擇。”

事實(shí)上,在加速云誕生之初已經(jīng)擁有強(qiáng)大的技術(shù)儲(chǔ)備。基于FPGA來(lái)做異構(gòu)計(jì)算是鄔剛先生2014年4月就想出來(lái)的計(jì)劃,直等到2014年10月英特爾在IDF大會(huì)上宣布x86+FPGA處理器,他認(rèn)為這個(gè)機(jī)會(huì)點(diǎn)來(lái)了,11月份正式開(kāi)始研究,到2015年4月,研發(fā)出了第一代原型機(jī),2015年9月開(kāi)始量產(chǎn),加速云公司隨之注冊(cè)。

在深度學(xué)習(xí)中,做好算法只完成了1/3,在這個(gè)團(tuán)隊(duì)里面,既需要很強(qiáng)的實(shí)現(xiàn)算法的能力,還要有非常強(qiáng)的工程化能力,這種工程化的能力,包括接口和實(shí)現(xiàn)量產(chǎn)的能力。“我們知道做出一個(gè)東西很容易,但是做好還是挺難的。我們有一個(gè)非常小的板卡,迭代了四代,每一次迭代都要花百萬(wàn)人民幣,因?yàn)橛布度牒艽螅看蔚锌赡苤桓牧艘稽c(diǎn),我們發(fā)現(xiàn)未來(lái)可能存在的一些風(fēng)險(xiǎn)問(wèn)題,就把它改掉,這是我們團(tuán)隊(duì)特別的地方。我們是一個(gè)工程化能力非常強(qiáng)的團(tuán)隊(duì),整體技術(shù)行不行是我們最重要的考量?!?鄔剛先生介紹。

基于FPGA的異構(gòu)計(jì)算是趨勢(shì)

目前處于AI大爆發(fā)時(shí)期,異構(gòu)計(jì)算的選擇主要在FPGA和GPU之間。盡管目前異構(gòu)計(jì)算使用最多的是利用GPU來(lái)加速,F(xiàn)PGA作為一種高性能、低功耗的可編程芯片,在處理海量數(shù)據(jù)時(shí),F(xiàn)PGA計(jì)算效率更高,優(yōu)勢(shì)更為突出,尤其在大量服務(wù)器部署時(shí),隱形的運(yùn)營(yíng)成本會(huì)得到顯著降低。

此外,低延遲、確定性延遲,也是FPGA天然的優(yōu)勢(shì)。

鄔剛表示:“人工智能已經(jīng)進(jìn)入我們的生活,但是未來(lái)發(fā)展還存在瓶頸,需要硬件技術(shù)和算法方面的突破。異構(gòu)計(jì)算是計(jì)算架構(gòu)的未來(lái)趨勢(shì),而FPGA 是實(shí)現(xiàn)異構(gòu)計(jì)算的完美選擇。加速云創(chuàng)新的異構(gòu)計(jì)算加速平臺(tái)解決方案,具有高性能、高效率、低延時(shí)特性以及可編程性和遠(yuǎn)程可重構(gòu)能力,非常適合云上的彈性業(yè)務(wù)的需求。我們希望能夠通過(guò)我們的技術(shù),幫助更多的企業(yè)實(shí)現(xiàn)深度學(xué)習(xí),在大數(shù)據(jù)時(shí)代贏得先機(jī)?!?/p>

全球最高性能FPGA加速卡

SC-OPS是加速云推出的全球首張Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工藝的Stratix10 GX2800 FPGA器件,單板支持12個(gè)200維雙精度線性方程求解,運(yùn)算時(shí)間為466us,為x86系統(tǒng)60~120倍性能;單卡可以實(shí)現(xiàn)4500幀/S以上圖像分類(lèi)(采用AlexNet卷積神經(jīng)網(wǎng)絡(luò)模型,int16)。

SC-OPS可以廣泛應(yīng)用于數(shù)據(jù)中心、云計(jì)算、機(jī)器視覺(jué)、深度學(xué)習(xí)、高性能計(jì)算、仿真、金融等領(lǐng)域。

全球最高集成度VPX業(yè)務(wù)卡

SC-VPX是全球計(jì)算密度最高的VPX刀片加速平臺(tái),采用Intel Stratix 10 GX2800器件,兼容GX1650,構(gòu)造業(yè)界先進(jìn)、靈活、高效的信號(hào)處理和深度學(xué)習(xí)架構(gòu),主要定位高校研究所等單位的雷達(dá)、通信、深度學(xué)習(xí)相關(guān)領(lǐng)域的產(chǎn)品原型快速搭建和算法開(kāi)發(fā)與應(yīng)用。

6U整機(jī)可以支持92T/50T FLOPS單精度浮點(diǎn)處理能力,整機(jī)可以通過(guò)交換板互聯(lián)構(gòu)筑更大的系統(tǒng);支持OpenCL、Verilog開(kāi)發(fā),支持高性能計(jì)算庫(kù)。

RTL級(jí)深度學(xué)習(xí)加速庫(kù)

深度學(xué)習(xí)加速庫(kù)FDNN是國(guó)內(nèi)首個(gè)支持通用卷積神經(jīng)網(wǎng)絡(luò)的FPGA加速庫(kù),基于RTL級(jí)代碼,可以提供很高的性能和靈活配置特性。

參數(shù)可配置的深度學(xué)習(xí)基礎(chǔ)庫(kù):卷積、池化、全連接、非線性函數(shù);兼容CAFFE/TensorFlow模型數(shù)據(jù);常見(jiàn)各種模型:VGG16, Lenet, YOLO, SSD, ResNet。

RTL級(jí)高性能數(shù)學(xué)加速庫(kù)

高性能計(jì)算加速庫(kù)FBLAS是業(yè)界更高性能的RTL級(jí)數(shù)學(xué)加速庫(kù)。參數(shù)可配的OpenBlas庫(kù)Level2/3:矩陣乘、矩陣分解、矩陣求逆,線性方程求解、微分方程求解,三角函數(shù)、非線性求解、超越函數(shù),傅里葉變換。

FDNN是專(zhuān)門(mén)為深度學(xué)習(xí)設(shè)計(jì)的,F(xiàn)BLAS更多是偏向于數(shù)字信號(hào)處理和高性能計(jì)算。

三大解決方案

?深度學(xué)習(xí)加速解決方案-加速云推出一整套基于FPGA的深度學(xué)習(xí)加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫(kù),滿足客戶對(duì)深度學(xué)習(xí)高性能、靈活性加速要求。為了方便客戶使用高層語(yǔ)言開(kāi)發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,快速實(shí)現(xiàn)用戶自定義的深度學(xué)習(xí)加速方案。同時(shí)加速云也提供快速深度神經(jīng)網(wǎng)絡(luò)定制加速服務(wù)。

?數(shù)字信號(hào)處理解決方案-針對(duì)雷達(dá)、通信等數(shù)字信號(hào)處理系統(tǒng)的要求,結(jié)合Intel最新14nm工藝的 Stratix10 FPGA系列,加速云提供了一套完整的硬件和軟件相結(jié)合的解決方案,實(shí)現(xiàn)了高性能矩陣運(yùn)算(矩陣乘、轉(zhuǎn)置、求逆、QR分解)和超高速FFT(傅立葉變換)。為了方便客戶使用高層語(yǔ)言開(kāi)發(fā),加速云提供基于FPGA完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,快速實(shí)現(xiàn)用戶自定義的信號(hào)處理加速方案。

?邊緣計(jì)算解決方案-加速云智能工控解決方案采用高性能Intel Arria10 GX660器件, 具有模塊化設(shè)計(jì),強(qiáng)實(shí)時(shí)特性和高性能的算法IP加速、完整的OpenCL異構(gòu)開(kāi)發(fā)環(huán)境,可以實(shí)現(xiàn)新一代高性能邊緣計(jì)算網(wǎng)關(guān),應(yīng)用于各種工業(yè)環(huán)境。

加速云最核心的競(jìng)爭(zhēng)力在于其IP方面,除了用于數(shù)字信號(hào)處理和高性能計(jì)算的數(shù)學(xué)庫(kù)FBLAS,以及用于深度學(xué)習(xí)的FDNN庫(kù),還具有很多接口類(lèi)的IP(高速通信接口、視頻接口)、協(xié)議類(lèi)IP(壓縮、解壓縮、加解密),研發(fā)團(tuán)隊(duì)在FPGA方面有著十多年的經(jīng)驗(yàn),積累了很多相關(guān)的IP。

憑借自身在FPGA上的技術(shù)優(yōu)勢(shì),加速云獲得合作伙伴的大力支持,可以率先拿到英特爾第一批流片的內(nèi)部測(cè)試芯片,對(duì)加速云保持技術(shù)領(lǐng)先非常重要。

北京站是加速云“加速新科技,驅(qū)動(dòng)智未來(lái)” 科技峰會(huì)的首站,接下來(lái)加速云將在上海、成都、西安三大城市分享其最新成果。過(guò)去兩年,加速云平均每年都有獲得一次融資,據(jù)悉,第三輪融資正在達(dá)成。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1620

    文章

    21510

    瀏覽量

    598884
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46060

    瀏覽量

    234961
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5422

    瀏覽量

    120588

原文標(biāo)題:【市場(chǎng)觀察】異構(gòu)看好FPGA 加速云要為AI高算力加速

文章出處:【微信號(hào):ChinaAET,微信公眾號(hào):電子技術(shù)應(yīng)用ChinaAET】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    澎峰科技高性能計(jì)算庫(kù)PerfIPP介紹

    PerfIPP是專(zhuān)為計(jì)算機(jī)視覺(jué)處理和信號(hào)處理設(shè)計(jì)的優(yōu)化計(jì)算庫(kù),計(jì)算驅(qū)動(dòng)層基于OpenCL標(biāo)準(zhǔn),支持異構(gòu)計(jì)算加速。
    的頭像 發(fā)表于 09-02 17:39 ?251次閱讀
    澎峰科技高性能<b class='flag-5'>計(jì)算</b>庫(kù)PerfIPP介紹

    淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景

    關(guān)于國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢(shì)和應(yīng)用場(chǎng)景淺談如下: 優(yōu)勢(shì) 異構(gòu)計(jì)算能力 : 異構(gòu)雙核設(shè)計(jì)結(jié)合了RISC-V的高效指令集和
    發(fā)表于 08-31 08:32

    打造異構(gòu)計(jì)算新標(biāo)桿!國(guó)數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

    參考設(shè)計(jì)是首個(gè)支持異構(gòu)計(jì)算架構(gòu)的CXL硬件設(shè)備,標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來(lái)異構(gòu)計(jì)算新階段。 ? 國(guó)數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性,可實(shí)現(xiàn)CPU、GPU、DDR、SSD
    的頭像 發(fā)表于 08-06 14:19 ?200次閱讀
    打造<b class='flag-5'>異構(gòu)計(jì)算</b>新標(biāo)桿!國(guó)數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計(jì)

    AvaotaA1全志T527開(kāi)發(fā)板AMP異構(gòu)計(jì)算簡(jiǎn)介

    Avaota SBC 的部分平臺(tái)內(nèi)具有小核心 CPU,與大核心一起組成了異構(gòu)計(jì)算的功能。 在異構(gòu)多處理系統(tǒng)中,主核心和輔助核心的存在旨在共同協(xié)作,以實(shí)現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一系列
    發(fā)表于 07-24 09:54

    異構(gòu)計(jì)算:解鎖算力潛能的新途徑

    范式,智慧地解鎖了計(jì)算潛能的新境界。異構(gòu)計(jì)算:多元并蓄的智慧之選首先,讓我們揭開(kāi)異構(gòu)計(jì)算的神秘面紗。簡(jiǎn)單來(lái)說(shuō),異構(gòu)計(jì)算是指將不同類(lèi)型的計(jì)算
    的頭像 發(fā)表于 07-18 08:28 ?7266次閱讀
    <b class='flag-5'>異構(gòu)計(jì)算</b>:解鎖算力潛能的新途徑

    AI服務(wù)器異構(gòu)計(jì)算深度解讀

    AI服務(wù)器按芯片類(lèi)型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國(guó)內(nèi)的主要選擇(占比91.9%)。
    發(fā)表于 04-12 12:27 ?448次閱讀
    AI服務(wù)器<b class='flag-5'>異構(gòu)計(jì)算</b>深度解讀

    FPGA異構(gòu)計(jì)算架構(gòu)的深度對(duì)比研究

    FPGA本質(zhì)是一種可編程的芯片。可以把硬件設(shè)計(jì)重復(fù)燒寫(xiě)在它的可編程存儲(chǔ)器里,從而使FPGA芯片可以執(zhí)行不同的硬件設(shè)計(jì)和功能。
    發(fā)表于 04-01 14:53 ?475次閱讀
    <b class='flag-5'>FPGA</b><b class='flag-5'>異構(gòu)計(jì)算</b>架構(gòu)的深度對(duì)比研究

    高通NPU和異構(gòu)計(jì)算提升生成式AI性能?

    異構(gòu)計(jì)算的重要性不可忽視。根據(jù)生成式AI的獨(dú)特需求和計(jì)算負(fù)擔(dān),需要配備不同的處理器,如專(zhuān)注于AI工作負(fù)載的定制設(shè)計(jì)的NPU、CPU和GPU。
    的頭像 發(fā)表于 03-06 14:15 ?575次閱讀

    LTM4620給fpga提供1.0V內(nèi)核電源,4620輸出電容量計(jì)算是否應(yīng)該包含布局在fpga芯片附近的bulk電容?

    LTM4620給fpga提供1.0V內(nèi)核電源,4620輸出電容量計(jì)算是否應(yīng)該包含布局在fpga芯片附近的bulk電容? 靠近FPGA布局的電容也比較大,比如470uF。但這些電容隔46
    發(fā)表于 01-05 06:01

    燧原科技與青云科技達(dá)成戰(zhàn)略合作,創(chuàng)新異構(gòu)算力調(diào)度

    ,AIGC內(nèi)容生成類(lèi)模型正在重構(gòu)互聯(lián)網(wǎng)商業(yè)模式,催生數(shù)字經(jīng)濟(jì)新突破。隨著計(jì)算任務(wù)的多樣化和復(fù)雜化,更為高效和靈活的異構(gòu)計(jì)算是未來(lái)的發(fā)展方向。燧原的“云燧智算集群”與青云AI算力平臺(tái)的深度適配,可以更好支持異構(gòu)算力的高效融合及靈活
    的頭像 發(fā)表于 12-11 12:20 ?495次閱讀

    科學(xué)計(jì)算與Julia技術(shù)研討會(huì) | 張先軼:從OpenBLAS到異構(gòu)計(jì)算軟件棧

    蓬勃發(fā)展,新興科學(xué)計(jì)算語(yǔ)言不斷涌現(xiàn),Julia以其高性能、動(dòng)態(tài)性成為其中的佼佼者。 12月9日上午1020 ,澎峰科技創(chuàng)始人 張先軼博士 將 在 主論壇:Julia與數(shù)字化和AI 上 作 “ 從OpenBLAS到異構(gòu)計(jì)算軟件棧” 主題演講,期待與大家見(jiàn)面 ! 研討會(huì)完整詳
    的頭像 發(fā)表于 11-30 19:35 ?593次閱讀
    科學(xué)<b class='flag-5'>計(jì)算</b>與Julia技術(shù)研討會(huì) | 張先軼:從OpenBLAS到<b class='flag-5'>異構(gòu)計(jì)算</b>軟件棧

    什么是異構(gòu)集成?什么是異構(gòu)計(jì)算?異構(gòu)集成、異構(gòu)計(jì)算的關(guān)系?

    異構(gòu)集成主要指將多個(gè)不同工藝節(jié)點(diǎn)單獨(dú)制造的芯片封裝到一個(gè)封裝內(nèi)部,以增強(qiáng)功能性和提高性能。
    的頭像 發(fā)表于 11-27 10:22 ?5804次閱讀
    什么是<b class='flag-5'>異構(gòu)</b>集成?什么是<b class='flag-5'>異構(gòu)計(jì)算</b>?<b class='flag-5'>異構(gòu)</b>集成、<b class='flag-5'>異構(gòu)計(jì)算</b>的關(guān)系?

    國(guó)產(chǎn)FPGA簡(jiǎn)介

    、智能汽車(chē)、電子設(shè)備、電力與電源管理、人工智能。 目標(biāo)市場(chǎng):金融、電信、政務(wù)、汽車(chē)、工業(yè)互聯(lián)、物聯(lián)網(wǎng)等領(lǐng)域。 京微齊力 核心技術(shù):AiPGA芯片(AI in FPGA)、異構(gòu)計(jì)算HPA芯片
    發(fā)表于 11-20 16:20

    異構(gòu)計(jì)算為什么會(huì)異軍突起?基于FPGA異構(gòu)計(jì)算討論

    簡(jiǎn)單的介紹幾個(gè)概念,同道中人可以忽略這一段。云計(jì)算取代傳統(tǒng)IT基礎(chǔ)設(shè)施已經(jīng)基本成為業(yè)界共識(shí)和不可阻擋的趨勢(shì)
    發(fā)表于 10-26 10:04 ?586次閱讀
    <b class='flag-5'>異構(gòu)計(jì)算</b>為什么會(huì)異軍突起?基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>異構(gòu)計(jì)算</b>討論

    異構(gòu)時(shí)代:CPU與GPU的發(fā)展演變

    異構(gòu)計(jì)算是指在一個(gè)系統(tǒng)中使用不同類(lèi)型的處理器來(lái)執(zhí)行不同的計(jì)算任務(wù),以提高性能,效率和可靠性。隨著摩爾定律的放緩,單一類(lèi)型的處理器已經(jīng)難以滿足日益增長(zhǎng)的運(yùn)算需求。與此同時(shí),不同類(lèi)型的處理器具有各自
    的頭像 發(fā)表于 10-24 10:17 ?1160次閱讀
    <b class='flag-5'>異構(gòu)</b>時(shí)代:CPU與GPU的發(fā)展演變