0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在數(shù)據(jù)量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據(jù)舞臺中心

新思科技 ? 來源:新思科技 ? 作者:新思科技 ? 2021-04-02 09:33 ? 次閱讀

軟件一直是智能應(yīng)用領(lǐng)域的創(chuàng)新助推器,而硬件正迅速成為人工智能AI)領(lǐng)域的核心引擎。人臉識別、自動駕駛、虛擬輔助,以及眾多其他應(yīng)用都要依賴AI硬件。預(yù)計到2025年,AI的市場規(guī)模將達到650億美元。

神經(jīng)網(wǎng)絡(luò)等并行計算系統(tǒng)對于能夠處理海量數(shù)據(jù)并執(zhí)行自我迭代訓(xùn)練有著巨大的需求,硬件也因此成為這一領(lǐng)域的主導(dǎo)力量。在這個數(shù)據(jù)量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據(jù)了舞臺中心。

AI加速器具有如下眾多優(yōu)勢:

● 能效相較于通用型計算設(shè)備顯著提高

● 降低計算延遲以支持實時應(yīng)用

● 具備可擴展性,能夠取得性能速度改善,其程度甚至能與所用的內(nèi)核數(shù)達成線性擴展

● 異構(gòu)架構(gòu)支持系統(tǒng)容納多個專用處理器以執(zhí)行特定任務(wù)

AI加速器支持數(shù)據(jù)中心和邊緣

AI加速器主要在兩大領(lǐng)域發(fā)揮作用:數(shù)據(jù)中心和邊緣。現(xiàn)在的數(shù)據(jù)中心需要大規(guī)模的可拓展計算架構(gòu),尤其是那些可支持多達數(shù)千臺物理服務(wù)器和數(shù)百萬臺虛擬機的超大規(guī)模數(shù)據(jù)中心,對大規(guī)??蓴U展計算架構(gòu)的需求極為迫切,這一市場需求使得一些企業(yè)憑借加速AI工作負載這一業(yè)務(wù)發(fā)展壯大。例如,Cerebras為Cerebras CS-1深度學(xué)習(xí)系統(tǒng)創(chuàng)造了晶圓級引擎(WSE)。WSE面積為46,225mm2,擁有1.2 萬億個晶體管和40萬個經(jīng)過AI優(yōu)化的內(nèi)核,是迄今為止最大的芯片。WSE可提供更大的算力、存儲和通信帶寬,能夠支持AI研究達到前所未有的速度和規(guī)模。與之相對的是硬件基板面有限且節(jié)能至為關(guān)鍵的邊緣應(yīng)用。如果邊緣SoC內(nèi)部集成了AI加速器IP ,則它可以快速提供必要的智能功能從而支持各種應(yīng)用,例如智能手機或自動化工廠機器人中運行的交互式程序。對于在邊緣提供智能應(yīng)用,支持它們的 AI加速器必須經(jīng)過優(yōu)化,以具備諸如實時計算延遲、超高能效、失效安全運行以及高度可靠性等特征。

并不是所有AI應(yīng)用都需要像WSE這么大的芯片,例如以下類型的硬件AI加速器:

● 能夠執(zhí)行時間神經(jīng)網(wǎng)絡(luò)處理的圖形處理單元 (GPU

● Google張量處理單元 (TPU) 等空間加速器

● Sambanova的DataScale等粗粒度可重構(gòu)計算架構(gòu) (CGRA)

● 經(jīng)過向量處理擴展的大規(guī)模多核標量處理器

所有此類芯片均可以幾十個或幾百個組合使用,形成更大的系統(tǒng),處理更大型的神經(jīng)網(wǎng)絡(luò)。比如說,如果將Google的TPU合并到pod配置中,那么可以帶來超過100 petaFLOPS的處理能力來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。NVIDIA旗下應(yīng)用深度學(xué)習(xí)研究團隊推出的Megatron創(chuàng)造了一個帶有83億參數(shù)轉(zhuǎn)換器的語言模型,可提供8路模型并行和64路數(shù)據(jù)并行功能用于自然語言處理。要執(zhí)行這一模型,就必須開發(fā)出具有 312 teraFLOP FP16計算能力的NVIDIA A100 GPU。另一種新興的硬件類型是 CGRA,它能在編程不同網(wǎng)絡(luò)時,在性能、能效與靈活性方面巧妙地實現(xiàn)權(quán)衡。

在這場關(guān)于AI硬件的討論中,軟件棧是不容忽視的存在,因為它能實現(xiàn)系統(tǒng)級性能表現(xiàn),并確保充分利用硬件。TensorFlow等開源軟件平臺為開發(fā)人員提供各類工具、庫和其他資源,幫助他們輕松構(gòu)建和部署機器學(xué)習(xí)應(yīng)用。Facebook Glow等機器學(xué)習(xí)編譯器不斷涌現(xiàn),有助于促成高級軟件框架與各種AI加速器的連接。

種類全面的AI設(shè)計產(chǎn)品組合

硬件已經(jīng)成為AI應(yīng)用的關(guān)鍵組件,但此類組件仍然面臨特有的設(shè)計難題,在云和邊緣應(yīng)用想要突破當前硅技術(shù)的功耗、性能和面積(PPA)極限時尤其如此。對數(shù)據(jù)中心來說,件設(shè)計呈現(xiàn)多級物理分層、局部同步和全局異步架構(gòu)、尺寸龐大和布局分散等特征。在邊緣應(yīng)用中, AI設(shè)計必須能夠處理數(shù)以百計的設(shè)計角,以滿足超低功耗要求,實現(xiàn)異構(gòu)集成并具備超乎尋常的多變性。

新思科技能夠為AI硬件設(shè)計人員提供業(yè)內(nèi)最為全面的AI設(shè)計產(chǎn)品組合,幫助他們攻克此類難題。我們的產(chǎn)品,以邊緣設(shè)備IP、Zebu Server 4仿真系統(tǒng),全面輻射整個范圍,并能快速將載復(fù)雜的工作負載引入到Fusion Design Platform,實現(xiàn)全流程的、且經(jīng)AI改進結(jié)果質(zhì)量(QoR)和結(jié)果轉(zhuǎn)化時間(TTR)的IC設(shè)計。

新思科技還推出DSO.ai(設(shè)計空間優(yōu)化AI),這是業(yè)內(nèi)首款針對芯片設(shè)計的自主AI應(yīng)用。DSO.ai 在非常大的芯片設(shè)計解決方案范圍內(nèi)尋找優(yōu)化目標。它減少了設(shè)計工作流中自動執(zhí)行的間接決策,從而大幅加快了專用AI加速器的設(shè)計進度。

隨著AI應(yīng)用更加深入地融入我們的生活,AI加速器等硬件將會繼續(xù)發(fā)揮關(guān)鍵作用,實現(xiàn)實時響應(yīng),為智能設(shè)備和系統(tǒng)創(chuàng)造更大價值。

原文標題:AI加速器,實現(xiàn)人工智能創(chuàng)新的核心引擎

文章出處:【微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    790

    瀏覽量

    37690
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268154
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46698

    瀏覽量

    237190

原文標題:AI加速器,實現(xiàn)人工智能創(chuàng)新的核心引擎

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    PCIe加速卡在數(shù)據(jù)中心的應(yīng)用

    隨著數(shù)據(jù)中心的快速發(fā)展,對計算能力的需求也在不斷增長。PCIe(Peripheral Component Interconnect Express)加速卡作為一種高性能的計算設(shè)備,已經(jīng)在數(shù)據(jù)中心
    的頭像 發(fā)表于 11-06 09:32 ?229次閱讀

    適用于數(shù)據(jù)中心應(yīng)用硬件加速器的直流/直流轉(zhuǎn)換解決方案

    電子發(fā)燒友網(wǎng)站提供《適用于數(shù)據(jù)中心應(yīng)用硬件加速器的直流/直流轉(zhuǎn)換解決方案.pdf》資料免費下載
    發(fā)表于 08-26 09:38 ?0次下載
    適用于<b class='flag-5'>數(shù)據(jù)中心</b>應(yīng)用<b class='flag-5'>中</b>的<b class='flag-5'>硬件加速器</b>的直流/直流轉(zhuǎn)換<b class='flag-5'>器</b>解決方案

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI更快的嵌入處理

    電子發(fā)燒友網(wǎng)站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統(tǒng)高級AI
    發(fā)表于 08-15 11:06 ?0次下載
    下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b><b class='flag-5'>系統(tǒng)</b>高級<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的頭像 發(fā)表于 06-21 11:54 ?714次閱讀

    西門子推出Catapult AI NN:重塑神經(jīng)網(wǎng)絡(luò)加速器設(shè)計的未來

    的需求,西門子數(shù)字化工業(yè)軟件日前推出了一款名為Catapult AI NN的創(chuàng)新軟件,旨在幫助神經(jīng)網(wǎng)絡(luò)加速器在專用集成電路(ASIC)和芯片級系統(tǒng)(SoC)上實現(xiàn)更高效的高層次綜合(HLS)。
    的頭像 發(fā)表于 06-19 16:40 ?628次閱讀

    八大科技巨頭攜手推進UALink,加速數(shù)據(jù)中心AI互聯(lián)

    近日,英特爾、Google、微軟、Meta八家科技巨頭宣布共同成立超加速器鏈接(UALink)推廣小組,致力于推動數(shù)據(jù)中心內(nèi)AI加速器芯片
    的頭像 發(fā)表于 05-31 10:59 ?776次閱讀

    美國限制向中東AI加速器出口,審查國家安全

    AI加速器能協(xié)助數(shù)據(jù)中心處理大量人工智能聊天機器人和其他工具的開發(fā)信息。如今,它們已然成為構(gòu)建AI基礎(chǔ)設(shè)施的企業(yè)和政府的必需品。
    的頭像 發(fā)表于 05-31 09:20 ?510次閱讀

    家居智能化,推動AI加速器的發(fā)展

    提高了系統(tǒng)的運算能力和數(shù)據(jù)處理能力,還為用戶帶來了更加智能化、個性化的生活體驗。 ? AI 加速器的發(fā)展 ? 在人工智能和機器學(xué)習(xí)任務(wù)變得日益復(fù)雜和密集之前,傳統(tǒng)的CPU和GPU已經(jīng)足
    的頭像 發(fā)表于 02-23 00:18 ?4512次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場的運動。本文將詳細介紹回旋加速器
    的頭像 發(fā)表于 01-30 10:02 ?3470次閱讀

    數(shù)據(jù)處理器:DPU編程入門》讀書筆記

    關(guān)注計算能力的提升,通信基礎(chǔ)設(shè)施的提升跟不上,那么數(shù)據(jù)中心的整體系統(tǒng)性能依然受限,無法發(fā)揮出真正的潛力。DPU的提出背景就是應(yīng)對這些數(shù)據(jù)量和復(fù)雜性的指數(shù)級增長。未來,需要將計算移至接近數(shù)據(jù)
    發(fā)表于 12-21 10:47

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實驗設(shè)備,用于研究粒子物理學(xué)、核物理學(xué)領(lǐng)域。其主要原理是通過電場和磁場的作用,對帶電粒子進行
    的頭像 發(fā)表于 12-18 13:52 ?1942次閱讀

    在CCES環(huán)境下如何使用21489的IIR加速器?

    在VDSP++的環(huán)境下程序已經(jīng)實現(xiàn),但是到了CCES下,把中斷初始化函數(shù)修改了,還是無法正確配置中斷,直接返回IIR的中斷初始化失敗,請問CCES下怎么使用IIR加速器?
    發(fā)表于 11-30 08:20

    PCIe在AI加速器的作用

    從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI加速器。AI加速器是一種高性能的并行計算設(shè)備,旨在高效處理神經(jīng)
    的頭像 發(fā)表于 11-18 10:36 ?2003次閱讀
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b><b class='flag-5'>中</b>的作用

    如何處理cache miss問題以提高加速器效率呢?

    帶寬是影響FPGA加速器的重要因素,因為大量的并行計算對數(shù)據(jù)量要求很大。
    的頭像 發(fā)表于 11-16 16:36 ?1362次閱讀
    如何處理cache miss問題以提高<b class='flag-5'>加速器</b>效率呢?

    數(shù)據(jù)中心為什么要部署FPGA?

    FPGA 芯片在數(shù)據(jù)中心領(lǐng)域主要用于硬件加速,在云服務(wù)廠商已有廣泛部署。數(shù)據(jù)中心使用 FPGA 芯片代替?zhèn)鹘y(tǒng)的 CPU 方案后,處理其自
    發(fā)表于 11-16 09:55 ?765次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>為什么要部署FPGA?