0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾面向中國(guó)市場(chǎng)發(fā)布Gaudi2處理器,加速大模型訓(xùn)練和推理

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-07-17 00:01 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,英特爾AI產(chǎn)品戰(zhàn)略暨Gaudi2新品發(fā)布會(huì)在京舉行。會(huì)上,英特爾正式于中國(guó)市場(chǎng)推出第二代Gaudi深度學(xué)習(xí)加速器——HabanaGaudi2。英特爾在中國(guó)市場(chǎng)推出的Gaudi2AI加速器,將通過其合作伙伴浪潮提供給中國(guó)客戶。

Gaudi2在訓(xùn)練和推理上的出色表現(xiàn)

英特爾此次推出的Gaudi2深度學(xué)習(xí)加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),以多方位性能與能效比提升,加速高性能大語(yǔ)言模型運(yùn)行。該加速器具備:

24個(gè)可編程Tensor處理器核心(TPCs)

21個(gè)100Gbps(RoCEv2)以太網(wǎng)接口

96GBHBM2E內(nèi)存容量

2.4TB/秒的總內(nèi)存帶寬

48MB片上SRAM

集成多媒體處理引擎。

相比于國(guó)際版本,面向中國(guó)市場(chǎng)的Gaudi2每張芯片集成的專用于內(nèi)部互聯(lián)的100Gbps(RoCEv2RDMA)以太網(wǎng)接口,從24個(gè)減至21個(gè)。

英特爾HabanaLabs首席運(yùn)營(yíng)官EltanMedina對(duì)媒體表示,根據(jù)模型的不同,特供版Gaudi2性能會(huì)有輕微的影響,但在很多數(shù)據(jù)訓(xùn)練擴(kuò)展中,并不是用這三個(gè)端口,整體性能差別不大。

根據(jù)英特爾的展示,相比于上一代產(chǎn)品,在ResNet-50模型測(cè)試中,Gaudi2訓(xùn)練吞吐量提高了3倍,BERT模型的訓(xùn)練吞吐量提高了4.7倍。目前,單個(gè)Gaudi2在ResNet-50模型可達(dá)到非常穩(wěn)定的5800個(gè)圖像/每秒的吞吐量。

英偉達(dá)相比,Gaudi2運(yùn)行ResNet-50的每瓦性能約是英偉達(dá)A100的2倍,性價(jià)比相較于AWS云中基于英偉達(dá)的解決方案高出40%。英特爾表示,接下來到9月,采用FP8軟件的Gaudi2預(yù)計(jì)能夠提供比H100更高的性價(jià)比。

根據(jù)此前的報(bào)道,在測(cè)試GPT-3方面,Gaudi2也表現(xiàn)出了強(qiáng)勁性能,384個(gè)加速器上的訓(xùn)練時(shí)間為311分鐘,從256個(gè)加速器到384個(gè)加速器實(shí)現(xiàn)近線性95%的擴(kuò)展效果。

Gaudi2在大規(guī)模的多模態(tài)和語(yǔ)言模型的推理方面也表現(xiàn)出色。HuggingFace評(píng)估中,Gaudi2在運(yùn)行StableDiffusion、70億以及1760億參數(shù)BLOOMz模型時(shí),在行業(yè)內(nèi)都保持領(lǐng)先水平。

英特爾在AI領(lǐng)域的布局

AI計(jì)算包括訓(xùn)練和推理,目前而言,在訓(xùn)練方面,英偉達(dá)的GPU長(zhǎng)期占據(jù)主導(dǎo)地位。近段時(shí)間,大模型的熱潮四起,英偉達(dá)的GPU明顯供不應(yīng)求。這讓AMD、英特爾以及一些AI芯片初創(chuàng)企業(yè)看到了新的機(jī)會(huì)。

事實(shí)上英特爾在AI領(lǐng)域早有布局。2019年12月,英特爾斥資約20億美元重金收購(gòu)了成立于2016年的以色列人工智能(AI)芯片初創(chuàng)企業(yè)HabanaLabs。在此之前,英特爾還收購(gòu)了FPGA廠商Altera、AI芯片公司Nervana。

在收購(gòu)HabanaLabs后的幾年中,英特爾加緊使Habana團(tuán)隊(duì)與英特爾內(nèi)部業(yè)務(wù)整合。在2022年IntelVision活動(dòng)上,英特爾推出第二代深度學(xué)習(xí)芯片HabanaGaudi2和HabanaGreco,分別用于AI訓(xùn)練和AI推理。也就是說,英特爾此次面向中國(guó)市場(chǎng)推出的新Gaudi2,也是在此前收購(gòu)了HabanaLabs的基礎(chǔ)上完成的。

面向AI領(lǐng)域的應(yīng)用,英特爾有全面的芯片組合,包括CPU、GPU、FPGA、AI專用芯片等。英特爾公司執(zhí)行副總裁數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理SandraRivera表示,Gaudi2作為用于AI加速的專用處理器,是英特爾產(chǎn)品組合適用于大模型負(fù)載中,性能最優(yōu)的產(chǎn)品。

除了硬件方面,英特爾也非常注重在軟件方面的優(yōu)化,SandraRivera表示,英特爾致力于通過客戶提供廣泛的硬件選擇,并支持開放的軟件環(huán)境,加速人工智能技術(shù)的發(fā)展。

據(jù)英特爾介紹,為支持客戶輕松構(gòu)建模型,或?qū)?dāng)前基于GPU的模型業(yè)務(wù)和系統(tǒng)遷移到基于全新Gaudi2服務(wù)器,并幫助保護(hù)軟件開發(fā)投入,SynapseAI軟件套件針對(duì)Gaudi平臺(tái)深度學(xué)習(xí)業(yè)務(wù)進(jìn)行了優(yōu)化,旨在與廣泛的軟件生態(tài)系統(tǒng)一起,幫助簡(jiǎn)化模型的開發(fā)和遷移。

SynapseAI集成了對(duì)TensorFlow和PyTorch框架的支持,并提供眾多流行的計(jì)算機(jī)視覺和自然語(yǔ)言參考模型,能夠滿足深度學(xué)習(xí)開發(fā)者的多樣化需求。

對(duì)于英特爾來說,中國(guó)是一個(gè)很重要的市場(chǎng),根據(jù)2022年數(shù)據(jù),英特爾在中國(guó)的營(yíng)收占到總營(yíng)收的27%。如今中國(guó)的大模型發(fā)展如火如荼,而英偉達(dá)的A100/H100在中國(guó)禁售,特供版的A800/H800也需要獲得許可才能出售。這對(duì)于英特爾來說,是一個(gè)很好的機(jī)會(huì)。

據(jù)悉,目前英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器NF5698G7,該服務(wù)器集成8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強(qiáng)可擴(kuò)展處理器。此外,新華三、超聚變等公司,預(yù)計(jì)也將推出搭載Gaudi2的服務(wù)器。

小結(jié)

算力是AI大模型發(fā)展的重要基礎(chǔ),而AI芯片又是提供算力的重要組成部分。無(wú)論是訓(xùn)練還是推理,未來隨著大模型的不斷推進(jìn)及應(yīng)用落地,AI芯片的市場(chǎng)需求都將會(huì)持續(xù)上升。在英偉達(dá)一家獨(dú)大的情況下,英特爾等廠商競(jìng)爭(zhēng)力的不斷提升,對(duì)整個(gè)產(chǎn)業(yè)的發(fā)展也更為有利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    18924

    瀏覽量

    227205
  • 英特爾
    +關(guān)注

    關(guān)注

    60

    文章

    9747

    瀏覽量

    170640
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1828

    瀏覽量

    34663
  • Gaudi2
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    87
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    開箱即用,AISBench測(cè)試展示英特爾至強(qiáng)處理器的卓越推理性能

    。 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院賽西實(shí)驗(yàn)室依據(jù)國(guó)家標(biāo)準(zhǔn)《人工智能服務(wù)系統(tǒng)性能測(cè)試規(guī)范》(征求意見稿)相關(guān)要求,使用AISBench?2.0測(cè)試工具,完成了第五代英特爾至強(qiáng)可擴(kuò)展處理器的A
    的頭像 發(fā)表于 09-06 15:33 ?139次閱讀
    開箱即用,AISBench測(cè)試展示<b class='flag-5'>英特爾</b>至強(qiáng)<b class='flag-5'>處理器</b>的卓越<b class='flag-5'>推理</b>性能

    浪潮信息元腦?服務(wù)率先支持英特爾?至強(qiáng)?6處理器

    北京2024年6月7日?/美通社/ -- 6月6日,英特爾在全球范圍內(nèi)發(fā)布英特爾?至強(qiáng)?6處理器,浪潮信息服務(wù)產(chǎn)品線總經(jīng)理趙帥受邀參會(huì)并
    的頭像 發(fā)表于 06-07 15:36 ?237次閱讀
    浪潮信息元腦?服務(wù)<b class='flag-5'>器</b>率先支持<b class='flag-5'>英特爾</b>?至強(qiáng)?6<b class='flag-5'>處理器</b>

    英特爾發(fā)布新一代Lunar Lake處理器

    在近期舉辦的中國(guó)臺(tái)北國(guó)際電腦展(Computex)上,英特爾CEO蓋爾辛格向全球展示了其最新的技術(shù)成果。他發(fā)布了第六代至強(qiáng)處理器,并重點(diǎn)強(qiáng)調(diào)了Gau
    的頭像 發(fā)表于 06-05 11:23 ?786次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?382次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU<b class='flag-5'>加速</b>AI<b class='flag-5'>推理</b>,以大<b class='flag-5'>模型</b>構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾酷睿Ultra處理器突破500個(gè)AI模型優(yōu)化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500款A(yù)I模型已得到優(yōu)化運(yùn)行。這款處理器無(wú)疑是
    的頭像 發(fā)表于 05-09 11:18 ?620次閱讀

    英特爾擬推出中國(guó)市場(chǎng)“特供版芯片”Gaudi 3

    英特爾計(jì)劃在中國(guó)市場(chǎng)推出“特供版”Gaudi 3 AI芯片,這一決策主要是基于美國(guó)對(duì)于AI芯片的出口管制政策。
    的頭像 發(fā)表于 04-16 14:48 ?419次閱讀

    Intel Vision 2024大會(huì): 英特爾發(fā)布全新軟硬件平臺(tái),全速助力企業(yè)推進(jìn)AI創(chuàng)新

    的下一代英特爾?至強(qiáng)?6處理器的全新品牌。 ?推出英特爾?Gaudi 3 AI加速器,其推理能力
    的頭像 發(fā)表于 04-12 14:52 ?382次閱讀
    Intel Vision 2024大會(huì): <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>全新軟硬件平臺(tái),全速助力企業(yè)推進(jìn)AI創(chuàng)新

    英特爾進(jìn)軍AI芯片市場(chǎng):推出Gaudi 3 AI加速卡與Xeon 6處理器

    Gaudi 3作為英特爾在AI領(lǐng)域的最新力作,旨在與英偉達(dá)等市場(chǎng)領(lǐng)導(dǎo)者展開競(jìng)爭(zhēng)。據(jù)英特爾透露,這款芯片在能效和AI模型運(yùn)行速度方面均表現(xiàn)出色
    的頭像 發(fā)表于 04-10 15:37 ?670次閱讀

    英特爾發(fā)布人工智能芯片新版,對(duì)標(biāo)Nvidia

    為應(yīng)對(duì)AI行業(yè)對(duì)高性能芯片的巨大需求,英特爾推出了全新Gaudi 3芯片,據(jù)稱這一款芯片在訓(xùn)練大語(yǔ)言模型方面的速度較之NVIDIA最新H100處理器
    的頭像 發(fā)表于 04-10 09:26 ?270次閱讀

    蘋果M3芯片和英特爾酷睿i9處理器哪個(gè)強(qiáng)

    蘋果M3芯片和英特爾酷睿i9處理器各有其優(yōu)勢(shì),難以簡(jiǎn)單地說哪個(gè)更強(qiáng)。
    的頭像 發(fā)表于 03-08 15:29 ?5903次閱讀

    英特爾酷睿14代處理器系列發(fā)布,Arrowlake/LunarLake24年問世

    處理器英特爾
    looger123
    發(fā)布于 :2024年01月10日 17:44:38

    英特爾Gaudi2C處理器或?yàn)?b class='flag-5'>Gaudi2的簡(jiǎn)化版,Gaudi3預(yù)計(jì)2024年面世

    對(duì)于Gaudi2C和Gaudi2之間的差別,有推測(cè)認(rèn)為它可能是“部分”改動(dòng)后的產(chǎn)品,針對(duì)中國(guó)市場(chǎng)專門定制。Tomshardware則猜測(cè)可能是Gaudi2的簡(jiǎn)化版。
    的頭像 發(fā)表于 12-20 13:44 ?987次閱讀

    英特爾Gaudi 3系列AI加速器明年上市

    英特爾總裁帕特·基辛格(Pat Gelsinger)認(rèn)為,鑒于英特爾Gaudi3具備的持續(xù)加強(qiáng)的性能優(yōu)勢(shì)和極具競(jìng)爭(zhēng)性的TCO及定價(jià)機(jī)制,預(yù)測(cè)該產(chǎn)品有望在2024年憑借領(lǐng)先的AI加速器
    的頭像 發(fā)表于 12-15 11:07 ?678次閱讀

    英特爾處理器,掀AI PC戰(zhàn)火

    隨著ai時(shí)代的到來,英特爾正在構(gòu)想新的酷睿Ultra處理器(代號(hào)Meteor Lake),這是英特爾的第一個(gè)基于npu的處理器,旨在在pc上應(yīng)用ai
    的頭像 發(fā)表于 12-11 11:26 ?816次閱讀

    今日看點(diǎn)丨傳英特爾將推Gaudi2降規(guī)版搶攻中國(guó)大陸市場(chǎng);搭載自研電競(jìng)芯片,iQOO 12系列發(fā)布

    1. 美國(guó)升級(jí)AI 芯片禁令,傳英特爾將推Gaudi2 降規(guī)版搶攻中國(guó)大陸市場(chǎng) ? 美國(guó)加強(qiáng)對(duì)華人工智能(AI)芯片管制,英特爾率先應(yīng)變提出
    發(fā)表于 11-08 11:35 ?618次閱讀
    今日看點(diǎn)丨傳<b class='flag-5'>英特爾</b>將推<b class='flag-5'>Gaudi2</b>降規(guī)版搶攻<b class='flag-5'>中國(guó)</b>大陸<b class='flag-5'>市場(chǎng)</b>;搭載自研電競(jìng)芯片,iQOO 12系列<b class='flag-5'>發(fā)布</b>